在数据处理的实际工作中,将同一分组下的一列多行数据合并为单条记录是高频需求,常见于数据汇总、报表生成等场景,不同数据处理工具的实现逻辑各有不同。

SQL中实现列多行合并为一条
SQL中不同数据库提供了对应的聚合函数来实现该功能,最常用的就是GROUP_CONCAT函数,不过需要注意不同数据库的语法差异。
MySQL示例
MySQL原生支持GROUP_CONCAT函数,可以直接对分组后的列进行合并,默认使用逗号分隔合并后的内容。
-- 假设存在表user_hobby,字段为用户id和爱好hobby,需要将同一用户的所有爱好合并为一条
SELECT
user_id,
GROUP_CONCAT(hobby) AS all_hobbies
FROM user_hobby
GROUP BY user_id;
PostgreSQL示例
PostgreSQL没有GROUP_CONCAT函数,需要使用STRING_AGG函数来实现相同效果,需要显式指定分隔符。
SELECT
user_id,
STRING_AGG(hobby, ',') AS all_hobbies
FROM user_hobby
GROUP BY user_id;
Python pandas实现列多行合并
使用Python的pandas库处理数据时,可以通过groupby结合agg方法实现合并,灵活性更高,还可以自定义分隔符和合并逻辑。
import pandas as pd
# 构造示例数据
data = {
'user_id': [1, 1, 2, 2, 2],
'hobby': ['篮球', '足球', '阅读', '绘画', '音乐']
}
df = pd.DataFrame(data)
# 按user_id分组,合并hobby列,使用顿号分隔
result = df.groupby('user_id')['hobby'].agg(lambda x: '、'.join(x)).reset_index()
print(result)
Excel中实现列多行合并
Excel中不需要编写代码,通过内置功能和简单公式即可完成合并,适合非编程人员快速操作。
方法一:使用TEXTJOIN函数
Excel 2019及以上版本支持TEXTJOIN函数,语法为TEXTJOIN(分隔符, 是否忽略空值, 要合并的区域)。
假设A列是用户id,B列是爱好,C2单元格输入以下公式,向下填充即可得到合并结果:
=TEXTJOIN("、", TRUE, IF($A$2:$A$6=A2, $B$2:$B$6, ""))
注意输入公式后需要按Ctrl+Shift+Enter组合键执行数组计算。
方法二:使用Power Query
选中数据区域,点击数据选项卡中的从表格,进入Power Query编辑器,按用户id分组,对爱好列选择合并列,设置分隔符即可完成操作。
注意事项
- 合并前需要确认分组字段的准确性,避免分组错误导致合并结果不符合预期。
- 如果合并的字段存在空值,需要根据需求决定是否保留空值,SQL和pandas都可以通过过滤空值后再合并来避免空值干扰。
- 合并后的字段长度如果超出字段限制,需要提前调整存储字段的类型,避免数据截断。
数据合并SQL_Group_ConcatPython_pandasExcel_合并数据处理修改时间:2026-06-21 06:27:15