如何将带多级列头的 Pandas DataFrame 重塑为规整的长格式结构

来源：前端技术作者：北京SEO公司头衔：草根站长

导读：本期聚焦于小伙伴创作的《如何将带多级列头的 Pandas DataFrame 重塑为规整的长格式结构》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《如何将带多级列头的 Pandas DataFrame 重塑为规整的长格式结构》有用，将其分享出去将是对创作者最好的鼓励。

多级列头DataFrame的结构特点

带多级列头的DataFrame指的是列索引为MultiIndex类型的数据结构，列名分为多个层级，比如第一层是年份，第二层是季度，第三层是指标名称。这种结构虽然展示数据更直观，但在做数据筛选、分组聚合或者建模时，多层列名会增加操作复杂度，因此长格式是更通用的选择。

核心重塑思路

重塑的核心步骤分为两步，第一步是将多级列头转换为普通的列，让每一层列名都成为独立的列值；第二步是使用Pandas的melt方法将宽格式转换为长格式，把不同层级的列名映射到对应的标识列中。

第一步：重置列索引

首先需要将MultiIndex类型的列转换为普通列，使用reset_index方法配合col_level参数，或者直接对列进行重置操作，把多层列名展开为行数据的一部分。

第二步：使用melt转换格式

melt方法可以将DataFrame从宽格式转换为长格式，需要指定哪些列作为标识变量，哪些列作为值变量，同时可以给变量列和值列指定清晰的名称。

完整代码示例

下面通过一个具体的示例演示整个过程，首先创建一个带三级列头的DataFrame，然后逐步完成重塑。

import pandas as pd
import numpy as np

# 创建多级列头DataFrame
years = [2020, 2021]
quarters = ['Q1', 'Q2']
metrics = ['销量', '利润']
# 构建三级列MultiIndex
columns = pd.MultiIndex.from_product([years, quarters, metrics], names=['年份', '季度', '指标'])
# 生成随机数据
data = np.random.randint(100, 1000, size=(3, len(columns)))
df = pd.DataFrame(data, columns=columns, index=['产品A', '产品B', '产品C'])
print("原始多级列头DataFrame：")
print(df)

# 第一步：将多级列头转换为行
# 对列进行重置，把多层列名变成普通列
df_reset = df.copy()
df_reset.columns = df_reset.columns.map(lambda x: '_'.join(map(str, x)))
print("n列名展开后的DataFrame：")
print(df_reset)

# 第二步：使用melt转换为长格式
# 先重置索引，把产品列变成普通列
df_with_product = df_reset.reset_index().rename(columns={'index': '产品'})
# 使用melt转换
df_long = pd.melt(
    df_with_product,
    id_vars=['产品'],
    value_vars=df_reset.columns,
    var_name='组合列名',
    value_name='数值'
)
# 拆分组合列名为三个独立列
df_long[['年份', '季度', '指标']] = df_long['组合列名'].str.split('_', expand=True)
# 删除临时组合列
df_long = df_long.drop(columns=['组合列名'])
# 调整列顺序
df_long = df_long[['产品', '年份', '季度', '指标', '数值']]
print("n重塑后的长格式DataFrame：")
print(df_long)

注意事项

如果多级列头的层级名称有缺失，需要在构建MultiIndex时提前补全，避免后续拆分列名时出现错误。
使用melt方法时，id_vars需要包含所有不需要转换的标识列，包括原DataFrame的索引列。
拆分组合列名时，要根据实际列名的分隔符调整split方法的参数，确保每一层列名都能正确拆分。

总结

带多级列头的DataFrame重塑为长格式结构，核心是先处理多层列索引，再使用melt方法完成格式转换。整个过程不需要复杂的自定义逻辑，仅使用Pandas的内置方法就能实现，熟练掌握后可以快速处理各类复杂的表头结构数据，提升数据处理的效率。

Pandas DataFrame melt pivot 多级列头修改时间：2026-06-20 21:06:26

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。