在企业数据交互、系统对接等场景中,经常需要将Excel存储的表格数据转换为XML格式,方便不同平台识别和处理。XML作为通用的结构化数据格式,能够完整保留数据的层级和属性信息,是很多数据交换场景的首选格式。

一、Excel内置功能手动转换XML
Excel本身提供了XML映射功能,适合少量数据的快速转换,操作步骤如下:
- 打开需要转换的Excel文件,点击顶部菜单栏的
开发工具选项卡,如果没有该选项卡,可以在文件-选项-自定义功能区中勾选开启。 - 点击
XML分组下的源按钮,打开XML源面板,点击面板中的XML映射。 - 在弹出的窗口中点击
添加,选择已经准备好的XML架构文件(如果需要自定义XML结构,可以先编写好XSD架构),点击确定完成映射添加。 - 将XML源面板中的字段拖拽到Excel表格对应的列上方,建立字段和表格列的映射关系。
- 点击
开发工具下的导出按钮,选择保存路径,设置文件名为data.xml,即可完成转换。
如果没有提前准备XML架构,也可以先将Excel另存为XML数据格式,Excel会自动生成基础的XML结构,不过这种方式生成的XML层级比较简单,适合对结构要求不高的场景。
二、Python代码批量转换Excel为XML
如果需要处理大量Excel文件,或者需要自定义复杂的XML结构,使用Python代码实现会更高效。首先需要安装依赖库:
# 安装依赖库 # pip install pandas openpyxl xmltodict
以下是读取Excel数据并生成自定义XML的示例代码:
import pandas as pd
import xmltodict
from xml.dom import minidom
def excel_to_xml(excel_path, xml_path):
# 读取Excel数据,默认读取第一个工作表
df = pd.read_excel(excel_path, dtype=str)
# 将DataFrame转换为字典结构,方便后续生成XML
data_dict = {
"root": {
"record": []
}
}
# 遍历每一行数据,生成每条记录
for index, row in df.iterrows():
record = {}
for col in df.columns:
# 列名作为XML的节点名,单元格值作为节点内容
record[col] = row[col]
data_dict["root"]["record"].append(record)
# 将字典转换为XML字符串
xml_str = xmltodict.unparse(data_dict, pretty=True)
# 格式化XML字符串,增加缩进
dom = minidom.parseString(xml_str)
pretty_xml = dom.toprettyxml(indent=" ")
# 去除多余的空行
pretty_xml = "n".join([line for line in pretty_xml.split("n") if line.strip()])
# 写入XML文件
with open(xml_path, "w", encoding="utf-8") as f:
f.write(pretty_xml)
print(f"转换完成,文件保存至{xml_path}")
# 调用函数,传入Excel路径和输出XML路径
excel_to_xml("test.xlsx", "output.xml")
上述代码会将Excel的每一行数据作为一个record节点,列名作为子节点名称,生成的XML结构清晰,方便后续解析使用。
三、VBA脚本实现Excel内转换
如果不想离开Excel环境,也可以使用VBA脚本实现转换,适合只使用Office办公软件的用户。按下Alt+F11打开VBA编辑器,插入模块,粘贴以下代码:
Sub ExcelToXML()
Dim ws As Worksheet
Dim lastRow As Long, lastCol As Long
Dim xmlDoc As Object
Dim rootNode As Object, recordNode As Object, fieldNode As Object
Dim i As Long, j As Long
Dim xmlPath As String
' 设置要转换的工作表,这里使用当前活动工作表
Set ws = ActiveSheet
' 获取数据的最后一行和最后一列
lastRow = ws.Cells(ws.Rows.Count, 1).End(xlUp).Row
lastCol = ws.Cells(1, ws.Columns.Count).End(xlToLeft).Column
' 创建XML文档对象
Set xmlDoc = CreateObject("MSXML2.DOMDocument.6.0")
' 创建根节点
Set rootNode = xmlDoc.createElement("root")
xmlDoc.appendChild rootNode
' 遍历数据行,从第二行开始(假设第一行是表头)
For i = 2 To lastRow
' 创建记录节点
Set recordNode = xmlDoc.createElement("record")
rootNode.appendChild recordNode
' 遍历列,生成字段节点
For j = 1 To lastCol
Set fieldNode = xmlDoc.createElement(ws.Cells(1, j).Value)
fieldNode.Text = ws.Cells(i, j).Value
recordNode.appendChild fieldNode
Next j
Next i
' 选择保存路径
xmlPath = Application.GetSaveAsFilename(FileFilter:="XML文件 (*.xml), *.xml")
If xmlPath <> "False" Then
' 保存XML文件
xmlDoc.Save xmlPath
MsgBox "转换完成,文件保存至" & xmlPath
End If
' 释放对象
Set fieldNode = Nothing
Set recordNode = Nothing
Set rootNode = Nothing
Set xmlDoc = Nothing
End Sub
运行该脚本后,会弹出文件保存对话框,选择路径后即可生成对应的XML文件,表头会作为XML的节点名称。
四、转换注意事项
- Excel中的特殊字符比如
<、>、&需要提前处理,否则生成的XML会出现语法错误,代码中可以提前做转义处理。 - 如果Excel中存在合并单元格,转换前最好先取消合并,否则可能读取到空值,影响XML数据的完整性。
- 自定义XML架构时,要确保字段类型和架构定义一致,避免出现数据类型不匹配的问题。
- 批量转换大量文件时,建议先小范围测试,确认XML结构符合要求后再执行全量转换。