在Python开发中,XML作为一种通用的数据交换格式,常被用于存储结构化数据。Python标准库提供了多个处理XML的模块,其中minidom和ElementTree是最常用的两个,能够满足不同场景下的XML文件创建和写入需求。

使用minidom创建XML文件
minidom是Python标准库中基于DOM(文档对象模型)的XML处理模块,适合创建结构简单的XML文件,操作方式直观,符合DOM的节点操作逻辑。
基本创建流程
使用minidom创建XML文件的核心步骤包括:创建文档对象、创建根节点、添加子节点、设置节点内容和属性、生成XML字符串并写入文件。
以下是一个创建学生信息XML文件的完整示例:
import xml.dom.minidom as minidom
# 创建空白DOM文档
doc = minidom.Document()
# 创建根节点students
root = doc.createElement("students")
doc.appendChild(root)
# 创建第一个student子节点
student1 = doc.createElement("student")
student1.setAttribute("id", "1") # 设置id属性
root.appendChild(student1)
# 创建name子节点并添加内容
name1 = doc.createElement("name")
name1.appendChild(doc.createTextNode("张三"))
student1.appendChild(name1)
# 创建age子节点并添加内容
age1 = doc.createElement("age")
age1.appendChild(doc.createTextNode("20"))
student1.appendChild(age1)
# 创建第二个student子节点
student2 = doc.createElement("student")
student2.setAttribute("id", "2")
root.appendChild(student2)
# 创建name子节点并添加内容
name2 = doc.createElement("name")
name2.appendChild(doc.createTextNode("李四"))
student2.appendChild(name2)
# 创建age子节点并添加内容
age2 = doc.createElement("age")
age2.appendChild(doc.createTextNode("22"))
student2.appendChild(age2)
# 生成格式化的XML字符串
xml_str = doc.toprettyxml(indent=" ", encoding="utf-8")
# 写入文件
with open("students.xml", "wb") as f:
f.write(xml_str)
print("XML文件创建成功")
代码说明
上述代码中,首先通过minidom.Document()创建文档对象,然后使用createElement方法创建节点,setAttribute方法设置节点属性,createTextNode创建文本节点。最后通过toprettyxml方法生成带缩进的格式化XML字符串,避免生成的XML内容挤在一起,方便阅读。
使用ElementTree创建XML文件
ElementTree是Python标准库中更轻量、更高效的XML处理模块,API设计更简洁,适合处理结构复杂或者数据量较大的XML文件,也是官方推荐的XML处理方式。
基本创建流程
使用ElementTree创建XML文件的核心步骤包括:创建根元素、构建子元素树、设置元素属性和文本、生成XML内容并写入文件。
以下是同样创建学生信息XML文件的ElementTree实现示例:
import xml.etree.ElementTree as ET
# 创建根元素
root = ET.Element("students")
# 创建第一个student子元素
student1 = ET.SubElement(root, "student")
student1.set("id", "1") # 设置id属性
# 创建name子元素并添加文本
name1 = ET.SubElement(student1, "name")
name1.text = "张三"
# 创建age子元素并添加文本
age1 = ET.SubElement(student1, "age")
age1.text = "20"
# 创建第二个student子元素
student2 = ET.SubElement(root, "student")
student2.set("id", "2")
# 创建name子元素并添加文本
name2 = ET.SubElement(student2, "name")
name2.text = "李四"
# 创建age子元素并添加文本
age2 = ET.SubElement(student2, "age")
age2.text = "22"
# 创建ElementTree对象
tree = ET.ElementTree(root)
# 写入文件,设置编码和xml声明
tree.write("students_et.xml", encoding="utf-8", xml_declaration=True)
# 如果需要格式化输出,可以将内容转换为字符串后处理
import xml.dom.minidom
rough_str = ET.tostring(root, encoding="utf-8")
reparsed = xml.dom.minidom.parseString(rough_str)
pretty_str = reparsed.toprettyxml(indent=" ")
with open("students_et_pretty.xml", "w", encoding="utf-8") as f:
f.write(pretty_str)
print("ElementTree XML文件创建成功")
代码说明
上述代码中,ET.Element创建根元素,ET.SubElement直接创建子元素并关联到父元素,通过set方法设置属性,直接给text属性赋值设置元素内容。默认生成的XML没有缩进,如果需要格式化输出,可以结合minidom的toprettyxml方法处理。
两种方法对比
两种创建XML文件的方法各有适用场景,具体对比如下:
| 对比项 | minidom | ElementTree |
|---|---|---|
| API复杂度 | 较高,需要操作文档对象和多个节点方法 | 较低,元素操作更直观 |
| 执行效率 | 较低,DOM模型需要加载整个文档到内存 | 较高,轻量级设计 |
| 格式化输出 | 原生支持toprettyxml生成格式化内容 | 原生不支持,需要额外处理 |
| 适用场景 | 简单的XML创建,需要快速生成可读格式的场景 | 复杂的XML处理,大数据量场景,追求高效开发的场景 |
注意事项
- 写入XML文件时,建议指定编码为utf-8,避免中文乱码问题。
- 如果XML内容包含特殊字符,比如<、>、&等,需要进行转义,否则会导致XML格式错误。
- ElementTree是Python官方推荐的XML处理模块,新项目优先选择ElementTree。
- 如果需要处理已有的XML文件,两种模块都支持读取和修改操作,流程和创建类似。
PythonXMLminidomElementTree文件写入修改时间:2026-06-17 19:18:25