XML是一种常用的数据交换格式,在很多系统中用于存储配置信息、传输结构化数据,实际开发中经常需要借助Python对XML文件的内容进行修改,比如调整节点文本、修改节点属性、新增或删除节点等。

使用xml.etree.ElementTree修改XML
xml.etree.ElementTree是Python标准库自带的XML处理模块,无需额外安装,适合处理简单的XML修改需求。下面是修改XML内容的常见操作步骤。
读取并解析XML文件
首先需要通过ElementTree的parse方法读取XML文件,获取根节点后再进行后续操作。
import xml.etree.ElementTree as ET
# 解析XML文件
tree = ET.parse('test.xml')
# 获取根节点
root = tree.getroot()
修改节点文本内容
可以通过遍历节点或者直接定位节点,修改其text属性来调整节点的文本内容。
# 假设XML结构为<root><user><name>张三</name></user></root>
# 查找name节点并修改内容
for name_node in root.iter('name'):
name_node.text = '李四'
# 保存修改后的XML
tree.write('test_modified.xml', encoding='utf-8', xml_declaration=True)
修改节点属性
节点的属性存储在节点的attrib字典中,直接修改该字典的对应键值即可调整节点属性。
# 假设XML结构为<root><user id="1">张三</user></root>
# 查找user节点并修改id属性
for user_node in root.findall('user'):
user_node.attrib['id'] = '2'
# 新增属性
user_node.attrib['age'] = '20'
tree.write('test_modified.xml', encoding='utf-8', xml_declaration=True)
新增和删除节点
可以使用Element的append方法新增子节点,使用remove方法删除节点。
# 新增节点
new_node = ET.Element('email')
new_node.text = 'test@ipipp.com'
root.find('user').append(new_node)
# 删除节点,假设要删除user下的phone节点
user_node = root.find('user')
for phone_node in user_node.findall('phone'):
user_node.remove(phone_node)
tree.write('test_modified.xml', encoding='utf-8', xml_declaration=True)
使用lxml库修改XML
lxml是一个功能更强大的第三方XML处理库,支持XPath语法,处理复杂XML结构时更便捷,首先需要安装lxml库:pip install lxml。
使用XPath定位节点并修改
lxml支持XPath语法,可以快速定位到目标节点,提升修改效率。
from lxml import etree
# 解析XML文件
tree = etree.parse('test.xml')
root = tree.getroot()
# 使用XPath查找所有user节点下的name节点,修改内容
name_nodes = root.xpath('//user/name')
for node in name_nodes:
node.text = '王五'
# 保存修改
tree.write('test_lxml_modified.xml', encoding='utf-8', xml_declaration=True)
处理XML命名空间
如果XML带有命名空间,lxml可以更方便地适配相关场景,避免解析错误。
from lxml import etree
# 带命名空间的XML示例
xml_content = '''<root xmlns:ns="http://www.ipipp.com/ns">
<ns:user>
<ns:name>张三</ns:name>
</ns:user>
</root>'''
root = etree.fromstring(xml_content.encode('utf-8'))
# 定义命名空间映射
ns_map = {'ns': 'http://www.ipipp.com/ns'}
# 使用带命名空间的XPath查找节点
name_node = root.xpath('//ns:user/ns:name', namespaces=ns_map)[0]
name_node.text = '赵六'
# 输出修改后的XML
print(etree.tostring(root, encoding='utf-8', xml_declaration=True).decode('utf-8'))
注意事项
- 修改XML后保存时,建议指定encoding为utf-8,同时添加xml_declaration参数,避免中文乱码问题。
- 如果XML文件结构复杂,优先选择lxml库配合XPath语法,可以减少大量的节点遍历代码。
- 修改前建议先备份原XML文件,避免修改错误导致文件内容丢失。
- 处理不可信的XML内容时,需要注意XML解析的安全问题,避免XXE漏洞,标准库的ElementTree默认会禁用外部实体,lxml需要手动设置相关安全参数。
XMLPythonlxmlElementTreeXML修改修改时间:2026-06-29 16:51:33