ElementTree是什么 如何用它在Python中解析XML

来源:前端技术作者:泰国程序员头衔:程序员
导读:本期聚焦于小伙伴创作的《ElementTree是什么 如何用它在Python中解析XML》,敬请观看详情,探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《ElementTree是什么 如何用它在Python中解析XML》有用,将其分享出去将是对创作者最好的鼓励。

ElementTree是Python内置的标准库模块,专门用于处理XML格式的数据,它把XML文档映射成由元素节点组成的树形结构,每个节点对应XML里的一个标签,节点包含标签名、属性、文本内容以及子节点信息,开发者可以通过操作这些节点完成XML的解析、修改、生成等工作。

ElementTree是什么 如何用它在Python中解析XML

ElementTree的核心概念

使用ElementTree前需要先了解几个核心概念:

  • Element:对应XML中的一个标签节点,是树形结构的基本单位,包含tag(标签名)、attrib(属性字典)、text(文本内容)三个核心属性。
  • ElementTree:表示整个XML文档的树形结构对象,包含根节点,提供从文件、字符串加载XML的方法,以及将修改后的树写入文件的能力。
  • 节点遍历:可以通过迭代子节点、查找特定标签的方式访问树中的任意节点。

用ElementTree解析XML的基本步骤

1. 导入模块并加载XML数据

ElementTree是Python标准库的一部分,无需额外安装,直接导入即可使用。加载XML数据有两种常见方式,分别是从文件加载和从字符串加载。

import xml.etree.ElementTree as ET

# 从文件加载XML
tree = ET.parse('test.xml')
root = tree.getroot()

# 从字符串加载XML
xml_str = '<user><name>张三</name><age>25</age></user>'
root = ET.fromstring(xml_str)

2. 遍历和查询节点

加载完成后可以通过多种方式访问节点内容,比如遍历子节点、查找特定标签的节点。

import xml.etree.ElementTree as ET

xml_data = '''
<class>
    <student id="1">
        <name>李四</name>
        <score>90</score>
    </student>
    <student id="2">
        <name>王五</name>
        <score>85</score>
    </student>
</class>
'''
root = ET.fromstring(xml_data)

# 遍历根节点的所有子节点
print("根节点标签:", root.tag)
for child in root:
    print("子节点标签:", child.tag)
    print("子节点属性:", child.attrib)
    # 获取子节点下的name和score内容
    name = child.find('name').text
    score = child.find('score').text
    print(f"姓名:{name},分数:{score}")

3. 修改XML内容并保存

如果需要修改XML节点的内容或者属性,可以直接对Element对象的属性赋值,修改完成后通过ElementTree对象的write方法保存到文件。

import xml.etree.ElementTree as ET

# 加载要修改的XML文件
tree = ET.parse('student.xml')
root = tree.getroot()

# 修改第一个学生的分数
first_student = root.find('student')
first_student.find('score').text = '95'
# 新增一个属性
first_student.set('update', 'true')

# 保存修改后的内容到新文件
tree.write('new_student.xml', encoding='utf-8', xml_declaration=True)

4. 使用XPath语法查找节点

ElementTree支持简单的XPath语法,可以更灵活地查找节点,比如查找所有符合条件的节点、按属性筛选节点。

import xml.etree.ElementTree as ET

xml_data = '''
<bookstore>
    <book category="编程">
        <title>Python入门</title>
        <price>59</price>
    </book>
    <book category="文学">
        <title>散文精选</title>
        <price>39</price>
    </book>
</bookstore>
'''
root = ET.fromstring(xml_data)

# 查找所有book节点
all_books = root.findall('book')
print(f"总共有{len(all_books)}本书")

# 查找category为编程的book节点
programming_books = root.findall("book[@category='编程']")
for book in programming_books:
    title = book.find('title').text
    price = book.find('price').text
    print(f"编程类书籍:{title},价格:{price}")

注意事项

  • 如果XML中包含命名空间,处理时需要在标签名前加上命名空间前缀,避免查找不到节点。
  • 使用write方法保存文件时,建议指定encoding='utf-8',防止中文内容乱码。
  • 对于非常大的XML文件,可以使用iterparse方法逐段解析,避免一次性加载整个文档占用过多内存。

ElementTreePythonXML解析XML操作修改时间:2026-06-16 20:33:31

免责声明:​ 已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰,观点力求客观中立。本站旨在免费分享,内容仅供个人学习、研究或参考使用。若引用了第三方作品,版权归原作者所有。如内容涉及您的权益,请联系我们处理。
内容垂直聚焦
专注技术核心技术栏目,确保每篇文章深度聚焦于实用技能。从代码技巧到架构设计,为用户提供无干扰的纯技术知识沉淀,精准满足专业提升需求。
知识结构清晰
覆盖从开发到部署的全链路。AI、前端、编程、数据库、服务器、建站、系统层层递进,构建清晰学习路径,帮助用户系统化掌握开发与运维所需的核心技术。
深度技术解析
拒绝泛泛而谈,深入技术细节与实践难点。无论是数据库优化还是服务器配置,均结合真实场景与代码示例进行剖析,致力于提供可直接应用于工作的解决方案。
专业领域覆盖
精准对应开发生命周期。从前端界面到后端编程,从数据库操作到服务器运维,形成完整闭环,一站式满足全栈工程师和运维人员的技术需求。
即学即用高效
内容强调实操性,步骤清晰、代码完整。用户可根据教程直接复现和应用于自身项目,显著缩短从学习到实践的距离,快速解决开发中的具体问题。
持续更新保障
专注既定技术方向进行长期、稳定的内容输出。确保各栏目技术文章持续更新迭代,紧跟主流技术发展趋势,为用户提供经久不衰的学习价值。