XPath全称为XML路径语言,是一种用于在XML文档中定位和查询节点的标准语言,通过简洁的路径表达式就能快速定位到目标节点,不需要逐层遍历整个文档结构。它不仅可以查询元素节点,还能获取属性、文本内容等不同类型的XML数据。

XPath基础语法规则
XPath通过路径表达式来定位节点,常见的路径表达式规则如下:
| 表达式 | 说明 |
|---|---|
| nodeName | 选择所有名称为nodeName的子节点 |
| / | 从根节点开始选择 |
| // | 选择文档中所有匹配的节点,不管位置 |
| . | 选择当前节点 |
| .. | 选择当前节点的父节点 |
| @ | 选择属性节点 |
谓语过滤规则
谓语用来筛选符合条件的节点,通常放在方括号[]中,常见的谓语用法如下:
- /bookstore/book[1]:选择bookstore下的第一个book子节点
- /bookstore/book[last()]:选择bookstore下的最后一个book子节点
- /bookstore/book[price>30]:选择bookstore下price子元素值大于30的book节点
- //book[@category='web']:选择所有category属性值为web的book节点
实例演示:查询XML节点
首先准备一个示例XML文档,内容如下:
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book category="web">
<title lang="en">XPath入门教程</title>
<author>张三</author>
<price>45</price>
</book>
<book category="programming">
<title lang="zh">Python编程实战</title>
<author>李四</author>
<price>68</price>
</book>
<book category="web">
<title lang="en">XML高级应用</title>
<author>王五</author>
<price>32</price>
</book>
</bookstore>
示例1:查询所有book节点
使用路径表达式//book可以获取文档中所有的book节点,对应的Python实现代码如下:
import xml.etree.ElementTree as ET
# 解析XML文档
tree = ET.parse('bookstore.xml')
root = tree.getroot()
# 使用XPath查询所有book节点
books = root.findall('.//book')
for book in books:
title = book.find('title').text
print(f'书籍名称:{title}')
示例2:查询category为web的book节点
使用谓语过滤的XPath表达式//book[@category='web'],可以筛选出所有分类为web的书籍,代码如下:
import xml.etree.ElementTree as ET
tree = ET.parse('bookstore.xml')
root = tree.getroot()
# 查询category属性为web的book节点
web_books = root.findall(".//book[@category='web']")
for book in web_books:
title = book.find('title').text
price = book.find('price').text
print(f'web类书籍:{title},价格:{price}')
示例3:查询价格大于40的book节点的作者
使用表达式//book[price>40]/author,可以获取价格超过40的书籍的作者信息,代码如下:
import xml.etree.ElementTree as ET
tree = ET.parse('bookstore.xml')
root = tree.getroot()
# 查询价格大于40的book节点的作者
authors = root.findall(".//book[price>40]/author")
for author in authors:
print(f'高价书籍作者:{author.text}')
常用通配符与运算符
XPath还支持通配符和运算符,方便更灵活的查询:
- *:匹配任意元素节点,比如
//book/*选择book下的所有子元素 - @*:匹配任意属性节点,比如
//title/@*选择title节点的所有属性 - |:合并多个路径结果,比如
//title|//price选择所有title和price节点
掌握这些基础的XPath语法和实例后,就可以应对大部分XML节点查询的场景,在实际开发中可以根据需求组合不同的表达式实现精准查询。