Java XPath API是Java标准库中用于处理XML文档查询的工具集,其中XPathExpression是预编译后的XPath表达式对象,适合需要重复执行相同XPath查询的场景,能有效减少表达式重复解析的开销。在实际开发中,我们经常会遇到需要从复杂XML文档中提取特定节点、属性或者文本内容的需求,使用XPathExpression可以大幅简化查询逻辑,提升开发效率。
Java XPath API核心组件介绍
使用XPathExpression前需要先了解几个核心类:
- XPathFactory:用于创建XPath对象的工厂类,是获取XPath实例的入口。
- XPath:提供编译XPath表达式、执行查询的方法,是XPath操作的核心入口。
- XPathExpression:预编译的XPath表达式对象,编译后可以直接重复执行,避免重复解析表达式。
- Node:XML节点对象,是XPath查询返回的常见结果类型之一。
XPathExpression使用完整流程
1. 准备XML测试文档
首先准备一个用于测试的XML文件,内容如下:
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book category="编程">
<title lang="zh">Java核心技术</title>
<author>张三</author>
<price>89.9</price>
</book>
<book category="文学">
<title lang="zh">平凡的世界</title>
<author>路遥</author>
<price>55.0</price>
</book>
</bookstore>
2. 创建XPathFactory和XPath对象
首先需要获取XPathFactory实例,再通过工厂创建XPath对象,代码如下:
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathFactory;
public class XPathDemo {
public static void main(String[] args) throws Exception {
// 创建XPathFactory实例
XPathFactory xPathFactory = XPathFactory.newInstance();
// 通过工厂创建XPath对象
XPath xPath = xPathFactory.newXPath();
}
}
3. 编译XPath表达式得到XPathExpression
使用XPath对象的compile方法可以将XPath字符串编译为XPathExpression对象,示例如下:
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathExpression;
import javax.xml.xpath.XPathFactory;
public class XPathDemo {
public static void main(String[] args) throws Exception {
XPathFactory xPathFactory = XPathFactory.newInstance();
XPath xPath = xPathFactory.newXPath();
// 编译XPath表达式,查询所有分类为编程的书籍标题
XPathExpression expression = xPath.compile("/bookstore/book[@category='编程']/title/text()");
}
}
4. 执行XPathExpression查询
XPathExpression的evaluate方法用于执行查询,该方法需要传入XML文档的根节点和返回类型,常见的返回类型定义在XPathConstants类中:
| 常量名 | 对应返回类型 | 说明 |
|---|---|---|
| NODE | Node | 返回匹配的第一个节点 |
| NODESET | NodeList | 返回所有匹配的节点集合 |
| STRING | String | 返回匹配节点的文本内容 |
| NUMBER | Double | 返回数值类型结果 |
| BOOLEAN | Boolean | 返回布尔类型结果 |
完整的执行示例如下,首先需要将XML文档解析为DOM树:
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpression;
import javax.xml.xpath.XPathFactory;
public class XPathDemo {
public static void main(String[] args) throws Exception {
// 解析XML文档得到DOM树
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document doc = db.parse("bookstore.xml");
// 创建XPath相关对象
XPathFactory xPathFactory = XPathFactory.newInstance();
XPath xPath = xPathFactory.newXPath();
// 编译XPath表达式,查询所有书籍的标题
XPathExpression expression = xPath.compile("/bookstore/book/title/text()");
// 执行查询,返回所有匹配的节点集合
NodeList nodeList = (NodeList) expression.evaluate(doc, XPathConstants.NODESET);
// 遍历输出结果
for (int i = 0; i < nodeList.getLength(); i++) {
System.out.println("书籍标题:" + nodeList.item(i).getNodeValue());
}
}
}
5. 不同返回类型的处理示例
如果只需要查询单个节点,可以使用NODE返回类型:
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpression;
import javax.xml.xpath.XPathFactory;
public class XPathDemo {
public static void main(String[] args) throws Exception {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document doc = db.parse("bookstore.xml");
XPathFactory xPathFactory = XPathFactory.newInstance();
XPath xPath = xPathFactory.newXPath();
// 编译查询第一个书籍价格的XPath表达式
XPathExpression expression = xPath.compile("/bookstore/book[1]/price/text()");
// 执行查询,返回单个节点
Node priceNode = (Node) expression.evaluate(doc, XPathConstants.NODE);
System.out.println("第一本书价格:" + priceNode.getNodeValue());
}
}
如果需要返回字符串类型结果,可以直接指定返回类型为STRING:
import org.w3c.dom.Document;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpression;
import javax.xml.xpath.XPathFactory;
public class XPathDemo {
public static void main(String[] args) throws Exception {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document doc = db.parse("bookstore.xml");
XPathFactory xPathFactory = XPathFactory.newInstance();
XPath xPath = xPathFactory.newXPath();
XPathExpression expression = xPath.compile("/bookstore/book[2]/author/text()");
// 直接返回字符串类型结果
String author = (String) expression.evaluate(doc, XPathConstants.STRING);
System.out.println("第二本书作者:" + author);
}
}
使用注意事项
- XPathExpression是线程安全的,编译完成后可以在多线程环境下重复使用,不需要每次查询都重新编译表达式。
- 编译XPath表达式时如果表达式语法错误,会抛出
XPathExpressionException,需要做好异常处理。 - 执行
evaluate方法时如果返回类型和实际结果不匹配,会抛出类型转换异常,需要根据XPath表达式的预期结果选择合适的返回类型。 - 如果XML文档结构复杂,建议提前验证XPath表达式的正确性,避免查询返回空结果。
总结
Java XPath API中的XPathExpression是处理重复XML查询的高效工具,整体使用流程分为创建XPathFactory、获取XPath对象、编译表达式、执行查询四个步骤。通过合理选择返回类型,可以灵活处理不同的查询结果需求。在实际开发中,对于需要多次执行相同XPath查询的场景,优先使用XPathExpression能有效提升程序执行效率,减少不必要的表达式解析开销。
Java_XPath_APIXPathExpressionXML解析DOM解析修改时间:2026-07-04 22:57:41