XML是一种可扩展标记语言,常用于数据存储和跨平台数据交换,解析XML是开发中常见的操作。目前主流的XML解析方式共有四种,下面我们就来逐一了解。

一、DOM解析方式
DOM(Document Object Model)解析是将整个XML文档加载到内存中,构建成一颗DOM树,之后可以通过节点操作来读取或修改XML内容。
核心特点
- 优点:可以随机访问文档任意节点,支持对文档的增删改操作,使用起来比较直观。
- 缺点:需要将整个文档加载到内存,对于大体积XML文档会占用大量内存,甚至导致内存溢出。
- 适用场景:XML文档体积较小,且需要频繁修改文档内容的场景。
代码示例(Java实现)
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
public class DomParseDemo {
public static void main(String[] args) throws Exception {
// 创建解析器工厂
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
// 解析XML文件,生成DOM树
Document document = builder.parse("test.xml");
// 获取所有book节点
NodeList bookList = document.getElementsByTagName("book");
for (int i = 0; i < bookList.getLength(); i++) {
Node bookNode = bookList.item(i);
System.out.println("节点名称:" + bookNode.getNodeName());
}
}
}二、SAX解析方式
SAX(Simple API for XML)解析是基于事件驱动的流式解析方式,不需要将整个文档加载到内存,而是逐行读取XML内容,遇到不同节点时触发对应的事件回调。
核心特点
- 优点:内存占用极低,解析速度快,适合处理大体积的XML文档。
- 缺点:只能顺序读取文档,无法随机访问节点,也不支持修改文档内容,需要自己实现事件处理逻辑。
- 适用场景:只需要读取XML内容,不需要修改,且文档体积较大的场景。
代码示例(Java实现)
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
public class SaxParseDemo {
public static void main(String[] args) throws Exception {
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();
// 自定义事件处理器
DefaultHandler handler = new DefaultHandler() {
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
System.out.println("遇到开始节点:" + qName);
}
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
System.out.println("遇到结束节点:" + qName);
}
};
// 开始解析
parser.parse("test.xml", handler);
}
}三、StAX解析方式
StAX(Streaming API for XML)解析也是流式解析的一种,和SAX的事件驱动不同,StAX是让程序主动从解析器中拉取事件,控制解析的进度。
核心特点
- 优点:内存占用低,解析速度快,程序可以自主控制解析流程,使用起来比SAX更灵活。
- 缺点:只能顺序读取,不支持随机访问和修改文档内容。
- 适用场景:需要读取大体积XML文档,且希望自主控制解析流程的场景。
代码示例(Java实现)
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamReader;
import java.io.FileInputStream;
public class StaxParseDemo {
public static void main(String[] args) throws Exception {
XMLInputFactory factory = XMLInputFactory.newInstance();
XMLStreamReader reader = factory.createXMLStreamReader(new FileInputStream("test.xml"));
// 循环拉取事件
while (reader.hasNext()) {
int event = reader.next();
if (event == XMLStreamReader.START_ELEMENT) {
System.out.println("开始节点:" + reader.getLocalName());
} else if (event == XMLStreamReader.END_ELEMENT) {
System.out.println("结束节点:" + reader.getLocalName());
}
}
reader.close();
}
}四、JDOM解析方式
JDOM是专门为Java语言设计的XML解析工具,它结合了DOM和SAX的优点,提供了更友好的Java API,底层可以选择使用DOM或者SAX作为解析实现。
核心特点
- 优点:API设计符合Java开发者的使用习惯,比原生DOM解析更简单易用,同时支持DOM和SAX两种解析模式的优点。
- 缺点:仅支持Java语言,性能略低于原生的SAX解析。
- 适用场景:Java项目中需要便捷解析XML,且文档体积中等的场景。
代码示例(Java实现)
import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.input.SAXBuilder;
import java.io.File;
import java.util.List;
public class JdomParseDemo {
public static void main(String[] args) throws Exception {
SAXBuilder builder = new SAXBuilder();
// 解析XML文件得到Document对象
Document document = builder.build(new File("test.xml"));
// 获取根节点
Element root = document.getRootElement();
// 获取所有book子节点
List<Element> bookList = root.getChildren("book");
for (Element book : bookList) {
System.out.println("book节点文本:" + book.getText());
}
}
}四种解析方式对比
| 解析方式 | 内存占用 | 随机访问 | 支持修改 | 适用场景 |
|---|---|---|---|---|
| DOM | 高 | 支持 | 支持 | 小体积XML,需要修改内容 |
| SAX | 低 | 不支持 | 不支持 | 大体积XML,仅读取内容 |
| StAX | 低 | 不支持 | 不支持 | 大体积XML,需控制解析流程 |
| JDOM | 中等 | 支持 | 支持 | Java项目,中等体积XML |