在Java开发过程中,XML作为一种通用的数据交换格式,经常出现在配置文件、接口数据传输等场景中,掌握XML文件的解析方法是Java开发者的必备技能。目前Java生态中有四种主流的XML解析方式,分别适用于不同的业务场景。
四种主流XML解析方法概述
Java解析XML的四种主流方法分别是DOM、SAX、JDOM和StAX,它们的核心差异在于解析模式和对内存的占用情况,具体对比如下:
| 解析方法 | 解析模式 | 内存占用 | 适用场景 |
|---|---|---|---|
| DOM | 树形结构加载 | 较高 | 需要频繁修改XML、小文件解析 |
| SAX | 事件驱动流式解析 | 极低 | 大文件解析、只需要读取数据 |
| JDOM | 基于DOM的封装 | 较高 | 需要简洁API操作XML、小文件处理 |
| StAX | 拉式流式解析 | 较低 | 大文件解析、需要灵活控制解析流程 |
DOM解析XML方法
DOM(Document Object Model)解析会把整个XML文件加载到内存中,构建成一个树形节点结构,开发者可以通过操作节点来读取或修改XML内容。
实现步骤
- 创建DocumentBuilderFactory实例
- 通过工厂获取DocumentBuilder对象
- 调用parse方法加载XML文件得到Document对象
- 通过Document对象获取节点并进行操作
代码示例
假设有如下test.xml文件:
<?xml version="1.0" encoding="UTF-8"?>
<users>
<user id="1">
<name>张三</name>
<age>25</age>
</user>
<user id="2">
<name>李四</name>
<age>30</age>
</user>
</users>
DOM解析代码如下:
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;
public class DOMParseDemo {
public static void main(String[] args) throws Exception {
// 创建解析工厂
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 获取解析器
DocumentBuilder builder = factory.newDocumentBuilder();
// 加载XML文件得到Document对象
Document document = builder.parse(new File("test.xml"));
// 获取所有user节点
NodeList userNodes = document.getElementsByTagName("user");
// 遍历节点
for (int i = 0; i < userNodes.getLength(); i++) {
Element userElement = (Element) userNodes.item(i);
// 获取id属性
String id = userElement.getAttribute("id");
// 获取name子节点内容
String name = userElement.getElementsByTagName("name").item(0).getTextContent();
// 获取age子节点内容
String age = userElement.getElementsByTagName("age").item(0).getTextContent();
System.out.println("用户ID:" + id + ",姓名:" + name + ",年龄:" + age);
}
}
}
SAX解析XML方法
SAX(Simple API for XML)是事件驱动的流式解析方式,解析过程中不会把整个文件加载到内存,而是逐行读取,遇到对应节点时触发回调函数,适合解析大体积XML文件。
实现步骤
- 创建SAXParserFactory实例
- 获取SAXParser对象
- 自定义DefaultHandler子类,重写事件回调方法
- 调用parse方法传入文件和自定义Handler
代码示例
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
public class SAXParseDemo {
public static void main(String[] args) throws Exception {
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();
// 自定义Handler处理解析事件
DefaultHandler handler = new DefaultHandler() {
private String currentTag = null;
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
currentTag = qName;
if ("user".equals(qName)) {
System.out.print("用户ID:" + attributes.getValue("id") + ",");
}
}
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
if ("name".equals(currentTag) || "age".equals(currentTag)) {
String content = new String(ch, start, length);
System.out.print(currentTag + ":" + content + ",");
}
}
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
if ("user".equals(qName)) {
System.out.println();
}
currentTag = null;
}
};
parser.parse(new File("test.xml"), handler);
}
}
JDOM解析XML方法
JDOM是第三方开源库,对DOM解析进行了封装,提供了更简洁的Java原生API,不需要处理复杂的节点类型转换,使用起来更方便。
依赖引入
如果使用Maven项目,需要添加如下依赖:
<dependency>
<groupId>org.jdom</groupId>
<artifactId>jdom2</artifactId>
<version>2.0.6</version>
</dependency>
代码示例
import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.input.SAXBuilder;
import java.io.File;
import java.util.List;
public class JDOMParseDemo {
public static void main(String[] args) throws Exception {
SAXBuilder builder = new SAXBuilder();
// 加载XML文件
Document document = builder.build(new File("test.xml"));
// 获取根节点
Element root = document.getRootElement();
// 获取所有user子节点
List<Element> userElements = root.getChildren("user");
for (Element user : userElements) {
String id = user.getAttributeValue("id");
String name = user.getChildText("name");
String age = user.getChildText("age");
System.out.println("用户ID:" + id + ",姓名:" + name + ",年龄:" + age);
}
}
}
StAX解析XML方法
StAX(Streaming API for XML)是拉式解析模式,开发者可以主动控制解析进度,按需读取节点内容,相比SAX的推式模式更灵活,内存占用也比较低。
代码示例
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamReader;
import java.io.FileInputStream;
public class StAXParseDemo {
public static void main(String[] args) throws Exception {
XMLInputFactory factory = XMLInputFactory.newInstance();
XMLStreamReader reader = factory.createXMLStreamReader(new FileInputStream("test.xml"));
String currentTag = null;
while (reader.hasNext()) {
int event = reader.next();
switch (event) {
case XMLStreamReader.START_ELEMENT:
currentTag = reader.getLocalName();
if ("user".equals(currentTag)) {
System.out.print("用户ID:" + reader.getAttributeValue(0) + ",");
}
break;
case XMLStreamReader.CHARACTERS:
if (!reader.isWhiteSpace()) {
if ("name".equals(currentTag) || "age".equals(currentTag)) {
System.out.print(currentTag + ":" + reader.getText() + ",");
}
}
break;
case XMLStreamReader.END_ELEMENT:
if ("user".equals(reader.getLocalName())) {
System.out.println();
}
currentTag = null;
break;
}
}
reader.close();
}
}
方法选择建议
如果XML文件体积较小,且需要修改XML内容,优先选择DOM或JDOM;如果XML文件体积很大,只需要读取数据,优先选择SAX或StAX;如果需要灵活控制解析流程,StAX是更好的选择。开发者可以根据实际业务场景选择最合适的解析方式。