XML数组对象通常是指在XML文档中,存在多个同名的子元素,这些子元素共同构成一个数组结构,在数据传输和配置存储场景中非常常见。比如一个存储用户列表的XML,可能包含多个user子元素,每个user元素都有相同的子节点结构,这就是典型的XML数组对象。

XML数组对象的常见结构
我们先来看一个典型的包含数组对象的XML示例,方便后续解析演示:
<?xml version="1.0" encoding="UTF-8"?>
<user_list>
<user>
<id>1</id>
<name>张三</name>
<age>25</age>
</user>
<user>
<id>2</id>
<name>李四</name>
<age>28</age>
</user>
<user>
<id>3</id>
<name>王五</name>
<age>22</age>
</user>
</user_list>
上面的XML中,user_list根节点下有三个同名的user子元素,这三个user元素就构成了一个用户数组对象,每个user都有相同的id、name、age子节点。
使用DOM解析XML数组对象
DOM解析是将整个XML文档加载到内存中,形成一棵DOM树,然后通过节点遍历的方式获取需要的数据,适合处理小型XML文件。
Java实现DOM解析示例
首先我们需要导入相关的DOM解析依赖,Java内置了DOM解析的相关类,不需要额外引入依赖:
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;
import java.io.File;
public class DomXmlParser {
public static void main(String[] args) {
try {
// 创建DocumentBuilderFactory实例
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 创建DocumentBuilder实例
DocumentBuilder builder = factory.newDocumentBuilder();
// 解析XML文件,得到Document对象
Document document = builder.parse(new File("user_list.xml"));
// 获取所有user节点,这就是我们的数组对象
NodeList userNodes = document.getElementsByTagName("user");
// 遍历user节点数组
for (int i = 0; i < userNodes.getLength(); i++) {
Node userNode = userNodes.item(i);
if (userNode.getNodeType() == Node.ELEMENT_NODE) {
Element userElement = (Element) userNode;
// 获取id子节点内容
String id = userElement.getElementsByTagName("id").item(0).getTextContent();
// 获取name子节点内容
String name = userElement.getElementsByTagName("name").item(0).getTextContent();
// 获取age子节点内容
String age = userElement.getElementsByTagName("age").item(0).getTextContent();
System.out.println("用户" + (i + 1) + ":id=" + id + ",姓名=" + name + ",年龄=" + age);
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
上面的代码中,我们通过getElementsByTagName("user")获取到所有的user节点,返回的NodeList就是我们需要的数组对象,然后遍历这个列表就可以获取每个数组元素的内容。
使用SAX解析XML数组对象
SAX解析是事件驱动的解析方式,不会将整个XML加载到内存,而是边读边解析,适合处理大型XML文件,内存占用更低。
Java实现SAX解析示例
SAX解析需要自定义事件处理器,重写相关方法处理节点事件:
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
public class SaxXmlParser {
public static void main(String[] args) {
try {
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser saxParser = factory.newSAXParser();
// 自定义处理器
DefaultHandler handler = new DefaultHandler() {
// 当前正在处理的user元素
private Element currentUser = null;
// 当前正在处理的节点名称
private String currentNodeName = null;
// 当前节点的内容
private StringBuilder content = new StringBuilder();
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
currentNodeName = qName;
if ("user".equals(qName)) {
// 遇到user节点,初始化新的user对象
currentUser = new Element();
System.out.println("开始解析第" + (currentUser.getIndex() + 1) + "个用户");
}
content.setLength(0);
}
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
// 收集节点内容
content.append(new String(ch, start, length));
}
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
if ("user".equals(qName)) {
// user节点结束,输出当前user的信息
System.out.println("当前用户id:" + currentUser.getId() + ",姓名:" + currentUser.getName() + ",年龄:" + currentUser.getAge());
} else if ("id".equals(qName) && currentUser != null) {
currentUser.setId(content.toString());
} else if ("name".equals(qName) && currentUser != null) {
currentUser.setName(content.toString());
} else if ("age".equals(qName) && currentUser != null) {
currentUser.setAge(content.toString());
}
currentNodeName = null;
}
};
// 开始解析
saxParser.parse(new File("user_list.xml"), handler);
} catch (Exception e) {
e.printStackTrace();
}
}
// 自定义用户元素类,用于存储解析到的用户数据
static class Element {
private static int count = 0;
private int index;
private String id;
private String name;
private String age;
public Element() {
this.index = count++;
}
public int getIndex() {
return index;
}
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getAge() {
return age;
}
public void setAge(String age) {
this.age = age;
}
}
}
SAX解析通过事件触发的方式,在遇到user节点开始、节点内容、user节点结束时分别触发对应方法,我们可以在事件方法中收集数组元素的数据,完成数组对象的解析。
解析XML数组对象的实用技巧
- 解析前先校验XML格式是否合法,避免解析过程中出现格式错误导致的异常,可以使用XML校验工具提前检查。
- 如果XML数组对象元素数量很多,优先选择SAX解析,减少内存占用,避免内存溢出。
- 遍历数组节点时,先判断节点类型,排除空白文本节点,避免获取到无效数据。
- 如果数组元素的子节点结构可能不固定,需要先判断子节点是否存在,再获取内容,避免空指针异常。
- 可以将解析后的数组对象封装成对应的实体类列表,方便后续业务逻辑使用,提升代码的可维护性。
两种解析方式的对比
我们可以通过下面的表格直观对比DOM和SAX两种解析方式的区别:
| 对比项 | DOM解析 | SAX解析 |
|---|---|---|
| 内存占用 | 高,需要加载整个XML到内存 | 低,边读边解析 |
| 解析速度 | 小文件快,大文件慢 | 大文件快,小文件稍慢 |
| 操作灵活性 | 高,可以随意遍历修改节点 | 低,只能顺序解析 |
| 适用场景 | 小型XML,需要随机访问节点 | 大型XML,只需要顺序读取数据 |
在实际开发中,我们可以根据XML文件的大小和业务需求,选择合适的解析方式来处理XML数组对象。如果是配置文件类的小型XML,DOM解析更简单直观;如果是数据导出类的大型XML,SAX解析是更好的选择。