在Android应用开发过程中,XML格式常被用于配置文件、网络接口返回数据、本地数据存储等场景,掌握XML解析技术是开发者的必备技能。目前Android平台支持三种主流的XML解析方式,分别是SAX解析、DOM解析和Pull解析,每种方式都有各自的特点和适用场景。

一、SAX解析技术
SAX(Simple API for XML)是一种基于事件驱动的解析方式,解析器会逐行扫描XML文档,当遇到文档开始、元素开始、元素结束、文本节点等事件时,会回调对应的处理方法。这种解析方式不需要把整个XML文档加载到内存中,内存占用小,适合解析大型XML文件。
SAX解析需要自定义一个继承自DefaultHandler的处理类,重写对应的事件回调方法,核心代码示例如下:
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.InputStream;
// 自定义SAX处理器
class MySaxHandler extends DefaultHandler {
private String currentTag = null;
// 文档开始解析时回调
@Override
public void startDocument() throws SAXException {
super.startDocument();
System.out.println("开始解析XML文档");
}
// 元素开始标签回调
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
super.startElement(uri, localName, qName, attributes);
currentTag = qName;
// 如果有属性,可以获取属性值
if (attributes.getLength() > 0) {
for (int i = 0; i < attributes.getLength(); i++) {
System.out.println("属性名:" + attributes.getQName(i) + ",属性值:" + attributes.getValue(i));
}
}
}
// 元素文本内容回调
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
super.characters(ch, start, length);
if (currentTag != null) {
String content = new String(ch, start, length).trim();
if (!content.isEmpty()) {
System.out.println(currentTag + "的内容:" + content);
}
}
}
// 元素结束标签回调
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
super.endElement(uri, localName, qName);
currentTag = null;
}
// 文档结束解析时回调
@Override
public void endDocument() throws SAXException {
super.endDocument();
System.out.println("XML文档解析完成");
}
}
// SAX解析工具类
class SaxParseUtil {
public static void parseXml(InputStream inputStream) {
try {
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();
parser.parse(inputStream, new MySaxHandler());
} catch (Exception e) {
e.printStackTrace();
}
}
}
二、DOM解析技术
DOM(Document Object Model)解析会把整个XML文档加载到内存中,形成一个树形结构的文档对象模型,开发者可以通过操作节点树来获取、修改XML中的数据。这种方式的优点是操作灵活,可以随机访问任意节点,缺点是内存占用大,不适合解析大型XML文件。
DOM解析的核心代码示例如下:
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.InputStream;
class DomParseUtil {
public static void parseXml(InputStream inputStream) {
try {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
// 解析输入流,得到整个文档对象
Document document = builder.parse(inputStream);
// 获取根元素
Element rootElement = document.getDocumentElement();
System.out.println("根元素名称:" + rootElement.getNodeName());
// 获取所有指定名称的子元素
NodeList nodeList = rootElement.getElementsByTagName("item");
for (int i = 0; i < nodeList.getLength(); i++) {
Node node = nodeList.item(i);
if (node.getNodeType() == Node.ELEMENT_NODE) {
Element element = (Element) node;
// 获取子元素内容
String name = element.getElementsByTagName("name").item(0).getTextContent();
String age = element.getElementsByTagName("age").item(0).getTextContent();
System.out.println("name:" + name + ",age:" + age);
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
三、Pull解析技术
Pull解析是Android内置的XML解析方式,同样基于事件驱动,但和SAX不同,Pull解析需要开发者主动从解析器中获取事件,而不是被动等待回调。这种方式更加灵活,内存占用小,也是Android开发中推荐使用的XML解析方式。
Pull解析的核心代码示例如下:
import org.xmlpull.v1.XmlPullParser;
import org.xmlpull.v1.XmlPullParserFactory;
import java.io.InputStream;
class PullParseUtil {
public static void parseXml(InputStream inputStream) {
try {
XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
XmlPullParser parser = factory.newPullParser();
parser.setInput(inputStream, "UTF-8");
// 获取第一个事件类型
int eventType = parser.getEventType();
String currentTag = null;
while (eventType != XmlPullParser.END_DOCUMENT) {
switch (eventType) {
case XmlPullParser.START_DOCUMENT:
System.out.println("开始解析XML文档");
break;
case XmlPullParser.START_TAG:
currentTag = parser.getName();
// 获取标签的属性
int attrCount = parser.getAttributeCount();
if (attrCount > 0) {
for (int i = 0; i < attrCount; i++) {
System.out.println("属性名:" + parser.getAttributeName(i) + ",属性值:" + parser.getAttributeValue(i));
}
}
break;
case XmlPullParser.TEXT:
if (currentTag != null) {
String content = parser.getText().trim();
if (!content.isEmpty()) {
System.out.println(currentTag + "的内容:" + content);
}
}
break;
case XmlPullParser.END_TAG:
currentTag = null;
break;
}
// 手动获取下一个事件
eventType = parser.next();
}
System.out.println("XML文档解析完成");
} catch (Exception e) {
e.printStackTrace();
}
}
}
四、三种解析方式对比
为了帮助开发者选择合适的解析方式,我们对三种解析技术进行多维度对比:
| 解析方式 | 内存占用 | 解析速度 | 操作灵活性 | 适用场景 |
|---|---|---|---|---|
| SAX解析 | 低 | 快 | 低,只能顺序读取 | 大型XML文件,只需要读取数据不需要修改的场景 |
| DOM解析 | 高 | 较慢 | 高,可随机操作任意节点 | 小型XML文件,需要修改、增删节点的场景 |
| Pull解析 | 低 | 快 | 中,可主动控制解析流程 | Android平台各类XML解析场景,官方推荐方式 |
五、解析注意事项
在实际使用XML解析技术时,需要注意以下几点:
- 解析完成后及时关闭输入流,避免资源泄漏
- 处理XML文本内容时,注意去除空白字符,避免获取到无意义的换行、空格内容
- 如果XML文件来自网络,需要添加网络权限,并且不能在主线程中进行解析操作,避免阻塞UI
- 解析过程中做好异常捕获,避免解析错误导致应用崩溃