Java如何使用SAX解析XML?附完整代码实例

来源:PHP编程网作者:半糖头衔:草根站长
导读:本期聚焦于小伙伴创作的《Java如何使用SAX解析XML?附完整代码实例》,敬请观看详情,探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《Java如何使用SAX解析XML?附完整代码实例》有用,将其分享出去将是对创作者最好的鼓励。

SAX(Simple API for XML)是Java中处理XML文件的流式解析方式,它不会将整个XML文档加载到内存中,而是逐行读取并触发对应的事件回调,因此内存占用极低,非常适合处理体积较大的XML文件。其核心逻辑是开发者通过继承DefaultHandler类,重写对应的事件处理方法,在解析过程中获取需要的节点数据。

Java如何使用SAX解析XML?附完整代码实例

SAX解析的核心类与回调方法

使用SAX解析XML主要依赖以下几个核心类:

  • SAXParserFactory:用于创建SAX解析器工厂实例
  • SAXParser:SAX解析器实例,负责执行解析操作
  • DefaultHandler:事件处理器基类,开发者需要继承该类并重写对应方法

DefaultHandler中常用的回调方法包括:

  • startDocument():文档开始解析时触发
  • endDocument():文档解析结束时触发
  • startElement(String uri, String localName, String qName, Attributes attributes):遇到开始标签时触发,qName为标签名,attributes为标签属性
  • endElement(String uri, String localName, String qName):遇到结束标签时触发
  • characters(char[] ch, int start, int length):读取标签内文本内容时触发

完整代码实例

首先准备一个待解析的XML文件,命名为test.xml,内容如下:

<?xml version="1.0" encoding="UTF-8"?>
<users>
    <user id="1">
        <name>张三</name>
        <age>25</age>
        <email>zhangsan@ipipp.com</email>
    </user>
    <user id="2">
        <name>李四</name>
        <age>28</age>
        <email>lisi@ipipp.com</email>
    </user>
</users>

接下来编写SAX解析的处理器类,继承DefaultHandler:

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import java.util.ArrayList;
import java.util.List;

public class UserHandler extends DefaultHandler {
    // 存储解析得到的用户列表
    private List<User> userList = new ArrayList<>();
    // 当前解析的用户对象
    private User currentUser;
    // 记录当前解析的标签名
    private String currentTag;

    // 获取解析后的用户列表
    public List<User> getUserList() {
        return userList;
    }

    @Override
    public void startDocument() throws SAXException {
        System.out.println("开始解析XML文档");
    }

    @Override
    public void endDocument() throws SAXException {
        System.out.println("XML文档解析结束");
    }

    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        currentTag = qName;
        // 遇到user开始标签时,创建新的User对象
        if ("user".equals(qName)) {
            currentUser = new User();
            // 获取id属性
            String id = attributes.getValue("id");
            currentUser.setId(Integer.parseInt(id));
        }
    }

    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        // 遇到user结束标签时,将当前用户加入列表
        if ("user".equals(qName)) {
            userList.add(currentUser);
            currentUser = null;
        }
        currentTag = null;
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        if (currentTag == null || currentUser == null) {
            return;
        }
        String content = new String(ch, start, length).trim();
        if (content.length() == 0) {
            return;
        }
        // 根据当前标签名赋值对应属性
        switch (currentTag) {
            case "name":
                currentUser.setName(content);
                break;
            case "age":
                currentUser.setAge(Integer.parseInt(content));
                break;
            case "email":
                currentUser.setEmail(content);
                break;
            default:
                break;
        }
    }
}

对应的User实体类代码如下:

public class User {
    private int id;
    private String name;
    private int age;
    private String email;

    // getter和setter方法
    public int getId() {
        return id;
    }

    public void setId(int id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    public String getEmail() {
        return email;
    }

    public void setEmail(String email) {
        this.email = email;
    }

    @Override
    public String toString() {
        return "User{id=" + id + ", name='" + name + "', age=" + age + ", email='" + email + "'}";
    }
}

最后编写主程序执行解析操作:

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
import java.util.List;

public class SAXParseDemo {
    public static void main(String[] args) {
        try {
            // 创建SAX解析器工厂
            SAXParserFactory factory = SAXParserFactory.newInstance();
            // 获取SAX解析器实例
            SAXParser parser = factory.newSAXParser();
            // 创建自定义处理器
            UserHandler handler = new UserHandler();
            // 执行解析,传入XML文件和处理器
            parser.parse(new File("test.xml"), handler);
            // 获取解析结果并输出
            List<User> userList = handler.getUserList();
            for (User user : userList) {
                System.out.println(user);
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

注意事项

在实际使用SAX解析时需要注意几个问题:

  • characters方法可能会被多次调用,比如标签内文本包含换行或空格时,因此需要在方法内做空字符串判断,避免重复赋值
  • 如果XML文件包含命名空间,需要通过localName参数获取标签名,而不是qName
  • 解析大文件时不需要额外做内存优化,SAX本身的流式特性已经保证了低内存占用
  • 如果需要处理解析过程中的异常,可以在回调方法中抛出SAXException,或者在主程序捕获对应异常

以上代码可以直接复制到本地运行,只需要将test.xml文件放在项目根目录即可,运行后会输出两个用户的完整信息,证明SAX解析逻辑正确。

JavaSAX解析XMLXML解析修改时间:2026-06-26 16:45:35

免责声明:​ 已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰,观点力求客观中立。本站旨在免费分享,内容仅供个人学习、研究或参考使用。若引用了第三方作品,版权归原作者所有。如内容涉及您的权益,请联系我们处理。
内容垂直聚焦
专注技术核心技术栏目,确保每篇文章深度聚焦于实用技能。从代码技巧到架构设计,为用户提供无干扰的纯技术知识沉淀,精准满足专业提升需求。
知识结构清晰
覆盖从开发到部署的全链路。AI、前端、编程、数据库、服务器、建站、系统层层递进,构建清晰学习路径,帮助用户系统化掌握开发与运维所需的核心技术。
深度技术解析
拒绝泛泛而谈,深入技术细节与实践难点。无论是数据库优化还是服务器配置,均结合真实场景与代码示例进行剖析,致力于提供可直接应用于工作的解决方案。
专业领域覆盖
精准对应开发生命周期。从前端界面到后端编程,从数据库操作到服务器运维,形成完整闭环,一站式满足全栈工程师和运维人员的技术需求。
即学即用高效
内容强调实操性,步骤清晰、代码完整。用户可根据教程直接复现和应用于自身项目,显著缩短从学习到实践的距离,快速解决开发中的具体问题。
持续更新保障
专注既定技术方向进行长期、稳定的内容输出。确保各栏目技术文章持续更新迭代,紧跟主流技术发展趋势,为用户提供经久不衰的学习价值。