导读:本期聚焦于小伙伴创作的《XML中如何获取节点文本?XML获取节点文本内容的技巧与方法有哪些》,敬请观看详情,探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《XML中如何获取节点文本?XML获取节点文本内容的技巧与方法有哪些》有用,将其分享出去将是对创作者最好的鼓励。

XML作为一种常用的数据交换格式,在配置存储、接口数据传输等场景中广泛应用,获取节点文本内容是对XML数据进行后续处理的基础操作。不同的解析方式对应不同的实现逻辑,开发者需要根据实际场景选择合适的方法。

DOM解析方式获取节点文本

DOM解析会将整个XML文档加载到内存中,生成树形结构,通过遍历节点树可以轻松获取目标节点的文本内容,适合XML文档体积较小的场景。

Java语言实现示例

使用Java内置的DOM解析器获取节点文本的步骤如下:

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class XmlDomDemo {
    public static void main(String[] args) throws Exception {
        // 创建解析器工厂
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();
        // 加载XML文档,这里使用本地文件路径,也可以替换为网络地址
        Document document = builder.parse("test.xml");
        // 获取所有名为user的节点
        NodeList userNodes = document.getElementsByTagName("user");
        for (int i = 0; i < userNodes.getLength(); i++) {
            Node userNode = userNodes.item(i);
            // 获取user节点下的name子节点
            NodeList nameNodes = ((org.w3c.dom.Element) userNode).getElementsByTagName("name");
            if (nameNodes.getLength() > 0) {
                Node nameNode = nameNodes.item(0);
                // 获取节点文本内容
                String nameText = nameNode.getTextContent();
                System.out.println("用户名称:" + nameText);
            }
        }
    }
}

Python语言实现示例

Python中可以使用xml.dom.minidom模块实现DOM解析获取节点文本:

from xml.dom.minidom import parse

# 加载XML文档
doc = parse("test.xml")
# 获取所有user节点
user_nodes = doc.getElementsByTagName("user")
for user_node in user_nodes:
    # 获取user节点下的name子节点
    name_nodes = user_node.getElementsByTagName("name")
    if name_nodes.length > 0:
        # 获取节点文本内容
        name_text = name_nodes[0].firstChild.data
        print(f"用户名称:{name_text}")

SAX解析方式获取节点文本

SAX解析是事件驱动的流式解析方式,不会将整个文档加载到内存,适合处理大体积的XML文档,通过重写事件处理方法捕获节点文本内容。

Java语言实现示例

使用SAX解析获取节点文本需要继承DefaultHandler类:

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;

public class XmlSaxDemo {
    public static void main(String[] args) throws Exception {
        SAXParserFactory factory = SAXParserFactory.newInstance();
        SAXParser parser = factory.newSAXParser();
        // 解析XML文档,使用自定义的处理器
        parser.parse(new File("test.xml"), new MyHandler());
    }

    static class MyHandler extends DefaultHandler {
        // 标记当前是否处于name节点内
        private boolean isNameNode = false;
        private StringBuilder textBuffer = new StringBuilder();

        @Override
        public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
            if ("name".equals(qName)) {
                isNameNode = true;
                textBuffer.setLength(0);
            }
        }

        @Override
        public void characters(char[] ch, int start, int length) throws SAXException {
            if (isNameNode) {
                textBuffer.append(ch, start, length);
            }
        }

        @Override
        public void endElement(String uri, String localName, String qName) throws SAXException {
            if ("name".equals(qName)) {
                isNameNode = false;
                System.out.println("用户名称:" + textBuffer.toString().trim());
            }
        }
    }
}

XPath方式获取节点文本

XPath是一种用于在XML文档中定位节点的语言,通过编写路径表达式可以快速定位目标节点,直接获取其文本内容,代码更加简洁。

Java语言实现示例

使用Java的XPath解析器获取节点文本:

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathFactory;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;

public class XmlXPathDemo {
    public static void main(String[] args) throws Exception {
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();
        Document document = builder.parse("test.xml");
        // 创建XPath对象
        XPath xPath = XPathFactory.newInstance().newXPath();
        // 编写XPath表达式,获取所有user节点下的name节点的文本内容
        NodeList nameNodes = (NodeList) xPath.evaluate("//user/name/text()", document, XPathConstants.NODESET);
        for (int i = 0; i < nameNodes.getLength(); i++) {
            String nameText = nameNodes.item(i).getNodeValue();
            System.out.println("用户名称:" + nameText);
        }
    }
}

Python语言实现示例

Python中可以使用lxml库实现XPath解析获取节点文本:

from lxml import etree

# 加载XML文档
tree = etree.parse("test.xml")
# 使用XPath表达式获取所有user下name节点的文本
name_texts = tree.xpath("//user/name/text()")
for name_text in name_texts:
    print(f"用户名称:{name_text}")

不同方式的适用场景对比

三种常见的XML节点文本获取方式各有优劣,开发者可以根据实际场景选择:

解析方式优点缺点适用场景
DOM解析节点树结构清晰,可随意遍历修改节点内存占用高,解析大文档性能差小体积XML文档,需要频繁操作节点结构的场景
SAX解析内存占用低,解析速度快只能单向遍历,无法修改节点结构大体积XML文档,只需要读取数据的场景
XPath解析定位节点语法简洁,代码量少依赖DOM或SAX的底层实现需要快速定位特定节点的场景

注意事项

  • 获取节点文本时需要注意节点是否存在子节点,如果节点包含子节点,getTextContent()方法会返回所有子节点的文本内容拼接结果,需要根据需求选择对应方法。
  • XML文档如果存在命名空间,XPath表达式和节点获取方法需要额外处理命名空间相关逻辑,否则可能无法定位到目标节点。
  • 解析外部来源的XML文档时,需要注意关闭外部实体解析,避免XXE漏洞风险。

XML节点文本获取DOM解析SAX解析XPath修改时间:2026-06-22 19:03:51

免责声明:​ 已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰,观点力求客观中立。本站旨在免费分享,内容仅供个人学习、研究或参考使用。若引用了第三方作品,版权归原作者所有。如内容涉及您的权益,请联系我们处理。
内容垂直聚焦
专注技术核心技术栏目,确保每篇文章深度聚焦于实用技能。从代码技巧到架构设计,为用户提供无干扰的纯技术知识沉淀,精准满足专业提升需求。
知识结构清晰
覆盖从开发到部署的全链路。AI、前端、编程、数据库、服务器、建站、系统层层递进,构建清晰学习路径,帮助用户系统化掌握开发与运维所需的核心技术。
深度技术解析
拒绝泛泛而谈,深入技术细节与实践难点。无论是数据库优化还是服务器配置,均结合真实场景与代码示例进行剖析,致力于提供可直接应用于工作的解决方案。
专业领域覆盖
精准对应开发生命周期。从前端界面到后端编程,从数据库操作到服务器运维,形成完整闭环,一站式满足全栈工程师和运维人员的技术需求。
即学即用高效
内容强调实操性,步骤清晰、代码完整。用户可根据教程直接复现和应用于自身项目,显著缩短从学习到实践的距离,快速解决开发中的具体问题。
持续更新保障
专注既定技术方向进行长期、稳定的内容输出。确保各栏目技术文章持续更新迭代,紧跟主流技术发展趋势,为用户提供经久不衰的学习价值。