XML中如何获取节点文本？XML获取节点文本内容的技巧与方法有哪些

来源：站长平台作者：上海GEO公司头衔：草根站长

导读：本期聚焦于小伙伴创作的《XML中如何获取节点文本？XML获取节点文本内容的技巧与方法有哪些》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《XML中如何获取节点文本？XML获取节点文本内容的技巧与方法有哪些》有用，将其分享出去将是对创作者最好的鼓励。

XML作为一种常用的数据交换格式，在配置存储、接口数据传输等场景中广泛应用，获取节点文本内容是对XML数据进行后续处理的基础操作。不同的解析方式对应不同的实现逻辑，开发者需要根据实际场景选择合适的方法。

DOM解析方式获取节点文本

DOM解析会将整个XML文档加载到内存中，生成树形结构，通过遍历节点树可以轻松获取目标节点的文本内容，适合XML文档体积较小的场景。

Java语言实现示例

使用Java内置的DOM解析器获取节点文本的步骤如下：

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class XmlDomDemo {
    public static void main(String[] args) throws Exception {
        // 创建解析器工厂
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();
        // 加载XML文档，这里使用本地文件路径，也可以替换为网络地址
        Document document = builder.parse("test.xml");
        // 获取所有名为user的节点
        NodeList userNodes = document.getElementsByTagName("user");
        for (int i = 0; i < userNodes.getLength(); i++) {
            Node userNode = userNodes.item(i);
            // 获取user节点下的name子节点
            NodeList nameNodes = ((org.w3c.dom.Element) userNode).getElementsByTagName("name");
            if (nameNodes.getLength() > 0) {
                Node nameNode = nameNodes.item(0);
                // 获取节点文本内容
                String nameText = nameNode.getTextContent();
                System.out.println("用户名称：" + nameText);
            }
        }
    }
}

Python语言实现示例

Python中可以使用xml.dom.minidom模块实现DOM解析获取节点文本：

from xml.dom.minidom import parse

# 加载XML文档
doc = parse("test.xml")
# 获取所有user节点
user_nodes = doc.getElementsByTagName("user")
for user_node in user_nodes:
    # 获取user节点下的name子节点
    name_nodes = user_node.getElementsByTagName("name")
    if name_nodes.length > 0:
        # 获取节点文本内容
        name_text = name_nodes[0].firstChild.data
        print(f"用户名称：{name_text}")

SAX解析方式获取节点文本

SAX解析是事件驱动的流式解析方式，不会将整个文档加载到内存，适合处理大体积的XML文档，通过重写事件处理方法捕获节点文本内容。

Java语言实现示例

使用SAX解析获取节点文本需要继承DefaultHandler类：

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;

public class XmlSaxDemo {
    public static void main(String[] args) throws Exception {
        SAXParserFactory factory = SAXParserFactory.newInstance();
        SAXParser parser = factory.newSAXParser();
        // 解析XML文档，使用自定义的处理器
        parser.parse(new File("test.xml"), new MyHandler());
    }

    static class MyHandler extends DefaultHandler {
        // 标记当前是否处于name节点内
        private boolean isNameNode = false;
        private StringBuilder textBuffer = new StringBuilder();

        @Override
        public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
            if ("name".equals(qName)) {
                isNameNode = true;
                textBuffer.setLength(0);
            }
        }

        @Override
        public void characters(char[] ch, int start, int length) throws SAXException {
            if (isNameNode) {
                textBuffer.append(ch, start, length);
            }
        }

        @Override
        public void endElement(String uri, String localName, String qName) throws SAXException {
            if ("name".equals(qName)) {
                isNameNode = false;
                System.out.println("用户名称：" + textBuffer.toString().trim());
            }
        }
    }
}

XPath方式获取节点文本

XPath是一种用于在XML文档中定位节点的语言，通过编写路径表达式可以快速定位目标节点，直接获取其文本内容，代码更加简洁。

Java语言实现示例

使用Java的XPath解析器获取节点文本：

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathFactory;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;

public class XmlXPathDemo {
    public static void main(String[] args) throws Exception {
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();
        Document document = builder.parse("test.xml");
        // 创建XPath对象
        XPath xPath = XPathFactory.newInstance().newXPath();
        // 编写XPath表达式，获取所有user节点下的name节点的文本内容
        NodeList nameNodes = (NodeList) xPath.evaluate("//user/name/text()", document, XPathConstants.NODESET);
        for (int i = 0; i < nameNodes.getLength(); i++) {
            String nameText = nameNodes.item(i).getNodeValue();
            System.out.println("用户名称：" + nameText);
        }
    }
}

Python语言实现示例

Python中可以使用lxml库实现XPath解析获取节点文本：

from lxml import etree

# 加载XML文档
tree = etree.parse("test.xml")
# 使用XPath表达式获取所有user下name节点的文本
name_texts = tree.xpath("//user/name/text()")
for name_text in name_texts:
    print(f"用户名称：{name_text}")

不同方式的适用场景对比

三种常见的XML节点文本获取方式各有优劣，开发者可以根据实际场景选择：

解析方式	优点	缺点	适用场景
DOM解析	节点树结构清晰，可随意遍历修改节点	内存占用高，解析大文档性能差	小体积XML文档，需要频繁操作节点结构的场景
SAX解析	内存占用低，解析速度快	只能单向遍历，无法修改节点结构	大体积XML文档，只需要读取数据的场景
XPath解析	定位节点语法简洁，代码量少	依赖DOM或SAX的底层实现	需要快速定位特定节点的场景

注意事项

获取节点文本时需要注意节点是否存在子节点，如果节点包含子节点，getTextContent()方法会返回所有子节点的文本内容拼接结果，需要根据需求选择对应方法。
XML文档如果存在命名空间，XPath表达式和节点获取方法需要额外处理命名空间相关逻辑，否则可能无法定位到目标节点。
解析外部来源的XML文档时，需要注意关闭外部实体解析，避免XXE漏洞风险。

XML 节点文本获取 DOM解析 SAX解析 XPath修改时间：2026-06-22 19:03:51

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。