XML作为常用的数据交换格式,在很多系统中都需要通过已有XML信息生成新的XML文档,不同类型的生成方式对应不同的使用场景和性能表现。

常见XML文档生成方式分类
根据实现原理的不同,XML生成方式主要分为DOM构建、SAX事件驱动、字符串拼接三类,不同方式的特点如下:
| 生成方式 | 原理 | 适用场景 | 优缺点 |
|---|---|---|---|
| DOM构建 | 先将整个文档加载到内存形成节点树,再操作节点生成文档 | 文档结构复杂、需要频繁修改节点内容 | 操作直观但内存占用高 |
| SAX事件驱动 | 按顺序触发事件生成对应节点,不需要加载整个文档到内存 | 生成超大体积XML文档 | 内存占用低但操作逻辑相对复杂 |
| 字符串拼接 | 直接按照XML语法拼接字符串生成文档内容 | 生成结构极简的XML片段 | 实现简单但易出错,不适合复杂结构 |
基于DOM的XML文档生成操作
DOM方式是最直观的XML生成方式,以Java语言为例,生成包含用户信息的XML文档步骤如下:
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
public class XmlGenerator {
public static void main(String[] args) throws Exception {
// 创建DocumentBuilder工厂
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
// 创建空白文档
Document document = builder.newDocument();
// 创建根节点users
Element root = document.createElement("users");
document.appendChild(root);
// 创建第一个user子节点
Element user1 = document.createElement("user");
user1.setAttribute("id", "1");
Element name1 = document.createElement("name");
name1.appendChild(document.createTextNode("张三"));
Element age1 = document.createElement("age");
age1.appendChild(document.createTextNode("25"));
user1.appendChild(name1);
user1.appendChild(age1);
root.appendChild(user1);
// 创建第二个user子节点
Element user2 = document.createElement("user");
user2.setAttribute("id", "2");
Element name2 = document.createElement("name");
name2.appendChild(document.createTextNode("李四"));
Element age2 = document.createElement("age");
age2.appendChild(document.createTextNode("30"));
user2.appendChild(name2);
user2.appendChild(age2);
root.appendChild(user2);
// 将文档输出为XML字符串
Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty("encoding", "UTF-8");
transformer.setOutputProperty("indent", "yes");
transformer.transform(new DOMSource(document), new StreamResult(System.out));
}
}
上述代码会生成一个包含两个根子节点的标准XML文档,结构清晰且支持灵活修改节点内容。
Python中生成XML文档的实现
Python的xml.etree.ElementTree模块提供了便捷的XML生成能力,示例代码如下:
import xml.etree.ElementTree as ET
# 创建根节点
root = ET.Element("bookstore")
# 创建第一个book子节点
book1 = ET.SubElement(root, "book")
book1.set("category", "编程")
title1 = ET.SubElement(book1, "title")
title1.text = "Python基础教程"
author1 = ET.SubElement(book1, "author")
author1.text = "王五"
# 创建第二个book子节点
book2 = ET.SubElement(root, "book")
book2.set("category", "文学")
title2 = ET.SubElement(book2, "title")
title2.text = "散文精选"
author2 = ET.SubElement(book2, "author")
author2.text = "赵六"
# 生成XML文档并格式化输出
tree = ET.ElementTree(root)
ET.indent(tree, space=" ")
tree.write("books.xml", encoding="UTF-8", xml_declaration=True)
运行后会在当前目录生成books.xml文件,内容符合XML规范,适合快速生成中小型XML文档。
生成XML文档的注意事项
- 所有标签必须正确闭合,避免出现<tag>没有对应</tag>的情况
- 属性值必须使用英文双引号包裹,不能省略引号或者混用单双引号
- 特殊字符如<、&等需要转义为<lt;、&,否则会导致文档格式错误
- 如果生成的文档需要支持中文,必须显式指定编码为UTF-8,避免乱码问题
- 嵌套结构需要保证层级正确,父节点和子节点的包含关系不能混乱
如果是从已有XML中解析内容再生成新的XML文档,建议先使用解析器读取原文档的节点信息,再根据需求组装新文档的节点,避免手动拼接字符串带来的格式错误风险。
字符串拼接方式的简单示例
对于结构极简的XML片段,也可以直接使用字符串拼接的方式生成,示例如下:
<?php // 定义XML头 $xml = "<?xml version="1.0" encoding="UTF-8"?>n"; // 拼接根节点 $xml .= "n"; // 拼接子节点 $xml .= " "; // 输出XML内容 echo $xml; ?>100 n"; $xml .= "30 n"; $xml .= "
这种方式仅适合生成没有复杂嵌套、没有动态变化的简单XML内容,复杂场景下还是建议使用DOM或者专门的XML生成库。
XMLXML文档生成DOMSAXPython_xml修改时间:2026-06-18 03:48:44