XML全称为可扩展标记语言,常用于不同系统之间的数据传递和配置文件存储,编写有效的XML文档需要同时满足语法正确性和结构合法性两个核心要求。
XML基础语法规则
一个语法正确的XML文档也就是良构的XML,需要遵循以下基本规则:
- 文档必须以XML声明开头,声明版本和编码信息
- 所有标签必须正确闭合,要么成对出现,要么使用自闭合语法
- 标签必须正确嵌套,不能出现交叉嵌套的情况
- 属性值必须使用引号包裹,单引号双引号都可以
- 文档必须有且仅有一个根元素,所有其他元素都包含在根元素内部
- 标签名称区分大小写,开始标签和结束标签的大小写必须完全一致
良构XML示例
<?xml version="1.0" encoding="UTF-8"?>
<user>
<id>1001</id>
<name>张三</name>
<age>25</age>
<hobby self_close="true" />
</user>
通过DTD定义结构约束
DTD全称是文档类型定义,是早期用来约束XML文档结构的方式,它可以定义元素、属性、实体等内容,确保XML文档的结构符合预期。
DTD的基本语法
DTD可以内嵌在XML文档中,也可以作为外部文件引入。内嵌DTD需要放在XML声明之后,根元素之前,使用<!DOCTYPE>标签定义。
元素定义规则
- <!ELEMENT 元素名 内容规则> 用来定义元素,内容规则可以是EMPTY(空元素)、ANY(任意内容)、#PCDATA(文本数据)或者子元素列表
- 子元素列表可以用逗号分隔表示顺序出现,用竖线分隔表示任选其一,用问号表示出现0或1次,加号表示1次以上,星号表示0次以上
属性定义规则
属性定义使用<!ATTLIST 元素名 属性名 属性类型 默认值>的语法,属性类型常见的有CDATA(文本)、ID(唯一标识)、IDREF(引用其他ID)等,默认值可以是#REQUIRED(必填)、#IMPLIED(可选)、#FIXED(固定值)或者指定默认值。
带DTD约束的XML示例
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE user [
<!ELEMENT user (id, name, age, hobby?)>
<!ELEMENT id (#PCDATA)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT hobby EMPTY>
<!ATTLIST hobby self_close CDATA #IMPLIED>
]>
<user>
<id>1001</id>
<name>张三</name>
<age>25</age>
<hobby self_close="true" />
</user>
通过XML Schema定义结构约束
XML Schema是比DTD更强大的结构约束方式,它使用XML语法编写,支持更多的数据类型,约束规则也更灵活,是目前更常用的XML约束方式。
XML Schema的基本语法
XML Schema文件通常以.xsd为后缀,根元素是<xs:schema>,需要定义命名空间。元素使用<xs:element>定义,类型可以是内置的简单类型,也可以自定义复杂类型。
XML Schema示例
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://ipipp.com/user"
xmlns="http://ipipp.com/user"
elementFormDefault="qualified">
<xs:element name="user">
<xs:complexType>
<xs:sequence>
<xs:element name="id" type="xs:integer"/>
<xs:element name="name" type="xs:string"/>
<xs:element name="age" type="xs:integer"/>
<xs:element name="hobby" minOccurs="0" maxOccurs="1">
<xs:complexType>
<xs:attribute name="self_close" type="xs:string" use="optional"/>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
引用XML Schema的XML文档示例
<?xml version="1.0" encoding="UTF-8"?>
<user xmlns="http://ipipp.com/user"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://ipipp.com/user user.xsd">
<id>1001</id>
<name>张三</name>
<age>25</age>
<hobby self_close="true" />
</user>
常见错误排查方法
编写XML文档时常见的错误主要有以下几类:
- 标签未闭合或者嵌套错误,这类错误可以通过XML解析器直接报出,检查标签的配对情况即可
- 属性值未使用引号包裹,或者引号不匹配,需要检查所有属性的引号使用是否正确
- 结构不符合DTD或者XML Schema的约束,比如缺少必填元素、元素顺序错误、属性类型不匹配等,需要根据约束文件的规则调整文档结构
- 特殊字符未转义,比如文档中出现了<、>、&等字符,需要使用对应的实体引用<、>、&来替换
可以使用常见的XML编辑器或者在线XML校验工具来检查文档的有效性,快速定位错误位置。
XMLXML_schemaDTDwell_formed_XML修改时间:2026-06-23 00:18:47