XML文档的DTD(文档类型定义)用于约束文档的元素、属性等结构,根据存储位置不同分为内部DTD和外部DTD,二者的声明语法和使用场景有显著差异。

内部DTD的声明方法
内部DTD直接嵌入在XML文档的序言部分,位于XML声明之后,根元素之前。其核心语法是在<!DOCTYPE>标签内直接编写DTD定义内容,不需要引用外部文件。
内部DTD的基本结构如下:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE 根元素名 [
<!ELEMENT 元素名 (子元素列表)>
<!ATTLIST 元素名 属性名 属性类型 属性默认值>
...其他DTD定义内容
]>
<根元素名>
<!-- 文档内容 -->
</根元素名>
下面是一个具体的内部DTD声明示例,定义了一个存储学生信息的XML文档结构:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE students [
<!ELEMENT students (student+)>
<!ELEMENT student (name, age, major)>
<!ATTLIST student id CDATA #REQUIRED>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT major (#PCDATA)>
]>
<students>
<student id="s1">
<name>张三</name>
<age>20</age>
<major>计算机科学</major>
</student>
</students>
内部DTD的优势是结构定义和文档内容绑定,不需要额外加载文件,适合单个简单XML文档的结构约束,缺点是如果多个XML文档需要复用同一套结构,需要重复编写DTD内容。
外部DTD的声明方法
外部DTD将结构定义内容存储在独立的.dtd文件中,XML文档通过引用该文件来应用DTD约束,适合多文档复用场景。外部DTD分为私有外部DTD和公共外部DTD两种类型。
私有外部DTD声明
私有外部DTD是用户自定义的文件,声明语法使用SYSTEM关键字指定DTD文件的路径,路径可以是相对路径或绝对路径。
基本语法如下:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE 根元素名 SYSTEM "DTD文件路径">
<根元素名>
<!-- 文档内容 -->
</根元素名>
首先创建独立的student.dtd文件,内容如下:
<!ELEMENT students (student+)> <!ELEMENT student (name, age, major)> <!ATTLIST student id CDATA #REQUIRED> <!ELEMENT name (#PCDATA)> <!ELEMENT age (#PCDATA)> <!ELEMENT major (#PCDATA)>
然后XML文档中引用该外部DTD:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE students SYSTEM "student.dtd">
<students>
<student id="s1">
<name>李四</name>
<age>21</age>
<major>软件工程</major>
</student>
</students>
公共外部DTD声明
公共外部DTD是行业或组织公开的标准DTD,比如常见的XHTML DTD,声明语法使用PUBLIC关键字,先指定公共标识符,再指定DTD文件的路径。
基本语法如下:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE 根元素名 PUBLIC "公共标识符" "DTD文件路径">
<根元素名>
<!-- 文档内容 -->
</根元素名>
以下是引用XHTML 1.0过渡版公共DTD的示例:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>示例页面</title>
</head>
<body>
<p>这是XHTML文档内容</p>
</body>
</html>
两种DTD声明的注意事项
- 内部DTD的
<!DOCTYPE>标签后的方括号不能省略,所有DTD定义内容都放在方括号内部。 - 外部DTD文件的路径要正确,相对路径是相对于当前XML文档的位置,绝对路径需要填写完整的文件地址,如果是网络路径要确保可访问。
- 同一个XML文档只能声明一个DTD,不能同时声明内部DTD和外部DTD。
- DTD定义中的元素、属性语法要符合规范,比如
<!ELEMENT>定义元素类型,<!ATTLIST>定义元素属性,语法错误会导致XML文档解析失败。 - 如果XML文档不需要DTD约束,可以不声明DTD,不过此时文档结构没有强制校验规则。
常见问题解答
内部DTD和外部DTD可以同时使用吗
不可以,XML规范规定一个文档只能有一个DTD声明,要么使用内部DTD,要么使用外部DTD,不能二者共存。
外部DTD文件修改后需要重新解析XML吗
需要,因为XML解析器会在解析文档时加载外部DTD文件,如果DTD内容修改,需要重新解析XML文档才能应用新的结构约束。
DTD声明必须放在XML文档开头吗
是的,DTD声明必须位于XML声明之后,根元素之前,不能放在文档的其他位置,否则会导致解析错误。