XML Schema作为XML文档的约束规范,通过定义元素、属性的数据类型和结构规则,保证XML文档的合法性和数据一致性。它比DTD拥有更丰富的数据类型支持,其中内置类型是Schema类型体系的基础组成部分。

XML Schema内置类型概述
XML Schema的内置类型分为基础类型和派生类型两大类,基础类型是所有类型的根,派生类型则基于基础类型通过限制或扩展得到。常用的内置基础类型如下:
- 字符串相关:string(字符串)、normalizedString(规范化字符串,会合并换行和制表符)、token(进一步去掉首尾空格的规范化字符串)
- 数值相关:integer(整数)、decimal(十进制数)、float(单精度浮点数)、double(双精度浮点数)
- 日期时间相关:date(日期,格式为yyyy-MM-dd)、time(时间,格式为HH:mm:ss)、dateTime(日期时间,格式为yyyy-MM-ddTHH:mm:ss)
- 其他常用类型:boolean(布尔值,取值为true、false、1、0)、anyURI(URI地址)、base64Binary(Base64编码的二进制数据)
简单类型的定义与使用
简单类型是指不包含子元素和属性的数据类型,只能包含文本内容,常用于约束XML的元素或属性。使用简单类型有两种常见方式,一种是直接引用内置类型,另一种是自定义限制规则的简单类型。
直接引用内置简单类型
在Schema中定义元素时,通过type属性直接指定内置类型即可完成约束。下面是一个直接引用内置类型的Schema示例:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.ipipp.com/user"
xmlns="http://www.ipipp.com/user"
elementFormDefault="qualified">
<!-- 定义用户根元素,其内容为字符串类型 -->
<xs:element name="user">
<xs:complexType>
<xs:sequence>
<!-- 用户名,使用string内置类型 -->
<xs:element name="username" type="xs:string"/>
<!-- 用户年龄,使用integer内置类型 -->
<xs:element name="age" type="xs:integer"/>
<!-- 注册时间,使用date内置类型 -->
<xs:element name="registerDate" type="xs:date"/>
<!-- 是否激活,使用boolean内置类型 -->
<xs:element name="isActive" type="xs:boolean"/>
</xs:sequence>
<!-- 用户ID属性,使用integer内置类型 -->
<xs:attribute name="id" type="xs:integer" use="required"/>
</xs:complexType>
</xs:element>
</xs:schema>对应的合法XML文档示例如下:
<?xml version="1.0" encoding="UTF-8"?>
<user xmlns="http://www.ipipp.com/user"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.ipipp.com/user user.xsd"
id="1001">
<username>张三</username>
<age>25</age>
<registerDate>2024-05-20</registerDate>
<isActive>true</isActive>
</user>自定义限制规则的简单类型
如果内置类型的约束不满足需求,可以基于内置类型定义新的简单类型,通过<xs:restriction>标签添加限制规则。常见的限制方式包括枚举值、数值范围、字符串长度等。
下面是一个自定义简单类型的Schema示例,定义年龄的取值范围为18到60之间的整数:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.ipipp.com/user"
xmlns="http://www.ipipp.com/user"
elementFormDefault="qualified">
<!-- 自定义年龄类型,基于integer类型,限制最小值18,最大值60 -->
<xs:simpleType name="ageType">
<xs:restriction base="xs:integer">
<xs:minInclusive value="18"/>
<xs:maxInclusive value="60"/>
</xs:restriction>
</xs:simpleType>
<!-- 自定义用户状态类型,枚举值为active、inactive、frozen -->
<xs:simpleType name="statusType">
<xs:restriction base="xs:string">
<xs:enumeration value="active"/>
<xs:enumeration value="inactive"/>
<xs:enumeration value="frozen"/>
</xs:restriction>
</xs:simpleType>
<xs:element name="user">
<xs:complexType>
<xs:sequence>
<xs:element name="age" type="ageType"/>
<xs:element name="status" type="statusType"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>对应的合法XML文档示例如下:
<?xml version="1.0" encoding="UTF-8"?>
<user xmlns="http://www.ipipp.com/user"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.ipipp.com/user user.xsd">
<age>30</age>
<status>active</status>
</user>简单类型的适用场景
简单类型适合用于约束只有文本内容、没有嵌套结构的数据,比如常见的属性、单值元素等。如果元素需要包含子元素或者同时包含属性和内容,就需要使用复杂类型。需要注意,属性在Schema中只能使用简单类型,不能使用复杂类型,这也是简单类型的重要应用场景之一。
常见使用注意事项
- 引用内置类型时,需要加上命名空间前缀,比如
xs:string,如果自定义了默认命名空间,也要保证前缀和Schema声明的命名空间对应。 - 自定义简单类型时,base属性必须指定一个已存在的内置类型或自定义简单类型,不能基于复杂类型进行限制。
- 当对元素使用简单类型约束时,该元素内部不能包含子元素,只能包含符合类型要求的文本内容。
- 日期时间类型的格式有严格要求,比如date类型必须是yyyy-MM-dd格式,否则XML校验会失败。
XML_Schema内置类型简单类型XML约束修改时间:2026-06-04 03:39:01