XML简单类型定义是XML Schema(XSD)规范中的核心组成部分,主要用来对XML文档中元素和属性的取值进行约束,明确数据的基础格式和允许的取值范围,保障XML数据的规范性和一致性。

XML简单类型的基本概念
XML简单类型指的是不包含子元素和属性的数据类型,对应的元素或属性只能包含文本值。与之相对的是复杂类型,复杂类型可以包含子元素和属性。简单类型的定义只能基于其他简单类型派生,不能直接包含子元素结构。
简单类型的定义通常出现在XSD文件中,通过<simpleType>标签来声明,它可以限制数据的格式、长度、取值范围等。比如我们可以定义一个简单类型,要求对应的元素值只能是1到100之间的整数。
常见的内置XML简单类型
XML Schema规范已经预定义了很多常用的简单类型,开发者可以直接使用,不需要重复定义。常见的内置简单类型如下:
- 字符串相关:string(任意字符串)、normalizedString(不包含换行和制表符的字符串)、token(去除首尾空白且不包含多余空白的字符串)
- 数值相关:integer(整数)、int(32位整数)、float(单精度浮点数)、double(双精度浮点数)、decimal(高精度十进制数)
- 日期时间相关:date(日期,格式为YYYY-MM-DD)、time(时间,格式为HH:MM:SS)、dateTime(日期时间组合)
- 其他常用类型:boolean(布尔值,取值为true、false、1、0)、anyURI(URI地址格式)、base64Binary(Base64编码的二进制数据)
自定义XML简单类型的方法
如果内置的简单类型无法满足需求,我们可以基于已有的简单类型派生出新的自定义简单类型,常见的派生方式包括限制派生和列表派生。
通过限制派生自定义简单类型
限制派生是在已有简单类型的基础上,添加更多的约束条件,比如限制取值范围、长度、模式匹配等。下面的示例定义了一个限制年龄为1到120之间整数的简单类型:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<!-- 自定义年龄简单类型,基于integer类型,限制取值范围1-120 -->
<xs:simpleType name="ageType">
<xs:restriction base="xs:integer">
<xs:minInclusive value="1"/>
<xs:maxInclusive value="120"/>
</xs:restriction>
</xs:simpleType>
<!-- 使用自定义的年龄类型定义元素 -->
<xs:element name="person">
<xs:complexType>
<xs:sequence>
<xs:element name="age" type="ageType"/>
<xs:element name="name" type="xs:string"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
上面的XSD中,ageType是基于xs:integer的限制派生类型,要求取值必须在1到120之间,包含边界值。如果XML文档中age元素的值不在这个范围,就会校验失败。
通过模式匹配定义字符串格式类型
如果需要限制字符串的格式,比如手机号、邮箱格式,可以使用<xs:pattern>标签配合正则表达式来约束。下面的示例定义了一个匹配国内手机号格式的简单类型:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<!-- 自定义手机号简单类型,匹配1开头,第二位是3-9,共11位数字 -->
<xs:simpleType name="phoneType">
<xs:restriction base="xs:string">
<xs:pattern value="1[3-9]d{9}"/>
<xs:length value="11"/>
</xs:restriction>
</xs:simpleType>
<xs:element name="contact">
<xs:complexType>
<xs:sequence>
<xs:element name="phone" type="phoneType"/>
<xs:element name="username" type="xs:string"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
列表类型的定义
列表类型可以让元素的值包含多个同类型的简单类型值,值之间用空白分隔。下面的示例定义了一个整数列表的简单类型:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<!-- 自定义整数列表简单类型 -->
<xs:simpleType name="intListType">
<xs:list itemType="xs:integer"/>
</xs:simpleType>
<xs:element name="scores" type="intListType"/>
</xs:schema>
对应的合法XML元素值可以是<scores>90 85 95 88</scores>,多个整数之间用空白分隔。
简单类型的使用示例
下面是一个完整的XSD文件和对应的合法XML文件示例,展示自定义简单类型的实际使用:
XSD文件内容
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.ipipp.com/user"
xmlns:tns="http://www.ipipp.com/user"
elementFormDefault="qualified">
<!-- 自定义用户ID类型,1-999999的整数 -->
<xs:simpleType name="userIdType">
<xs:restriction base="xs:integer">
<xs:minInclusive value="1"/>
<xs:maxInclusive value="999999"/>
</xs:restriction>
</xs:simpleType>
<!-- 自定义邮箱类型,匹配邮箱格式 -->
<xs:simpleType name="emailType">
<xs:restriction base="xs:string">
<xs:pattern value="[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}"/>
</xs:restriction>
</xs:simpleType>
<xs:element name="user">
<xs:complexType>
<xs:sequence>
<xs:element name="userId" type="tns:userIdType"/>
<xs:element name="email" type="tns:emailType"/>
<xs:element name="registerDate" type="xs:date"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
合法的XML文件内容
<?xml version="1.0" encoding="UTF-8"?>
<tns:user xmlns:tns="http://www.ipipp.com/user"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.ipipp.com/user user.xsd">
<tns:userId>1001</tns:userId>
<tns:email>test@ipipp.com</tns:email>
<tns:registerDate>2024-05-20</tns:registerDate>
</tns:user>
上面的XML文件中,userId的值1001在1到999999之间,email符合邮箱格式,registerDate符合日期格式,因此能够通过XSD的校验。
简单类型定义的注意事项
- 简单类型不能直接包含子元素,如果需要包含子元素,需要定义为复杂类型
- 自定义简单类型的名称在整个XSD文件中需要唯一,不能和已有的类型名称重复
- 限制派生的约束条件需要和基类型兼容,比如不能给string类型添加数值范围的限制
- 列表类型的元素值之间只能用空白分隔,不能用其他符号分隔
XML简单类型定义XSD数据类型约束XML_schema修改时间:2026-06-16 12:12:21