Scala标准库的scala.xml包提供了完整的XML处理能力,无需引入任何第三方依赖,就可以直接对XML字符串进行解析、遍历、修改等操作,核心的解析逻辑由scala.xml.XML类承载,能够满足大部分日常开发中的XML处理需求。
基础解析:将XML字符串转为XML节点
最直接的方式是使用scala.xml.XML.loadString方法,该方法接收一个XML格式的字符串,返回对应的Elem类型的根节点对象,后续的所有操作都基于这个节点展开。
首先需要导入scala.xml包下的相关类:
import scala.xml.XML import scala.xml.Elem import scala.xml.Node import scala.xml.NodeSeq
解析一个简单的XML字符串示例:
// 待解析的XML字符串 val xmlStr = "<user><name>张三</name><age>25</age><city>北京</city></user>" // 解析字符串得到根节点 val rootNode: Elem = XML.loadString(xmlStr) // 打印根节点内容 println(rootNode)
上述代码执行后会输出原始的XML结构,说明解析成功,rootNode就是整个XML文档的根节点对象。
遍历XML节点与提取内容
解析完成后,我们可以通过节点的方法提取对应的子节点内容、属性等信息,常用的操作有以下几种:
提取子节点文本
使用操作符可以获取指定名称的子节点,返回的是NodeSeq类型,再通过text方法获取节点的文本内容。
// 获取name子节点的文本 val name: String = (rootNode "name").text // 获取age子节点的文本 val age: String = (rootNode "age").text // 获取city子节点的文本 val city: String = (rootNode "city").text println(s"姓名:$name,年龄:$age,城市:$city")
提取节点属性
如果XML节点带有属性,可以通过@操作符获取属性值,同样返回字符串类型。
先构造一个带属性的XML字符串:
val xmlWithAttr = "<user id="1001" status="active"><name>李四</name><role>管理员</role></user>" val attrRoot: Elem = XML.loadString(xmlWithAttr) // 获取id属性 val userId: String = (attrRoot "@id").text // 获取status属性 val userStatus: String = (attrRoot "@status").text println(s"用户ID:$userId,状态:$userStatus")
遍历嵌套XML结构
当XML存在多层嵌套时,可以连续使用操作符逐层获取子节点,也可以使用\操作符直接递归查找所有层级的指定名称节点。
嵌套XML示例:
val nestedXml = """
<class>
<student>
<id>1</id>
<name>王五</name>
<scores>
<math>90</math>
<english>85</english>
</scores>
</student>
<student>
<id>2</id>
<name>赵六</name>
<scores>
<math>88</math>
<english>92</english>
</scores>
</student>
</class>
"""
val classNode: Elem = XML.loadString(nestedXml)
// 逐层获取第一个学生的数学成绩
val firstMathScore = (classNode "student" "scores" "math").text
// 递归查找所有math节点
val allMathScores = (classNode \ "math").map(_.text)
println(s"第一个学生数学成绩:$firstMathScore")
println(s"所有学生数学成绩:${allMathScores.mkString(",")}")
处理解析异常
如果传入的XML字符串格式不合法,XML.loadString会抛出SAXParseException异常,实际使用中需要做好异常处理。
val invalidXml = "<user><name>测试</user>" // 缺少闭合标签,格式错误
try {
val node = XML.loadString(invalidXml)
println(node)
} catch {
case e: org.xml.sax.SAXParseException =>
println(s"XML解析失败,错误信息:${e.getMessage}")
}
常见操作汇总
以下是scala.xml包中常用的操作对照表:
| 操作需求 | 实现方式 | 返回值类型 |
|---|---|---|
| 解析XML字符串 | XML.loadString(xmlStr) | Elem |
| 获取子节点 | root "节点名" | NodeSeq |
| 递归查找节点 | root \ "节点名" | NodeSeq |
| 获取节点文本 | node.text | String |
| 获取节点属性 | root "@属性名" | NodeSeq |
| 遍历子节点集合 | nodes.foreach(节点 => 操作) | Unit |
通过上述方法,就可以完全基于Scala标准库完成绝大多数XML字符串的解析需求,不需要额外引入第三方XML处理库,减少了项目的依赖复杂度。