XPath的substring-after()函数如何截取?

来源:开发教程作者:厦门程序员头衔:程序员
导读:本期聚焦于小伙伴创作的《XPath的substring-after()函数如何截取?》,敬请观看详情,探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《XPath的substring-after()函数如何截取?》有用,将其分享出去将是对创作者最好的鼓励。

XPath的substring-after()函数主要用于从目标字符串中,截取指定分隔字符串之后的所有内容,在处理格式固定的文本数据时非常实用,比如提取URL中的路径部分、拆分带固定前缀的标识内容等。

XPath的substring-after()函数如何截取?

substring-after()函数基本语法

该函数的基本语法格式如下:

substring-after(源字符串, 分隔字符串)

函数接收两个必填参数:第一个参数是要处理的原始字符串,第二个参数是作为截取分界点的分隔字符串。函数会返回源字符串中第一个出现的分隔字符串之后的所有字符,如果源字符串中不存在分隔字符串,则返回空字符串。

基础使用示例

假设我们有如下XML文档结构,需要提取书名中冒号之后的副标题部分:

<book>
    <title>XPath实战: 从入门到精通</title>
    <author>张三</author>
</book>

对应的XPath表达式和返回结果如下:

substring-after(/book/title, ": ")

上述表达式会返回从入门到精通,因为分隔字符串是: ,函数在源字符串XPath实战: 从入门到精通中找到第一个: 之后,截取了后续的所有内容。

不同场景的截取演示

场景1:提取URL中的路径部分

如果源字符串是完整的URL,需要提取域名之后的路径内容:

substring-after("https://ipipp.com/api/user/list", "ipipp.com")

返回结果为/api/user/list,分隔字符串匹配到第一个ipipp.com之后,截取了后续的所有字符。

场景2:分隔字符串不存在的情况

当源字符串中不存在指定的分隔字符串时,函数返回空字符串:

substring-after("hello world", "test")

上述表达式返回空字符串,因为hello world中不存在test这个分隔字符串。

场景3:分隔字符串多次出现的情况

函数只会匹配第一个出现的分隔字符串,截取第一次出现之后的内容:

substring-after("a-b-c-d", "-")

返回结果为b-c-d,而不是b,只会取第一个-之后的所有内容,不会重复匹配后续的分隔字符串。

结合节点使用的示例

在实际解析HTML或XML文档时,通常会结合节点路径使用该函数,比如解析如下HTML中的商品编号:

<div class="product">
    <span class="id">商品编号: P202405001</span>
    <span class="name">无线鼠标</span>
</div>

提取商品编号的XPath表达式如下:

substring-after(//span[@class="id"], "商品编号: ")

该表达式会先定位到class为id的span节点,获取其文本内容商品编号: P202405001,然后截取商品编号: 之后的内容,最终返回P202405001

使用注意事项

  • 分隔字符串的匹配是区分大小写的,比如substring-after("Hello", "h")会返回空字符串,因为源字符串中的h是大写,分隔字符串是小写,无法匹配。
  • 如果分隔字符串是空字符串,函数会返回整个源字符串,因为空字符串会匹配源字符串的开头位置。
  • 当源字符串或分隔字符串是节点引用时,会自动获取节点的字符串值进行处理,不需要额外做类型转换。

与其他字符串函数对比

XPath中还有substring-before()函数,和substring-after()逻辑相反,前者返回分隔字符串之前的内容,后者返回之后的内容。比如:

substring-before("a-b-c", "-")  # 返回a
substring-after("a-b-c", "-")   # 返回b-c

两者结合使用可以实现对字符串的灵活拆分,满足不同的数据提取需求。

XPathsubstring_afterXML解析路径表达式修改时间:2026-06-20 06:51:15

免责声明:​ 已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰,观点力求客观中立。本站旨在免费分享,内容仅供个人学习、研究或参考使用。若引用了第三方作品,版权归原作者所有。如内容涉及您的权益,请联系我们处理。
内容垂直聚焦
专注技术核心技术栏目,确保每篇文章深度聚焦于实用技能。从代码技巧到架构设计,为用户提供无干扰的纯技术知识沉淀,精准满足专业提升需求。
知识结构清晰
覆盖从开发到部署的全链路。AI、前端、编程、数据库、服务器、建站、系统层层递进,构建清晰学习路径,帮助用户系统化掌握开发与运维所需的核心技术。
深度技术解析
拒绝泛泛而谈,深入技术细节与实践难点。无论是数据库优化还是服务器配置,均结合真实场景与代码示例进行剖析,致力于提供可直接应用于工作的解决方案。
专业领域覆盖
精准对应开发生命周期。从前端界面到后端编程,从数据库操作到服务器运维,形成完整闭环,一站式满足全栈工程师和运维人员的技术需求。
即学即用高效
内容强调实操性,步骤清晰、代码完整。用户可根据教程直接复现和应用于自身项目,显著缩短从学习到实践的距离,快速解决开发中的具体问题。
持续更新保障
专注既定技术方向进行长期、稳定的内容输出。确保各栏目技术文章持续更新迭代,紧跟主流技术发展趋势,为用户提供经久不衰的学习价值。