XML作为一种通用的数据交换格式,在Ruby开发中常被用于接口数据传输、配置文件存储等场景,掌握XML的解析与生成是Ruby开发者的必备技能。

Ruby处理XML的常用库
Ruby生态中有多个成熟的XML处理库,不同库的特性和适用场景有所差异,开发者可以根据需求选择:
- Nokogiri:目前最流行的Ruby XML/HTML处理库,解析速度快,API设计友好,支持XPath和CSS选择器,同时支持XML生成,适合大多数XML处理场景。
- REXML:Ruby标准库自带的XML处理库,无需额外安装,纯Ruby实现,跨平台性好,但解析速度相对较慢,适合对依赖有严格限制的场景。
- Ox:高性能的XML处理库,用C语言扩展实现,解析速度极快,适合处理大体积XML文件的场景。
使用Nokogiri解析XML
首先需要通过gem安装Nokogiri,执行命令gem install nokogiri即可完成安装。
以下是解析XML字符串的示例,假设我们有一个包含用户信息的XML数据:
require 'nokogiri'
# 待解析的XML字符串
xml_str = <?xml version="1.0" encoding="UTF-8"?>
<users>
<user id="1">
<name>张三</name>
<age>25</age>
<email>zhangsan@ipipp.com</email>
</user>
<user id="2">
<name>李四</name>
<age>28</age>
<email>lisi@ipipp.com</email>
</user>
</users>
# 解析XML
doc = Nokogiri::XML(xml_str)
# 使用XPath获取所有user节点
users = doc.xpath('//user')
users.each do |user|
# 获取user节点的id属性
user_id = user['id']
# 获取子节点内容
name = user.xpath('name').text
age = user.xpath('age').text
email = user.xpath('email').text
puts "用户ID:#{user_id},姓名:#{name},年龄:#{age},邮箱:#{email}"
end使用Nokogiri生成XML
Nokogiri也支持快速生成XML文档,以下是生成一个简单用户列表XML的示例:
require 'nokogiri'
# 创建XML文档
builder = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
xml.users do
xml.user(id: 1) do
xml.name '张三'
xml.age 25
xml.email 'zhangsan@ipipp.com'
end
xml.user(id: 2) do
xml.name '李四'
xml.age 28
xml.email 'lisi@ipipp.com'
end
end
end
# 输出生成的XML字符串
puts builder.to_xml使用REXML处理XML
由于REXML是Ruby标准库自带,无需额外安装,直接使用即可。以下是使用REXML解析XML的示例:
require 'rexml/document'
include REXML
# 待解析的XML字符串
xml_str = <?xml version="1.0" encoding="UTF-8"?>
<users>
<user id="1">
<name>张三</name>
<age>25</age>
<email>zhangsan@ipipp.com</email>
</user>
</users>
# 解析XML
doc = Document.new(xml_str)
# 获取根节点
root = doc.root
# 遍历所有user节点
root.each_element('user') do |user|
user_id = user.attributes['id']
name = user.elements['name'].text
age = user.elements['age'].text
email = user.elements['email'].text
puts "用户ID:#{user_id},姓名:#{name},年龄:#{age},邮箱:#{email}"
end使用REXML生成XML的示例如下:
require 'rexml/document'
include REXML
# 创建XML文档
doc = Document.new
# 添加XML声明
doc << XMLDecl.new('1.0', 'UTF-8')
# 创建根节点
root = Element.new('users')
doc.add_element(root)
# 添加第一个user节点
user1 = Element.new('user')
user1.add_attribute('id', '1')
name1 = Element.new('name')
name1.text = '张三'
user1.add_element(name1)
age1 = Element.new('age')
age1.text = '25'
user1.add_element(age1)
email1 = Element.new('email')
email1.text = 'zhangsan@ipipp.com'
user1.add_element(email1)
root.add_element(user1)
# 输出生成的XML
puts doc.to_s库的选择建议
如果是常规项目开发,优先选择Nokogiri,它的功能全面、使用便捷,能满足绝大多数XML处理需求。如果项目不允许引入第三方依赖,可以使用标准库的REXML。如果需要处理体积非常大的XML文件,对解析性能要求极高,可以选择Ox库。在实际使用中,还要注意XML的编码问题,尽量统一使用UTF-8编码,避免出现乱码情况。