C#如何使用XmlReader流式读取大型XML文件

来源：语言推理作者：深圳GEO公司头衔：草根站长

导读：本期聚焦于小伙伴创作的《C#如何使用XmlReader流式读取大型XML文件》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《C#如何使用XmlReader流式读取大型XML文件》有用，将其分享出去将是对创作者最好的鼓励。

在C#开发中处理XML文件时，面对体积达到几百MB甚至GB级别的大型XML文件，使用XmlDocument或者XDocument等DOM类解析会直接把整个文件内容加载到内存中，很容易引发内存溢出异常。而XmlReader作为C#提供的流式XML读取器，采用只进只读的方式逐节点处理XML内容，不需要将整个文件加载到内存，非常适合处理大型XML文件的场景。

XmlReader的核心特性

XmlReader是System.Xml命名空间下的一个抽象类，它的核心特性包括：

流式读取：按节点顺序逐个读取XML内容，不会缓存整个文档
只读访问：只能读取XML内容，不能修改XML结构
轻量高效：内存占用极低，处理大文件时性能优势明显
支持验证：可以配合XmlSchemaSet对XML进行结构验证

创建XmlReader实例

使用XmlReader前需要先创建实例，通常我们通过XmlReader.Create方法创建，该方法支持从文件路径、流、文本读取器等来源创建读取器，还可以配置读取参数。

基础的创建方式如下：

using System.Xml;

// 从文件路径创建XmlReader
using (XmlReader reader = XmlReader.Create("large_data.xml"))
{
    // 读取操作逻辑
}

// 从文件流创建XmlReader
using (FileStream fs = new FileStream("large_data.xml", FileMode.Open))
using (XmlReader reader = XmlReader.Create(fs))
{
    // 读取操作逻辑
}

如果需要配置读取行为，比如忽略注释、忽略空白节点，可以传入XmlReaderSettings对象：

using System.Xml;

XmlReaderSettings settings = new XmlReaderSettings();
// 忽略注释节点
settings.IgnoreComments = true;
// 忽略空白节点
settings.IgnoreWhitespace = true;

using (XmlReader reader = XmlReader.Create("large_data.xml", settings))
{
    // 读取操作逻辑
}

使用XmlReader遍历XML节点

XmlReader提供了多个方法用于遍历和读取节点，最常用的是Read方法，该方法会将读取器前进到下一个节点，返回true表示还有节点可读，返回false表示已经到达文件末尾。

我们可以通过NodeType属性判断当前节点的类型，常见的节点类型包括：

节点类型	说明
XmlNodeType.Element	开始元素标签，比如<user>
XmlNodeType.EndElement	结束元素标签，比如</user>
XmlNodeType.Text	元素的文本内容
XmlNodeType.Attribute	元素的属性
XmlNodeType.XmlDeclaration	XML声明节点

下面是一个遍历XML所有节点并输出节点类型、名称、值的示例：

using System;
using System.Xml;

class Program
{
    static void Main()
    {
        using (XmlReader reader = XmlReader.Create("test.xml"))
        {
            while (reader.Read())
            {
                Console.WriteLine($"节点类型: {reader.NodeType}, 名称: {reader.Name}, 值: {reader.Value}");
            }
        }
    }
}

读取元素内容和属性

实际开发中我们更多需要读取具体元素的内容和属性，XmlReader提供了多个便捷方法：

读取元素文本内容

当定位到开始元素节点后，可以使用ReadElementContentAsString方法直接读取该元素的文本内容，该方法会自动前进到结束元素节点之后。

using System;
using System.Xml;

class Program
{
    static void Main()
    {
        // 假设test.xml内容为 <?xml version="1.0"?><root><name>张三</name><age>25</age></root>
        using (XmlReader reader = XmlReader.Create("test.xml"))
        {
            while (reader.Read())
            {
                if (reader.NodeType == XmlNodeType.Element && reader.Name == "name")
                {
                    // 读取name元素的文本内容
                    string name = reader.ReadElementContentAsString();
                    Console.WriteLine($"姓名: {name}");
                }
                if (reader.NodeType == XmlNodeType.Element && reader.Name == "age")
                {
                    // 读取age元素的文本内容并转换为整数
                    int age = reader.ReadElementContentAsInt();
                    Console.WriteLine($"年龄: {age}");
                }
            }
        }
    }
}

读取元素属性

如果元素包含属性，可以先通过MoveToFirstAttribute方法移动到第一个属性，再通过MoveToNextAttribute方法遍历所有属性，使用GetAttribute方法可以直接获取指定名称的属性值。

using System;
using System.Xml;

class Program
{
    static void Main()
    {
        // 假设test.xml内容为 <?xml version="1.0"?><user id="1001" type="admin"><name>李四</name></user>
        using (XmlReader reader = XmlReader.Create("test.xml"))
        {
            while (reader.Read())
            {
                if (reader.NodeType == XmlNodeType.Element && reader.Name == "user")
                {
                    // 直接获取指定属性
                    string id = reader.GetAttribute("id");
                    string type = reader.GetAttribute("type");
                    Console.WriteLine($"用户ID: {id}, 类型: {type}");

                    // 遍历所有属性
                    if (reader.MoveToFirstAttribute())
                    {
                        do
                        {
                            Console.WriteLine($"属性名: {reader.Name}, 属性值: {reader.Value}");
                        } while (reader.MoveToNextAttribute());
                        // 移动回元素节点
                        reader.MoveToElement();
                    }
                }
            }
        }
    }
}

处理大型XML文件的完整示例

假设我们有一个大小为2GB的用户数据XML文件，结构如下，需要提取所有用户的基本信息：

<?xml version="1.0" encoding="utf-8"?>
<users>
<user id="1001">
    <name>张三</name>
    <age>25</age>
    <email>zhangsan@ipipp.com</email>
</user>
<user id="1002">
    <name>李四</name>
    <age>28</age>
    <email>lisi@ipipp.com</email>
</user>
<!-- 百万级用户数据 -->
</users>

使用XmlReader流式读取的完整代码如下：

using System;
using System.Xml;

class Program
{
    static void Main()
    {
        XmlReaderSettings settings = new XmlReaderSettings();
        // 忽略注释和空白节点，提升处理效率
        settings.IgnoreComments = true;
        settings.IgnoreWhitespace = true;

        using (XmlReader reader = XmlReader.Create("large_users.xml", settings))
        {
            string currentUserId = null;
            string currentName = null;
            string currentAge = null;
            string currentEmail = null;

            while (reader.Read())
            {
                switch (reader.NodeType)
                {
                    case XmlNodeType.Element:
                        // 遇到user开始标签，获取id属性
                        if (reader.Name == "user")
                        {
                            currentUserId = reader.GetAttribute("id");
                        }
                        // 遇到name开始标签，读取内容
                        else if (reader.Name == "name")
                        {
                            currentName = reader.ReadElementContentAsString();
                        }
                        // 遇到age开始标签，读取内容
                        else if (reader.Name == "age")
                        {
                            currentAge = reader.ReadElementContentAsString();
                        }
                        // 遇到email开始标签，读取内容
                        else if (reader.Name == "email")
                        {
                            currentEmail = reader.ReadElementContentAsString();
                        }
                        break;
                    case XmlNodeType.EndElement:
                        // 遇到user结束标签，说明一个用户数据读取完成
                        if (reader.Name == "user")
                        {
                            Console.WriteLine($"用户ID: {currentUserId}, 姓名: {currentName}, 年龄: {currentAge}, 邮箱: {currentEmail}");
                            // 重置临时变量
                            currentUserId = null;
                            currentName = null;
                            currentAge = null;
                            currentEmail = null;
                        }
                        break;
                }
            }
        }
    }
}

注意事项

使用XmlReader时需要注意以下几点：

XmlReader实例需要放在using语句中，确保使用完毕后释放资源
ReadElementContentAsXXX系列方法会将读取器移动到当前元素的结束标签之后，不需要额外调用Read方法
读取属性后如果需要回到元素节点操作，要调用MoveToElement方法
XmlReader是只进的，无法回溯已经读取过的节点，如果需要重复访问节点，需要自己缓存相关数据

C#XmlReader XML解析流式读取修改时间：2026-06-27 06:30:47

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。