在C++中合并两个有序的文本文件,核心思路是类似归并排序的归并过程,依次读取两个文件的内容,比较当前行的大小后按顺序写入新文件,直到所有内容都处理完成。这种方法不需要把全部内容加载到内存中,适合处理大文件场景。

实现思路拆解
整个合并流程可以分为以下几个步骤:
- 打开两个待合并的有序源文件和一个用于写入的目标文件,检查文件是否成功打开
- 分别读取两个源文件的当前第一行内容,作为初始比较值
- 循环比较两个当前行的内容,将较小的那一行写入目标文件,然后读取该源文件的下一行
- 当其中一个文件的内容全部读取完成后,将另一个文件的剩余内容全部写入目标文件
- 关闭所有打开的文件,完成合并操作
核心代码实现
以下是完整的实现代码,假设两个源文件都是按行升序排列的文本文件,每行内容不包含换行符之外的特殊字符:
#include <iostream>
#include <fstream>
#include <string>
using namespace std;
int main() {
// 打开两个有序的源文件
ifstream file1("sorted_file1.txt");
ifstream file2("sorted_file2.txt");
// 打开目标文件,用于写入合并后的内容
ofstream outFile("merged_sorted_file.txt");
// 检查文件是否成功打开
if (!file1.is_open()) {
cerr << "无法打开第一个源文件" << endl;
return 1;
}
if (!file2.is_open()) {
cerr << "无法打开第二个源文件" << endl;
return 1;
}
if (!outFile.is_open()) {
cerr << "无法打开目标文件" << endl;
return 1;
}
// 读取两个文件的初始行
string line1, line2;
bool hasLine1 = getline(file1, line1);
bool hasLine2 = getline(file2, line2);
// 归并过程
while (hasLine1 && hasLine2) {
// 比较两行内容,写入较小的行
if (line1 <= line2) {
outFile << line1 << endl;
hasLine1 = getline(file1, line1);
} else {
outFile << line2 << endl;
hasLine2 = getline(file2, line2);
}
}
// 处理第一个文件的剩余内容
while (hasLine1) {
outFile << line1 << endl;
hasLine1 = getline(file1, line1);
}
// 处理第二个文件的剩余内容
while (hasLine2) {
outFile << line2 << endl;
hasLine2 = getline(file2, line2);
}
// 关闭所有文件
file1.close();
file2.close();
outFile.close();
cout << "两个有序文件合并完成" << endl;
return 0;
}
代码说明
代码中使用了ifstream和ofstream分别处理文件读取和写入,通过getline函数按行读取文件内容。比较逻辑使用字符串默认的<=运算符,会根据字典序比较两个字符串的大小,如果需要按数字大小排序,可以在读取后转换为对应数值类型再比较。
如果源文件的内容是按降序排列的,只需要把比较条件从line1 <= line2修改为line1 >= line2即可,其他逻辑不需要调整。
注意事项
- 合并前需要确认两个源文件本身是有序的,否则合并后的结果也不会是有序的
- 如果文件内容包含空行,
getline函数会读取到空字符串,排序逻辑依然生效 - 处理大文件时,这种逐行读取写入的方式不会占用过多内存,比一次性读取所有内容再排序的效率更高