在c++开发场景中,经常会遇到接口返回Base64编码的PDF文件内容的情况,此时需要先将Base64字符串解码为原始二进制数据,再将二进制数据写入本地文件,才能得到可以正常打开的PDF文件。下面详细介绍完整的实现步骤和相关注意事项。

Base64解码原理
Base64是一种基于64个可打印字符来表示二进制数据的编码方式,它将每3个字节的二进制数据转换为4个Base64字符。解码过程就是编码的逆操作,需要将4个Base64字符还原为3个字节的二进制数据。标准的Base64字符集包含A-Z、a-z、0-9、+和/,末尾可能用=作为填充字符。
实现步骤
1. 实现Base64解码函数
首先需要编写Base64解码的核心函数,输入Base64编码的字符串,输出解码后的二进制字节数组。解码过程需要先构建Base64字符到索引的映射表,然后按规则处理输入的字符串,跳过非Base64字符,处理填充字符,最终得到原始二进制数据。
#include <iostream>
#include <string>
#include <vector>
#include <fstream>
#include <stdexcept>
// Base64字符集
static const std::string base64_chars =
"ABCDEFGHIJKLMNOPQRSTUVWXYZ"
"abcdefghijklmnopqrstuvwxyz"
"0123456789+/";
// 判断字符是否为Base64字符
static inline bool is_base64(unsigned char c) {
return (isalnum(c) || (c == '+') || (c == '/'));
}
// Base64解码函数
std::vector<unsigned char> base64_decode(const std::string &encoded_string) {
int in_len = encoded_string.size();
int i = 0;
int j = 0;
int in_ = 0;
unsigned char char_array_4[4], char_array_3[3];
std::vector<unsigned char> ret;
while (in_len-- && (encoded_string[in_] != '=') && is_base64(encoded_string[in_])) {
char_array_4[i++] = encoded_string[in_]; in_++;
if (i == 4) {
for (i = 0; i <4; i++)
char_array_4[i] = base64_chars.find(char_array_4[i]);
char_array_3[0] = (char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4);
char_array_3[1] = ((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2);
char_array_3[2] = ((char_array_4[2] & 0x3) << 6) + char_array_4[3];
for (i = 0; (i < 3); i++)
ret.push_back(char_array_3[i]);
i = 0;
}
}
if (i) {
for (j = 0; j < i; j++)
char_array_4[j] = base64_chars.find(char_array_4[j]);
for (j = i; j <4; j++)
char_array_4[j] = 0;
char_array_3[0] = (char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4);
char_array_3[1] = ((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2);
char_array_3[2] = ((char_array_4[2] & 0x3) << 6) + char_array_4[3];
for (j = 0; (j < i - 1); j++) ret.push_back(char_array_3[j]);
}
return ret;
}
2. 二进制写入PDF文件
解码得到二进制数据后,需要以二进制模式打开文件,将解码后的数据写入文件。这里要注意必须使用二进制模式打开,否则可能会出现换行符转换等问题,导致PDF文件损坏无法正常打开。
// 将二进制数据写入PDF文件
bool write_binary_to_pdf(const std::vector<unsigned char> &data, const std::string &file_path) {
// 以二进制写入模式打开文件
std::ofstream out_file(file_path, std::ios::binary);
if (!out_file.is_open()) {
std::cerr << "无法打开文件进行写入: " << file_path << std::endl;
return false;
}
// 写入二进制数据
out_file.write(reinterpret_cast<const char*>(data.data()), data.size());
out_file.close();
return true;
}
3. 完整调用示例
将解码和写入函数结合,就可以完成Base64字符串到PDF文件的还原,下面是完整的调用示例:
int main() {
// 示例Base64编码的PDF字符串,实际使用时替换为真实内容
std::string base64_pdf = "JVBERi0xLjQKMSAwIG9iago8PCAvVHlwZSAvQ2F0YWxvZyAvUGFnZXMgMiAwIFIgPj4KZW5kb2JqCjIgMCBvYmoKPDwgL1R5cGUgL1BhZ2VzIC9LaWRzIFszIDAgUl0gL0NvdW50IDEgPj4KZW5kb2JqCjMgMCBvYmoKPDwgL1R5cGUgL1BhZ2UgL1BhcmVudCAyIDAgUiAvTWVkaWFCb3ggWzAgMCA2MTIgNzkyXSAvQ29udGVudHMgNCAwIFIgL1Jlc291cmNlcyA8PCAvRm9udCA8PCAvRjEgNSAwIFIgPj4gPj4gPj4KZW5kb2JqCjQgMCBvYmoKPDwgL0xlbmd0aCA0NCA+PgpzdHJlYW0KQlQgL0YxIDEyIFRmIDEwMCA3MDAgVGQgKEhlbGxvIFdvcmxkKSBUIDoKZW5kc3RyZWFtCmVuZG9iago1IDAgb2JqCjw8IC9UeXBlIC9Gb250IC9TdWJ0eXBlIC9UeXBlMSAvQmFzZUZvbnQgL0hlbHZldGljYSA+PgpzdHJlYW0KZW5kc3RyZWFtCmVuZG9iagp4cmVmCjAgNgowMDAwMDAwMDAwIDY1NTM1IGYKMDAwMDAwMDAwOSAwMDAwMCBuCjAwMDAwMDAwNTggMDAwMDAgbgowMDAwMDAwMTE1IDAwMDAwIG4KMDAwMDAwMDI0NSAwMDAwMCBuCjAwMDAwMDAzMjAgMDAwMDAgbgp0cmFpbGVyCjw8IC9TaXplIDYgL1Jvb3QgMSAwIFIgPj4Kc3RhcnR4cmVmCjM3NwolJUVPRgo=";
// 解码Base64字符串
std::vector<unsigned char> pdf_data = base64_decode(base64_pdf);
if (pdf_data.empty()) {
std::cerr << "Base64解码失败" << std::endl;
return 1;
}
// 写入PDF文件
std::string output_path = "output.pdf";
if (write_binary_to_pdf(pdf_data, output_path)) {
std::cout << "PDF文件还原成功,保存路径: " << output_path << std::endl;
} else {
std::cerr << "PDF文件写入失败" << std::endl;
return 1;
}
return 0;
}
注意事项
- Base64字符串可能存在换行符或者空格等无关字符,解码前最好先过滤掉这些非Base64字符,避免解码错误。
- 写入文件时必须使用
std::ios::binary模式,否则Windows系统下可能会将换行符转换为回车换行,破坏PDF文件的二进制结构。 - 如果Base64字符串包含URL安全的字符集(将+替换为-,/替换为_),需要先将其转换回标准Base64字符集再进行解码。
- 解码后的二进制数据为空时,说明Base64字符串格式有误,需要先校验输入的字符串是否合法。