在C++里,浮点数在内存中遵循IEEE 754标准存储,本身不存在补码的概念,我们常说的原始二进制形式就是它在内存中的实际字节序列。要实现将浮点数以原始二进制形式存入文件且不失真,核心是直接读取其在内存中的字节数据,避免任何数值转换带来的精度损失。

浮点数内存存储基础
单精度float占4字节,双精度double占8字节,它们的内存布局由符号位、指数位、尾数位组成。如果我们用文本形式存储浮点数,比如把3.14159转成字符串写入文件,读取时再转回浮点数,就可能出现精度丢失。只有直接存储内存中的原始字节,才能保证数据完全还原。
获取浮点数原始二进制数据的方法
方法一:指针强制转换
通过把浮点数指针转换为字符指针,直接访问其内存字节。这种方式简单直接,但需要注意类型转换的合法性,避免未定义行为。
#include <iostream>
#include <fstream>
#include <cstring>
int main() {
double num = 3.141592653589793;
// 将double指针转换为char指针,指向第一个字节
char* byte_ptr = reinterpret_cast<char*>(&num);
// 打开文件,以二进制模式写入
std::ofstream out_file("float_data.bin", std::ios::binary);
if (!out_file) {
std::cerr << "文件打开失败" << std::endl;
return 1;
}
// 写入8字节的原始数据
out_file.write(byte_ptr, sizeof(double));
out_file.close();
// 读取文件验证
double read_num;
std::ifstream in_file("float_data.bin", std::ios::binary);
if (!in_file) {
std::cerr << "文件读取失败" << std::endl;
return 1;
}
in_file.read(reinterpret_cast<char*>(&read_num), sizeof(double));
in_file.close();
std::cout << "原始数值: " << num << std::endl;
std::cout << "读取数值: " << read_num << std::endl;
// 对比两个数值是否完全一致
if (std::memcmp(&num, &read_num, sizeof(double)) == 0) {
std::cout << "数据完全一致,无失真" << std::endl;
}
return 0;
}
方法二:使用联合体(Union)
联合体所有成员共享同一块内存空间,我们可以利用这个特性获取浮点数的原始字节,这种方式更符合C++的类型双关规则,可读性更好。
#include <iostream>
#include <fstream>
#include <cstring>
union FloatUnion {
float f_value;
char bytes[sizeof(float)];
};
union DoubleUnion {
double d_value;
char bytes[sizeof(double)];
};
int main() {
FloatUnion fu;
fu.f_value = 2.71828f; // 单精度浮点数
std::ofstream out_file("float_single.bin", std::ios::binary);
out_file.write(fu.bytes, sizeof(float));
out_file.close();
// 读取验证
FloatUnion fu_read;
std::ifstream in_file("float_single.bin", std::ios::binary);
in_file.read(fu_read.bytes, sizeof(float));
in_file.close();
std::cout << "原始单精度数值: " << fu.f_value << std::endl;
std::cout << "读取单精度数值: " << fu_read.f_value << std::endl;
if (std::memcmp(fu.bytes, fu_read.bytes, sizeof(float)) == 0) {
std::cout << "单精度数据无失真" << std::endl;
}
return 0;
}
方法三:使用memcpy函数
memcpy是标准库提供的内存拷贝函数,它可以安全地将浮点数的内存数据拷贝到字符数组中,避免指针转换可能带来的未定义行为,是更推荐的安全写法。
#include <iostream>
#include <fstream>
#include <cstring>
int main() {
double origin_num = 123.456789012345;
char raw_bytes[sizeof(double)];
// 将浮点数的内存数据拷贝到字符数组
std::memcpy(raw_bytes, &origin_num, sizeof(double));
// 写入文件
std::ofstream out("data.bin", std::ios::binary);
out.write(raw_bytes, sizeof(double));
out.close();
// 读取并还原
double restored_num;
std::ifstream in("data.bin", std::ios::binary);
char read_bytes[sizeof(double)];
in.read(read_bytes, sizeof(double));
std::memcpy(&restored_num, read_bytes, sizeof(double));
in.close();
std::cout << "原始值: " << origin_num << std::endl;
std::cout << "还原值: " << restored_num << std::endl;
if (origin_num == restored_num) {
std::cout << "数据完全还原,无精度损失" << std::endl;
}
return 0;
}
注意事项
- 打开文件时必须指定
std::ios::binary二进制模式,否则系统可能会对换行符等进行转换,破坏原始字节数据。 - 写入和读取的浮点数类型必须一致,比如写入的是double,读取时也必须用double类型接收,否则会导致数据解析错误。
- 不同架构的CPU可能存在字节序(大小端)差异,如果文件需要在不同架构的设备间传输,需要额外处理字节序问题,同一设备读写则不需要考虑。
- 不要尝试对浮点数做所谓的补码转换,浮点数本身不采用补码存储,直接存储其原始内存字节就是最准确的方式。