C++内存模型是C++11标准新增的核心规范,它明确规定了多线程场景下程序中内存操作的执行顺序、可见性规则,以及不同线程之间操作的同步关系,从语言层面解决了跨平台多线程程序的行为不一致问题。在这之前,不同编译器对多线程代码的优化策略、不同CPU架构的内存重排规则差异,都会导致同一份多线程代码在不同环境下出现完全不同的执行结果。
C++内存模型的核心基础概念
数据竞争
数据竞争是指两个或多个线程同时访问同一个内存位置,其中至少有一个是写操作,且这些访问之间没有同步关系。数据竞争会导致未定义行为,是多线程程序出现bug的主要原因之一。比如下面的代码就存在数据竞争:
#include <thread>
#include <iostream>
int shared_var = 0;
void write_func() {
shared_var = 1; // 写操作
}
void read_func() {
std::cout << shared_var << std::endl; // 读操作
}
int main() {
std::thread t1(write_func);
std::thread t2(read_func);
t1.join();
t2.join();
return 0;
}
这段代码中,线程t1写shared_var,线程t2读shared_var,两者没有同步机制,因此存在数据竞争,输出的结果是不确定的。
原子操作
原子操作是指不可分割的操作,要么完全执行,要么完全不执行,不会出现执行到一半被其他线程打断的情况。C++11提供了std::atomic模板来实现原子操作,对原子变量的读写操作默认就是原子的,不需要额外的锁保护。
内存序
内存序规定了原子操作周围的非原子内存访问的重排规则,以及不同线程之间操作的可见性顺序。C++定义了6种内存序:memory_order_relaxed、memory_order_consume、memory_order_acquire、memory_order_release、memory_order_acq_rel、memory_order_seq_cst,不同的内存序对应不同的同步强度和性能开销。
C++内存模型保证多线程安全的核心机制
happens-before规则
happens-before是C++内存模型中判断两个操作是否存在顺序关系的关键规则。如果操作A happens-before 操作B,那么A的执行结果对B是可见的,且A的执行顺序在逻辑上先于B。常见的happens-before关系包括:
- 同一个线程中,前面的操作happens-before后面的操作
- 对同一个原子变量的释放操作(
memory_order_release)happens-before后续对该变量的获取操作(memory_order_acquire) - 线程的启动操作happens-before新线程中的任何操作
- 线程的join操作happens-beforejoin之后主线程的后续操作
原子操作与内存序的协同
通过合理搭配原子操作和内存序,可以在无锁的情况下实现线程同步,避免数据竞争。比如使用释放-获取内存序实现简单的线程间通信:
#include <thread>
#include <atomic>
#include <iostream>
std::atomic<int> flag(0);
int data = 0;
// 写线程,准备好数据后通知读线程
void writer() {
data = 42; // 非原子写操作
// 释放操作,保证data的写操作在flag的写之前完成,且对后续获取操作可见
flag.store(1, std::memory_order_release);
}
// 读线程,等待写线程的通知后读取数据
void reader() {
// 获取操作,等待flag变为1,且能读到writer中释放操作之前的所有写操作结果
while (flag.load(std::memory_order_acquire) != 1) {
// 空循环等待
}
std::cout << data << std::endl; // 这里一定能读到42
}
int main() {
std::thread t1(writer);
std::thread t2(reader);
t1.join();
t2.join();
return 0;
}
上面的代码中,flag.store(1, std::memory_order_release)是释放操作,flag.load(std::memory_order_acquire)是获取操作,根据happens-before规则,释放操作happens-before获取操作,因此writer中data = 42的操作结果对reader是可见的,不会出现读到未初始化data的情况。
顺序一致内存序的强保证
如果对同步要求更高,可以使用memory_order_seq_cst内存序,这是默认的内存序,它保证所有使用顺序一致内存序的原子操作有一个全局一致的执行顺序,所有线程看到的这些操作的顺序都是相同的,能最大程度避免多线程下的可见性问题,但性能开销也相对更高。
#include <thread>
#include <atomic>
#include <iostream>
std::atomic<int> counter(0);
void increment() {
for (int i = 0; i < 1000; ++i) {
// 默认使用memory_order_seq_cst内存序
counter++;
}
}
int main() {
std::thread t1(increment);
std::thread t2(increment);
t1.join();
t2.join();
// 最终counter一定是2000,不会出现数据竞争导致的结果错误
std::cout << counter << std::endl;
return 0;
}
常见使用注意事项
首先,不要对普通变量使用内存序相关的操作,内存序只对原子变量的原子操作生效,普通变量的读写即使搭配内存序也无法保证线程安全。其次,不要过度使用最强的顺序一致内存序,在明确同步需求的情况下,使用更弱的内存序可以获得更好的性能。最后,要注意避免死锁和无锁编程中的ABA问题,内存模型解决的是可见性和重排问题,不会自动处理这些逻辑层面的并发问题。