在C++多线程开发中,条件变量是常用的线程同步工具,用于让线程等待某个条件成立后再继续执行。但虚假唤醒问题经常会导致程序出现不符合预期的行为,需要开发者采用正确的方式规避。

什么是虚假唤醒
虚假唤醒指的是线程调用条件变量的等待函数后,在没有其他线程调用唤醒函数(如notify_one、notify_all)的情况下,线程从等待状态返回的现象。这种情况在操作系统层面的线程调度中可能出现,属于正常现象,并不是程序错误。
如果开发者在等待条件变量后没有重新检查条件是否成立,直接执行后续逻辑,就可能导致程序处理错误的数据,引发逻辑bug。
虚假唤醒的示例问题
先看一段没有处理虚假唤醒的错误代码示例:
#include <iostream>
#include <thread>
#include <mutex>
#include <condition_variable>
#include <queue>
std::mutex mtx;
std::condition_variable cv;
std::queue<int> data_queue;
bool stop_flag = false;
// 生产者线程函数
void producer() {
for (int i = 0; i < 5; ++i) {
std::this_thread::sleep_for(std::chrono::milliseconds(100));
std::lock_guard<std::mutex> lock(mtx);
data_queue.push(i);
std::cout << "生产数据: " << i << std::endl;
cv.notify_one(); // 唤醒一个等待的消费者线程
}
// 生产完成后设置停止标志并唤醒所有线程
std::lock_guard<std::mutex> lock(mtx);
stop_flag = true;
cv.notify_all();
}
// 错误的消费者线程函数,未处理虚假唤醒
void wrong_consumer() {
while (true) {
std::unique_lock<std::mutex> lock(mtx);
// 直接等待,没有检查条件
cv.wait(lock);
// 这里没有重新检查队列是否有数据,直接取数据,可能出现虚假唤醒导致的错误
if (stop_flag && data_queue.empty()) {
break;
}
if (!data_queue.empty()) {
int data = data_queue.front();
data_queue.pop();
lock.unlock();
std::cout << "错误消费者处理数据: " << data << std::endl;
}
}
}
int main() {
std::thread prod(producer);
std::thread cons1(wrong_consumer);
std::thread cons2(wrong_consumer);
prod.join();
cons1.join();
cons2.join();
return 0;
}
上面的代码中,消费者线程在等待条件变量返回后,没有先检查队列是否有数据就直接判断退出条件,如果出现虚假唤醒,就可能在没有数据的情况下执行后续逻辑,甚至出现队列为空时调用front、pop的未定义行为。
等待谓词:避免虚假唤醒的最佳实践
C++的条件变量wait函数提供了一个重载版本,可以接收一个谓词(返回布尔值的函数或可调用对象),这个谓词就是等待谓词。其工作逻辑是:当线程被唤醒时,会先执行谓词检查,如果谓词返回true才继续往下执行,否则继续等待。这样就可以完美规避虚假唤醒的问题。
等待谓词版本wait的函数原型大致如下:
template<typename Predicate> void wait(std::unique_lock<std::mutex>& lock, Predicate pred);
其等效的逻辑是:
while (!pred()) {
wait(lock);
}
使用等待谓词的正确示例
我们把上面的消费者代码修改为使用等待谓词的方式:
#include <iostream>
#include <thread>
#include <mutex>
#include <condition_variable>
#include <queue>
std::mutex mtx;
std::condition_variable cv;
std::queue<int> data_queue;
bool stop_flag = false;
// 生产者线程函数,和之前一致
void producer() {
for (int i = 0; i < 5; ++i) {
std::this_thread::sleep_for(std::chrono::milliseconds(100));
std::lock_guard<std::mutex> lock(mtx);
data_queue.push(i);
std::cout << "生产数据: " << i << std::endl;
cv.notify_one();
}
std::lock_guard<std::mutex> lock(mtx);
stop_flag = true;
cv.notify_all();
}
// 正确的消费者线程函数,使用等待谓词
void correct_consumer() {
while (true) {
std::unique_lock<std::mutex> lock(mtx);
// 等待谓词:检查队列不为空或者停止标志为true
cv.wait(lock, []() {
return !data_queue.empty() || stop_flag;
});
// 再次检查停止条件
if (stop_flag && data_queue.empty()) {
break;
}
// 此时队列一定有数据,安全取出
int data = data_queue.front();
data_queue.pop();
lock.unlock(); // 提前释放锁,减少锁持有时间
std::cout << "正确消费者处理数据: " << data << std::endl;
}
}
int main() {
std::thread prod(producer);
std::thread cons1(correct_consumer);
std::thread cons2(correct_consumer);
prod.join();
cons1.join();
cons2.join();
return 0;
}
在上面的正确示例中,cv.wait(lock, []() { return !data_queue.empty() || stop_flag; });就是使用了等待谓词。当线程被唤醒时,会先执行lambda表达式检查条件:如果队列有数据或者停止标志为true,就继续执行后续逻辑;否则就继续等待,这样就完全避免了虚假唤醒带来的影响。
等待谓词的使用注意事项
- 谓词的逻辑要准确覆盖需要等待的条件,比如本例中需要等待队列有数据,或者收到停止信号,所以谓词中要同时判断这两个条件。
- 谓词中访问的共享变量(如
data_queue、stop_flag)必须在同一个互斥锁的保护下,因为wait函数会在等待时释放锁,被唤醒后会重新获取锁再执行谓词检查,保证数据的一致性。 - 如果等待的条件比较复杂,可以把谓词写成独立的函数,提高代码的可读性,比如:
bool is_data_ready() {
return !data_queue.empty() || stop_flag;
}
// 使用时直接传入函数名
cv.wait(lock, is_data_ready);
总结
虚假唤醒是C++多线程条件变量使用中不可避免的现象,最可靠的规避方式就是使用带等待谓词的wait函数。开发者在编写条件变量相关的同步代码时,应该养成使用等待谓词的习惯,避免因为虚假唤醒导致程序出现隐蔽的逻辑错误。同时要注意谓词的逻辑正确性,以及共享变量的互斥访问,保证多线程程序的正确性和健壮性。