c++标准库从c++11开始引入了regex头文件,提供了完整的正则表达式支持,开发者可以直接使用相关类和函数完成字符串的模式匹配、提取、替换等操作,不需要依赖第三方库。regex库的核心组件包括正则表达式对象、匹配结果对象,以及三个核心匹配函数,下面会逐一介绍并结合实例说明用法。

c++ regex库核心组件
1. 核心类
std::regex:用来存储编译后的正则表达式规则,构造时需要传入符合语法的正则字符串,如果正则语法错误会抛出std::regex_error异常。
std::smatch:用来存储匹配的结果,是std::match_results<std::string::const_iterator>的别名,匹配成功后可以通过下标获取匹配到的子串。
2. 核心函数
- regex_match:判断整个字符串是否完全匹配正则表达式,只有字符串全部符合规则才返回true。
- regex_search:在字符串中搜索是否存在符合正则规则的子串,只要找到一处匹配就返回true。
- regex_replace:根据正则规则匹配字符串中的内容,并替换为指定的新内容,返回替换后的新字符串。
基础匹配实例:校验手机号格式
手机号通常是11位数字,且以1开头,第二位一般是3-9的数字,我们可以用regex_match实现格式校验。
#include <iostream>
#include <regex>
#include <string>
bool check_phone(const std::string& phone) {
// 正则规则:1开头,第二位是3-9,后面跟9位数字,总长度11位
std::regex phone_regex("^1[3-9]\d{9}$");
// 使用regex_match校验整个字符串是否匹配
return std::regex_match(phone, phone_regex);
}
int main() {
std::string test1 = "13812345678";
std::string test2 = "12812345678";
std::string test3 = "1381234567";
std::cout << test1 << " 校验结果:" << (check_phone(test1) ? "合法" : "不合法") << std::endl;
std::cout << test2 << " 校验结果:" << (check_phone(test2) ? "合法" : "不合法") << std::endl;
std::cout << test3 << " 校验结果:" << (check_phone(test3) ? "合法" : "不合法") << std::endl;
return 0;
}
运行后输出结果如下:
13812345678 校验结果:合法 12812345678 校验结果:不合法 1381234567 校验结果:不合法
子串提取实例:提取日志中的时间和内容
假设我们有固定格式的日志字符串,格式为[时间] 日志内容,需要提取出时间和具体内容,可以用regex_search配合捕获组实现。
#include <iostream>
#include <regex>
#include <string>
int main() {
std::string log = "[2024-05-20 14:30:00] 用户登录成功";
// 正则规则:两个捕获组,第一个匹配时间,第二个匹配日志内容
std::regex log_regex("\[(.*?)\] (.*)");
std::smatch match_result;
if (std::regex_search(log, match_result, log_regex)) {
// match_result[0]是完整匹配结果,match_result[1]是第一个捕获组内容,match_result[2]是第二个
std::cout << "完整匹配:" << match_result[0] << std::endl;
std::cout << "提取的时间:" << match_result[1] << std::endl;
std::cout << "提取的日志内容:" << match_result[2] << std::endl;
} else {
std::cout << "未匹配到符合格式的日志" << std::endl;
}
return 0;
}
运行后输出结果如下:
完整匹配:[2024-05-20 14:30:00] 用户登录成功 提取的时间:2024-05-20 14:30:00 提取的日志内容:用户登录成功
替换实例:批量替换字符串中的敏感词
如果我们需要将字符串中的指定敏感词替换为星号,可以用regex_replace实现,不需要手动遍历字符串。
#include <iostream>
#include <regex>
#include <string>
int main() {
std::string content = "这是一段测试内容,包含敏感词abc和敏感词def,需要处理";
// 正则规则:匹配abc或者def
std::regex sensitive_regex("abc|def");
// 替换为三个星号,返回新的字符串,原字符串不会被修改
std::string new_content = std::regex_replace(content, sensitive_regex, "***");
std::cout << "原内容:" << content << std::endl;
std::cout << "替换后内容:" << new_content << std::endl;
return 0;
}
运行后输出结果如下:
原内容:这是一段测试内容,包含敏感词abc和敏感词def,需要处理 替换后内容:这是一段测试内容,包含敏感词***和敏感词***,需要处理
使用注意事项
- c++正则中的反斜杠需要转义,比如匹配数字d需要写成\d,匹配单词边界b需要写成\b。
- 如果正则规则是固定不变的,建议将
std::regex对象定义为静态或者全局变量,避免重复编译正则带来的性能损耗。 - regex_match要求整个字符串完全匹配,regex_search只要存在子串匹配即可,使用时需要根据需求选择对应的函数。
- 如果匹配的中文出现乱码,需要确认源文件的编码格式,以及字符串是否使用了正确的宽字符类型,必要时可以使用
std::wregex处理宽字符字符串。
c++_regex正则表达式regex_matchregex_searchregex_replace修改时间:2026-06-16 04:09:33