c++ 正则表达式怎么用 c++ regex库匹配实例

来源：AI智能体作者：落伍者头衔：草根站长

导读：本期聚焦于小伙伴创作的《c++ 正则表达式怎么用 c++ regex库匹配实例》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《c++ 正则表达式怎么用 c++ regex库匹配实例》有用，将其分享出去将是对创作者最好的鼓励。

c++标准库从c++11开始引入了regex头文件，提供了完整的正则表达式支持，开发者可以直接使用相关类和函数完成字符串的模式匹配、提取、替换等操作，不需要依赖第三方库。regex库的核心组件包括正则表达式对象、匹配结果对象，以及三个核心匹配函数，下面会逐一介绍并结合实例说明用法。

c++ regex库核心组件

1. 核心类

std::regex：用来存储编译后的正则表达式规则，构造时需要传入符合语法的正则字符串，如果正则语法错误会抛出std::regex_error异常。

std::smatch：用来存储匹配的结果，是std::match_results<std::string::const_iterator>的别名，匹配成功后可以通过下标获取匹配到的子串。

2. 核心函数

regex_match：判断整个字符串是否完全匹配正则表达式，只有字符串全部符合规则才返回true。
regex_search：在字符串中搜索是否存在符合正则规则的子串，只要找到一处匹配就返回true。
regex_replace：根据正则规则匹配字符串中的内容，并替换为指定的新内容，返回替换后的新字符串。

基础匹配实例：校验手机号格式

手机号通常是11位数字，且以1开头，第二位一般是3-9的数字，我们可以用regex_match实现格式校验。

#include <iostream>
#include <regex>
#include <string>

bool check_phone(const std::string& phone) {
    // 正则规则：1开头，第二位是3-9，后面跟9位数字，总长度11位
    std::regex phone_regex("^1[3-9]\d{9}$");
    // 使用regex_match校验整个字符串是否匹配
    return std::regex_match(phone, phone_regex);
}

int main() {
    std::string test1 = "13812345678";
    std::string test2 = "12812345678";
    std::string test3 = "1381234567";

    std::cout << test1 << " 校验结果：" << (check_phone(test1) ? "合法" : "不合法") << std::endl;
    std::cout << test2 << " 校验结果：" << (check_phone(test2) ? "合法" : "不合法") << std::endl;
    std::cout << test3 << " 校验结果：" << (check_phone(test3) ? "合法" : "不合法") << std::endl;
    return 0;
}

运行后输出结果如下：

13812345678 校验结果：合法
12812345678 校验结果：不合法
1381234567 校验结果：不合法

子串提取实例：提取日志中的时间和内容

假设我们有固定格式的日志字符串，格式为[时间] 日志内容，需要提取出时间和具体内容，可以用regex_search配合捕获组实现。

#include <iostream>
#include <regex>
#include <string>

int main() {
    std::string log = "[2024-05-20 14:30:00] 用户登录成功";
    // 正则规则：两个捕获组，第一个匹配时间，第二个匹配日志内容
    std::regex log_regex("\[(.*?)\] (.*)");
    std::smatch match_result;

    if (std::regex_search(log, match_result, log_regex)) {
        // match_result[0]是完整匹配结果，match_result[1]是第一个捕获组内容，match_result[2]是第二个
        std::cout << "完整匹配：" << match_result[0] << std::endl;
        std::cout << "提取的时间：" << match_result[1] << std::endl;
        std::cout << "提取的日志内容：" << match_result[2] << std::endl;
    } else {
        std::cout << "未匹配到符合格式的日志" << std::endl;
    }
    return 0;
}

运行后输出结果如下：

完整匹配：[2024-05-20 14:30:00] 用户登录成功
提取的时间：2024-05-20 14:30:00
提取的日志内容：用户登录成功

替换实例：批量替换字符串中的敏感词

如果我们需要将字符串中的指定敏感词替换为星号，可以用regex_replace实现，不需要手动遍历字符串。

#include <iostream>
#include <regex>
#include <string>

int main() {
    std::string content = "这是一段测试内容，包含敏感词abc和敏感词def，需要处理";
    // 正则规则：匹配abc或者def
    std::regex sensitive_regex("abc|def");
    // 替换为三个星号，返回新的字符串，原字符串不会被修改
    std::string new_content = std::regex_replace(content, sensitive_regex, "***");

    std::cout << "原内容：" << content << std::endl;
    std::cout << "替换后内容：" << new_content << std::endl;
    return 0;
}

运行后输出结果如下：

原内容：这是一段测试内容，包含敏感词abc和敏感词def，需要处理
替换后内容：这是一段测试内容，包含敏感词***和敏感词***，需要处理

使用注意事项

c++正则中的反斜杠需要转义，比如匹配数字d需要写成\d，匹配单词边界b需要写成\b。
如果正则规则是固定不变的，建议将std::regex对象定义为静态或者全局变量，避免重复编译正则带来的性能损耗。
regex_match要求整个字符串完全匹配，regex_search只要存在子串匹配即可，使用时需要根据需求选择对应的函数。
如果匹配的中文出现乱码，需要确认源文件的编码格式，以及字符串是否使用了正确的宽字符类型，必要时可以使用std::wregex处理宽字符字符串。

c++_regex 正则表达式 regex_match regex_search regex_replace修改时间：2026-06-16 04:09:33

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。