PostgreSQL作为一款功能强大的开源关系型数据库,提供了丰富的字符串处理函数,其中REGEXP_REPLACE函数专门用于基于正则表达式的字符串替换操作,能够解决很多常规替换函数无法处理的复杂场景。

REGEXP_REPLACE函数基础语法
REGEXP_REPLACE函数的完整语法格式如下:
REGEXP_REPLACE(source_string, pattern, replacement_string [, start_position [, n [, flags]]])
各个参数的具体含义如下:
- source_string:需要进行替换操作的原始字符串,可以是字段名,也可以是具体的字符串常量
- pattern:用于匹配的正则表达式规则
- replacement_string:匹配到内容后用于替换的字符串
- start_position:可选参数,指定开始搜索的位置,默认值为1,即从字符串的第一个字符开始搜索
- n:可选参数,指定替换的次数,默认值为0,表示替换所有匹配到的内容
- flags:可选参数,用于设置正则匹配的规则标识,比如是否区分大小写、是否支持多行匹配等
常用flags参数说明
flags参数可以组合使用,常见的标识含义如下:
| 标识 | 含义 |
|---|---|
| i | 匹配时不区分大小写 |
| g | 全局匹配,替换所有符合规则的内容,默认如果不设置g,只会替换第一个匹配到的内容 |
| m | 多行匹配模式,此时^和$会匹配每一行的开头和结尾,而不是整个字符串的开头和结尾 |
| n | 允许.匹配换行符 |
基础使用示例
替换字符串中的数字
假设我们需要将字符串中的所有数字替换为星号,可以使用如下SQL:
-- 将字符串中的所有数字替换为*
SELECT REGEXP_REPLACE('abc123def456', 'd', '*', 'g');
-- 返回结果:abc***def***
这里的正则表达式d表示匹配任意数字,设置flags为g表示全局替换所有匹配到的数字。
替换指定格式的手机号中间四位
常见的需求是将手机号的中间四位替换为星号,实现脱敏处理,SQL示例如下:
-- 手机号脱敏,替换中间四位为*
SELECT REGEXP_REPLACE('13812345678', '(d{3})d{4}(d{4})', '1****2');
-- 返回结果:138****5678
这里的正则表达式(d{3})d{4}(d{4})用括号分成了三个捕获组,第一个组是前三位数字,第二个组是中间四位数字,第三个组是后四位数字,替换字符串中的1和2分别表示引用第一个和第三个捕获组的内容,中间拼接四个星号完成替换。
结合表字段的使用示例
假设我们有一张用户表user_info,其中email字段存储用户的邮箱地址,现在需要将所有邮箱的域名部分替换为ipipp.com,可以使用如下SQL:
-- 更新用户邮箱域名 UPDATE user_info SET email = REGEXP_REPLACE(email, '@w+.w+', '@ipipp.com') WHERE email IS NOT NULL;
这里的正则表达式@w+.w+匹配@后面跟着的域名部分,直接替换为新的域名即可。
使用注意事项
- PostgreSQL中的正则表达式语法遵循POSIX标准,和编程语言中的正则语法略有差异,使用前需要确认正则规则的正确性
- 如果不设置flags参数的g标识,默认只会替换第一个匹配到的内容,需要根据需求决定是否添加g标识
- 转义字符需要注意,比如要匹配点号本身,需要写成
.,否则点号会匹配任意单个字符 - 如果源字符串为NULL,REGEXP_REPLACE函数的返回结果也会是NULL,处理字段时需要注意空值判断
正则替换虽然功能强大,但复杂的正则规则可能会影响查询性能,如果对大表进行批量更新操作,建议先在小范围数据上测试正则规则的正确性,再执行全量操作。
PostgreSQLREGEXP_REPLACE正则替换regexp_replace函数修改时间:2026-07-02 10:57:29