在Go语言的字符串处理场景中,我们经常会遇到需要替换字符串同时统计替换次数的需求,比如统计文本中敏感词被替换了多少次,或者批量修改内容时记录修改总量。标准库的strings.Replace方法只能完成替换,无法返回替换次数,而regexp包的正则匹配能力可以配合自定义计数器实现这个功能。

实现思路
核心思路分为三步:首先编译需要匹配的正则表达式,然后遍历匹配到的所有位置,在替换的同时累加计数器,最后返回替换后的字符串和总替换次数。具体逻辑如下:
- 使用
regexp.Compile编译正则表达式,处理可能的编译错误 - 通过
FindAllStringIndex获取所有匹配的起始和结束位置 - 遍历匹配位置,拼接替换后的字符串,同时递增计数器
- 返回最终结果和计数器数值
完整代码示例
下面是一个通用的带计数器的正则替换函数实现,支持传入正则表达式、原字符串、替换内容,返回替换后的字符串和替换次数:
package main
import (
"fmt"
"regexp"
)
// ReplaceWithCount 正则替换并返回替换次数
// pattern: 正则表达式规则
// src: 原字符串
// repl: 替换内容
// 返回值:替换后的字符串,替换次数,错误信息
func ReplaceWithCount(pattern string, src string, repl string) (string, int, error) {
// 编译正则表达式
reg, err := regexp.Compile(pattern)
if err != nil {
return "", 0, err
}
// 获取所有匹配的索引位置
matches := reg.FindAllStringIndex(src, -1)
if matches == nil {
// 没有匹配到内容,直接返回原字符串和0次替换
return src, 0, nil
}
count := len(matches)
// 用于拼接结果的字节切片
result := make([]byte, 0, len(src))
lastEnd := 0
// 遍历所有匹配位置,拼接替换内容
for _, match := range matches {
start := match[0]
end := match[1]
// 拼接上次结束到本次开始之间的内容
result = append(result, src[lastEnd:start]...)
// 拼接替换内容
result = append(result, repl...)
lastEnd = end
}
// 拼接剩余的内容
result = append(result, src[lastEnd:]...)
return string(result), count, nil
}
func main() {
// 测试示例:替换所有数字为#
src := "abc123def456ghi789"
pattern := `d+`
repl := "#"
res, count, err := ReplaceWithCount(pattern, src, repl)
if err != nil {
fmt.Println("替换出错:", err)
return
}
fmt.Printf("原字符串: %sn", src)
fmt.Printf("替换后字符串: %sn", res)
fmt.Printf("替换次数: %dn", count)
}
代码解析
正则编译与匹配
首先通过regexp.Compile编译传入的正则表达式,如果正则语法错误会返回错误。之后使用FindAllStringIndex方法获取所有匹配的索引,该方法返回的是二维切片,每个元素是一个长度为2的切片,分别代表匹配的起始和结束位置,传入-1表示匹配所有结果。
字符串拼接逻辑
为了避免字符串频繁拼接带来的性能损耗,我们使用字节切片来构建最终结果。遍历每个匹配位置时,先拼接上一次匹配结束到本次匹配开始之间的原字符串内容,再拼接替换内容,最后拼接剩余的原字符串内容,这样就能得到完整的替换后字符串。匹配的数量就是替换的次数,直接取匹配切片的长度即可。
使用注意事项
- 正则表达式需要符合Go的regexp包语法规则,比如匹配数字用
d,需要注意转义字符的处理 - 如果替换内容中包含正则特殊字符,不需要额外转义,因为替换内容是作为普通字符串处理的
- 如果需要替换的内容是动态生成的,要注意避免正则注入问题,比如不要直接将用户输入作为正则规则使用
- 该方法的时间复杂度是O(n),n是原字符串长度,适合处理常规的字符串替换场景
扩展场景
如果需要替换内容支持动态生成,比如根据匹配到的内容不同返回不同的替换值,可以修改上述函数,将替换参数改为一个回调函数,在回调函数中根据匹配到的内容生成替换值,同时递增计数器即可。核心逻辑和上述示例一致,只需要调整替换内容的获取方式。