如何使用正则表达式匹配重复出现的模式?

来源:Vuejs社区作者:半糖头衔:草根站长
导读:本期聚焦于小伙伴创作的《如何使用正则表达式匹配重复出现的模式?》,敬请观看详情,探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《如何使用正则表达式匹配重复出现的模式?》有用,将其分享出去将是对创作者最好的鼓励。

正则表达式中的重复模式匹配是文本处理场景下的高频需求,比如需要匹配连续出现的相同字符、多次重复的固定格式字符串等,掌握对应的匹配规则可以快速提升文本处理效率。

如何使用正则表达式匹配重复出现的模式?

正则表达式中匹配重复的核心量词

正则表达式中通过量词来指定前面元素的重复次数,常用的量词有以下几种:

  • *:匹配前面的元素0次或多次,比如a*可以匹配空字符串、a、aa、aaa等
  • +:匹配前面的元素1次或多次,比如a+可以匹配a、aa、aaa,但不能匹配空字符串
  • ?:匹配前面的元素0次或1次,比如a?可以匹配空字符串或者a
  • {n}:匹配前面的元素恰好n次,比如a{3}只能匹配aaa
  • {n,}:匹配前面的元素至少n次,比如a{2,}可以匹配aa、aaa、aaaa等
  • {n,m}:匹配前面的元素至少n次,最多m次,比如a{2,4}可以匹配aa、aaa、aaaa

捕获组在重复匹配中的应用

如果需要匹配重复出现的某个完整模式,而不是单个字符,就需要用到捕获组。捕获组通过小括号()将需要重复的部分包裹起来,再对捕获组使用量词。

比如要匹配连续出现2到3次的ab字符串,正则表达式为(ab){2,3},具体示例如下:

import re

# 定义测试字符串
test_str = "ab abab ababab abababab"
# 匹配连续出现2到3次的ab模式
pattern = r"(ab){2,3}"
result = re.findall(pattern, test_str)
print(result)  # 输出 ['ab', 'ab', 'ab', 'ab']

如果需要获取完整的匹配内容而不是捕获组的内容,可以使用非捕获组(?:),修改上面的示例如下:

import re

test_str = "ab abab ababab abababab"
# 使用非捕获组匹配连续2到3次的ab
pattern = r"(?:ab){2,3}"
result = re.findall(pattern, test_str)
print(result)  # 输出 ['abab', 'ababab', 'ababab']

常见重复匹配场景示例

匹配连续重复的相同字符

比如要匹配字符串中连续出现3次及以上的相同数字,可以使用反向引用来实现,反向引用n可以引用前面第n个捕获组匹配的内容。

import re

test_str = "111 2222 33333 12121 4444"
# 匹配连续3次及以上的相同数字,1表示引用第一个捕获组的内容
pattern = r"(d)1{2,}"
result = re.findall(pattern, test_str)
print(result)  # 输出 ['1', '2', '3', '4']

匹配重复出现的固定格式内容

比如要匹配字符串中重复出现的邮箱格式内容,假设邮箱格式为用户名@域名,用户名由字母数字组成,域名由字母和点组成。

import re

test_str = "test@ippipp.com test@test.com test@ippipp.com test@test.com"
# 匹配重复出现的邮箱,这里先匹配一个邮箱格式,再通过捕获组重复
pattern = r"([a-zA-Z0-9]+@[a-zA-Z.]+)(?=.*1)"
result = re.findall(pattern, test_str)
print(result)  # 输出 ['test@ippipp.com', 'test@test.com']

注意事项和常见误区

在使用量词时要注意贪婪模式和惰性模式的区别,默认情况下量词是贪婪模式,会尽可能匹配多的内容,比如a.*b匹配aabab的时候会匹配整个aabab,如果需要在后面加?变成惰性模式,a.*?b会匹配aabab

另外,量词只作用于紧邻的前一个元素,比如ab+是匹配a后面跟着1个或多个b,而不是匹配ab重复多次,如果需要匹配ab重复多次需要使用捕获组(ab)+

调试正则表达式的时候可以先使用简单的测试字符串验证逻辑是否符合预期,再逐步扩展到复杂的场景,避免逻辑错误。

正则表达式重复模式匹配量词捕获组regex修改时间:2026-06-12 01:03:29

免责声明:​ 已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰,观点力求客观中立。本站旨在免费分享,内容仅供个人学习、研究或参考使用。若引用了第三方作品,版权归原作者所有。如内容涉及您的权益,请联系我们处理。
内容垂直聚焦
专注技术核心技术栏目,确保每篇文章深度聚焦于实用技能。从代码技巧到架构设计,为用户提供无干扰的纯技术知识沉淀,精准满足专业提升需求。
知识结构清晰
覆盖从开发到部署的全链路。AI、前端、编程、数据库、服务器、建站、系统层层递进,构建清晰学习路径,帮助用户系统化掌握开发与运维所需的核心技术。
深度技术解析
拒绝泛泛而谈,深入技术细节与实践难点。无论是数据库优化还是服务器配置,均结合真实场景与代码示例进行剖析,致力于提供可直接应用于工作的解决方案。
专业领域覆盖
精准对应开发生命周期。从前端界面到后端编程,从数据库操作到服务器运维,形成完整闭环,一站式满足全栈工程师和运维人员的技术需求。
即学即用高效
内容强调实操性,步骤清晰、代码完整。用户可根据教程直接复现和应用于自身项目,显著缩短从学习到实践的距离,快速解决开发中的具体问题。
持续更新保障
专注既定技术方向进行长期、稳定的内容输出。确保各栏目技术文章持续更新迭代,紧跟主流技术发展趋势,为用户提供经久不衰的学习价值。