如何用正则表达式将字符串中连续重复的竖线字符压缩为单个竖线

来源：网络学院作者：IT小魔仙头衔：程序员

导读：本期聚焦于小伙伴创作的《如何用正则表达式将字符串中连续重复的竖线字符压缩为单个竖线》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《如何用正则表达式将字符串中连续重复的竖线字符压缩为单个竖线》有用，将其分享出去将是对创作者最好的鼓励。

在数据处理和字符串清洗的场景中，经常会遇到字符串里存在连续多个竖线字符的情况，这些冗余的竖线会影响后续的分隔解析、数据入库等操作，需要将其统一压缩为单个竖线。正则表达式是处理这类字符模式匹配问题的高效工具，不需要编写复杂的循环逻辑就能快速实现需求。

核心正则匹配规则

要实现连续竖线的压缩，核心是利用正则的量词和捕获组特性。竖线字符在正则中属于普通字符，不需要转义，连续重复的竖线可以表示为|+，其中+表示匹配前面的字符一次或多次。如果使用替换逻辑，我们可以匹配所有连续的竖线，然后替换为单个竖线即可。

更通用的写法是使用|{2,}，其中{2,}表示匹配前面的字符至少两次，这样只会匹配连续两个及以上的竖线，避免对单个竖线做无意义的替换操作，性能更优。

不同编程语言中的实现

JavaScript实现

JavaScript的String.replace方法支持正则替换，直接使用上面的正则规则即可：

// 原始字符串，包含连续竖线
let str = "a||b|||c||||d";
// 使用正则替换连续竖线为单个竖线
let result = str.replace(/|{2,}/g, "|");
console.log(result); // 输出 a|b|c|d

这里的正则/|{2,}/g中，g是全局修饰符，表示匹配字符串中所有符合条件的连续竖线，而不是只匹配第一个。

Java实现

Java中使用String类的replaceAll方法，注意Java字符串中反斜杠需要转义，所以正则的写法要调整：

public class Main {
    public static void main(String[] args) {
        String str = "a||b|||c||||d";
        // Java中反斜杠需要转义，所以|要写成\|
        String result = str.replaceAll("\|{2,}", "|");
        System.out.println(result); // 输出 a|b|c|d
    }
}

Python实现

Python的re模块提供了正则处理能力，代码如下：

import re

str = "a||b|||c||||d"
# 使用re.sub进行替换，r前缀表示原始字符串，不需要额外转义反斜杠
result = re.sub(r'|{2,}', '|', str)
print(result) # 输出 a|b|c|d

边界场景处理

实际使用中需要考虑一些边界情况：

如果字符串开头或结尾有连续竖线，上述正则依然可以正常处理，比如||a||b||会被处理为|a|b|。
如果字符串中没有连续竖线，正则不会匹配到内容，替换操作不会改变原字符串，不会产生影响。
如果竖线之间有空格等其他字符，比如a| |b，不会被判定为连续竖线，不会触发替换，符合预期逻辑。

正则原理补充说明

量词{n,}是正则表达式中用于匹配重复次数的语法，{2,}表示匹配前面的元素至少2次，没有上限。当我们用这个规则去匹配字符串时，正则引擎会从字符串开头开始扫描，一旦找到连续的竖线，就会尽可能多地匹配连续的竖线（这是正则的贪婪匹配特性），然后将这一整段连续的竖线替换为单个竖线，再继续往后扫描，直到遍历完整个字符串。

如果希望使用非贪婪匹配，可以写成|{2,}?，但在这个场景下非贪婪匹配反而会增加匹配次数，降低效率，所以不需要使用。

正则表达式字符串处理竖线压缩连续重复字符修改时间：2026-06-30 13:12:27

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。