导读:本期聚焦于小伙伴创作的《如何用C++实现字符串相似度计算的Levenshtein距离动态规划解法》,敬请观看详情,探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《如何用C++实现字符串相似度计算的Levenshtein距离动态规划解法》有用,将其分享出去将是对创作者最好的鼓励。

Levenshtein距离又称编辑距离,指两个字符串之间,由一个转成另一个所需的最少编辑操作次数,允许的编辑操作包括将一个字符替换成另一个字符、插入一个字符、删除一个字符。在拼写纠错、DNA序列比对、搜索引擎模糊查询等场景中都有广泛应用,用动态规划实现该算法可以高效完成计算。

如何用C++实现字符串相似度计算的Levenshtein距离动态规划解法

动态规划思路推导

要计算字符串A和字符串B的Levenshtein距离,我们可以定义一个二维数组dp,其中dp[i][j]表示A的前i个字符和B的前j个字符的编辑距离。接下来推导状态转移方程:

  • 如果i为0,说明A是空字符串,要变成B的前j个字符,需要插入j次,所以dp[0][j] = j
  • 如果j为0,说明B是空字符串,要删除A的前i个字符,需要删除i次,所以dp[i][0] = i
  • 如果A的第i个字符和B的第j个字符相等,那么不需要额外操作,dp[i][j] = dp[i-1][j-1]
  • 如果A的第i个字符和B的第j个字符不相等,我们可以选择三种操作:替换A的第i个字符为B的第j个字符,代价是dp[i-1][j-1]+1;删除A的第i个字符,代价是dp[i-1][j]+1;在A的第i个字符后插入B的第j个字符,代价是dp[i][j-1]+1,取三种情况的最小值作为dp[i][j]

完整C++实现源码

下面是Levenshtein距离动态规划解法的完整C++代码,包含输入处理和结果输出逻辑:

#include <iostream>
#include <vector>
#include <string>
#include <algorithm>

using namespace std;

// 计算两个字符串的Levenshtein距离
int levenshteinDistance(const string& str1, const string& str2) {
    int len1 = str1.size();
    int len2 = str2.size();
    // 定义dp数组,大小为(len1+1)*(len2+1)
    vector<vector<int>> dp(len1 + 1, vector<int>(len2 + 1, 0));
    
    // 初始化边界情况
    for (int i = 0; i <= len1; ++i) {
        dp[i][0] = i; // str2为空,需要删除i次
    }
    for (int j = 0; j <= len2; ++j) {
        dp[0][j] = j; // str1为空,需要插入j次
    }
    
    // 填充dp数组
    for (int i = 1; i <= len1; ++i) {
        for (int j = 1; j <= len2; ++j) {
            if (str1[i-1] == str2[j-1]) {
                // 当前字符相等,不需要额外操作
                dp[i][j] = dp[i-1][j-1];
            } else {
                // 取替换、删除、插入三种操作的最小值加1
                int replaceCost = dp[i-1][j-1] + 1;
                int deleteCost = dp[i-1][j] + 1;
                int insertCost = dp[i][j-1] + 1;
                dp[i][j] = min({replaceCost, deleteCost, insertCost});
            }
        }
    }
    
    // 返回最终的结果,即两个完整字符串的编辑距离
    return dp[len1][len2];
}

int main() {
    string str1, str2;
    cout << "请输入第一个字符串: ";
    cin >> str1;
    cout << "请输入第二个字符串: ";
    cin >> str2;
    
    int distance = levenshteinDistance(str1, str2);
    cout << "两个字符串的Levenshtein距离为: " << distance << endl;
    
    return 0;
}

代码说明与优化方向

上述代码的时间复杂度为O(n*m),其中n和m分别是两个输入字符串的长度,空间复杂度同样为O(n*m)。如果处理非常长的字符串,可以考虑空间优化,因为dp数组每一行的计算只依赖上一行的结果,所以可以用两个一维数组交替存储,将空间复杂度降低到O(min(n,m))。

另外,如果只需要判断两个字符串的相似度是否超过某个阈值,不需要精确的距离值,还可以在dp计算过程中提前终止,当当前行的最小值已经超过阈值时,直接返回结果,进一步提升效率。

实际应用场景

这个算法可以直接用在拼写检查功能中,输入错误单词后计算它和词库中单词的Levenshtein距离,返回距离最小的几个候选词。也可以在数据清洗时用来匹配相似重复的记录,比如用户姓名、地址的模糊匹配,减少人工核对的工作量。

C++Levenshtein距离字符串相似度动态规划修改时间:2026-06-09 17:54:27

免责声明:​ 已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰,观点力求客观中立。本站旨在免费分享,内容仅供个人学习、研究或参考使用。若引用了第三方作品,版权归原作者所有。如内容涉及您的权益,请联系我们处理。
内容垂直聚焦
专注技术核心技术栏目,确保每篇文章深度聚焦于实用技能。从代码技巧到架构设计,为用户提供无干扰的纯技术知识沉淀,精准满足专业提升需求。
知识结构清晰
覆盖从开发到部署的全链路。AI、前端、编程、数据库、服务器、建站、系统层层递进,构建清晰学习路径,帮助用户系统化掌握开发与运维所需的核心技术。
深度技术解析
拒绝泛泛而谈,深入技术细节与实践难点。无论是数据库优化还是服务器配置,均结合真实场景与代码示例进行剖析,致力于提供可直接应用于工作的解决方案。
专业领域覆盖
精准对应开发生命周期。从前端界面到后端编程,从数据库操作到服务器运维,形成完整闭环,一站式满足全栈工程师和运维人员的技术需求。
即学即用高效
内容强调实操性,步骤清晰、代码完整。用户可根据教程直接复现和应用于自身项目,显著缩短从学习到实践的距离,快速解决开发中的具体问题。
持续更新保障
专注既定技术方向进行长期、稳定的内容输出。确保各栏目技术文章持续更新迭代,紧跟主流技术发展趋势,为用户提供经久不衰的学习价值。