最短编辑距离


题目链接:https://www.acwing.com/problem/content/description/904/

题目描述

给定两个字符串 A 和 B,现在要将 A 经过若干操作变为 B,可进行的操作有:
删除–将字符串 A 中的某个字符删除。
插入–在字符串 A 的某个位置插入某个字符。
替换–将字符串 A 中的某个字符替换为另一个字符。
现在请你求出,将 A 变为 B 至少需要进行多少次操作。

输入描述

第一行包含整数 n,表示字符串 A 的长度。
第二行包含一个长度为 n 的字符串 A。
第三行包含整数 m,表示字符串 B 的长度。
第四行包含一个长度为 m 的字符串 B。
字符串中均只包含大写字母。

输出描述

输出一个整数,表示最少操作次数。
1≤n,m≤1000

示例

输入

10
AGTCTGACGC
11
AGTAAGTAGGC

输出

4

分析

约定

第一个字符串表示为a,长度为n
第二个字符串表示为b,长度为m

状态表示

f(i,j)表示a的前i个字符变为b的前j个字符所需要的最少操作次数

状态划分与计算

关于本题的状态划分和计算,我没有找到非常严谨的分析过程,只能综合各种回答,给出我认为最好的分析。
可证明:一定存在一种操作顺序,使得我们可以从左到右进行操作就可以得到最优解,所以这里可以假定最后一步只会操作a[i]和b[j]。
该证明我没有找到怎么证的,但结论应该是正确的。不摆出这个证明的话分析就更不严谨了。
由上面的证明我们可以通过最后一步对a的操作进行状态划分。(a和b等价分析谁都一样)
划分与计算如下:

  • 插入操作:此时要添加,只能添加b[j]了,说明a的前i个字符已经变成b的前j-1个字符了,此时f(i,j)=f(i,j-1)+1
  • 删除操作:此时要删除a[i],说明a的前i-1个字符已经变成了b的前j个字符,此时f(i,j)=f(i-1,j)+1
  • 替换操作: 此时先判断a[i]是否等于b[j],如果不等,则应将a[i]替换为b[j],说明a的前i-1个字已经变成了b的前j-1个字符,此时f(i,j)=f(i-1,j-1)+1。如果a[i]=b[j],则无需操作,此时f(i,j)=f(i-1,j-1)

状态转移方程

再来考虑一下边界条件:

  • f(0,0),代表两个字符串均空,等于0
  • f(i,0),代表a由i个字符要变成空串,显然要做i次删除,等于i
  • f(0,j),代表a这个空串要变成有j个字符的b串,显然要做j次插入,等于j

由上一步的分析和对边界的考虑,我们得到状态转移方程如下:

AC代码


#include <iostream>
#include <algorithm>

using namespace std;

const int N = 1001;

int n, m;
char a[N], b[N];
int f[N][N];
int main()
{
	cin >> n >> a;
	cin >> m >> b;

	for (int i = 0; i <= n; i++) //边界处理
		f[i][0] = i;
	for (int j = 0; j <= m; j++)
		f[0][j] = j;

	for (int i = 1; i <= n; i++)
	{
		for (int j = 1; j <= m; j++)
		{
			f[i][j] = min(f[i][j - 1] + 1, f[i - 1][j] + 1);
			if (a[i - 1] == b[j - 1])
				f[i][j] = min(f[i][j], f[i - 1][j - 1]);
			else
				f[i][j] = min(f[i][j], f[i - 1][j - 1] + 1);
		}
	}
	cout << f[n][m] << endl;
	return 0;
}

文章作者: Kong Aobo
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kong Aobo !
  目录