当前位置: 首页 > news >正文

动态规划 | 最长公共子序列问题

文章目录

    • 最长公共子序列
      • 题目描述
      • 问题分析
      • 程序代码
      • 复杂度分析
    • 最短编辑距离
      • 题目描述
      • 问题分析
      • 程序代码
      • 复杂度分析
    • 编辑距离
      • 题目描述
        • 输入格式
        • 输出格式
      • 问题分析
      • 程序代码

最长公共子序列

题目描述

原题链接

给定两个字符串 text1text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0

一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。

  • 例如,"ace""abcde" 的子序列,但 "aec" 不是 "abcde" 的子序列。

两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。

问题分析

这里假设text1text2的下标均从 1 开始

状态定义dp[i][j]表示text1[1...i]text2[1...j]的最长公共子序列的长度

状态划分:根据text1[i]text2[j]是否在最长公共子序列中,可以将状态划分为四类

  1. text1[i]在,text1[j]也在:dp[i][j] = dp[i-1][j-1] + 1,同时要求text1[i] == text2[j]
  2. text1[i]在,text1[j]不在:dp[i][j] = dp[i][j-1]
  3. text1[i]不在,text1[j]在:dp[i][j] = dp[i-1][j]
  4. text1[i]不在,text1[j]也不在:dp[i][j] = dp[i-1][j-1]

由于情况 4 包含在情况 2 和情况 3 中,因此不需要要单独考虑,最终可以得到如下的状态计算。

状态计算:

  • text1[i] == text2[j]dp[i][j] = dp[i-1][j-1] + 1
  • text1[i] != text2[j]dp[i][j] = max(dp[i][j-1], dp[i-1][j])

程序代码

class Solution {
public:int longestCommonSubsequence(string text1, string text2) {int n = text1.size(), m = text2.size();vector<vector<int>> dp(n + 1, vector<int>(m + 1, 0));text1 = ' ' + text1;text2 = ' ' + text2;for(int i = 1; i <= n; i++) {for(int j = 1; j <= m; j++) {dp[i][j] = max(dp[i-1][j], dp[i][j-1]);if( text1[i] == text2[j] ) {dp[i][j] = max(dp[i][j], dp[i-1][j-1] + 1);}}}return dp[n][m];}
};

复杂度分析

时间复杂度为 O ( N 2 ) O(N^2) O(N2)

最短编辑距离

题目描述

原题链接

给你两个单词 word1word2请返回将 word1 转换成 word2 所使用的最少操作数

你可以对一个单词进行如下三种操作:

  • 插入一个字符
  • 删除一个字符
  • 替换一个字符

问题分析

这里假设word1word2的下标均从 1 开始

状态定义dp[i][j]表示将word1[1...i]变成word2[1...j]所需的最少操作次数

状态计算dp[i][j]可能从三种可能状态转移过来,三种状态取最小值

  • 删除操作:删除word1[i],使得 word1word2 匹配,即dp[i][j] = dp[i-1][j] + 1
  • 插入操作:在word1的末尾插入word2[j],使得二者匹配,即dp[i][j] = dp[i][j-1] + 1
  • 替换操作:word1[1...i-1]word2[1...j-1]匹配,word1[i]word2[j]有两种情况
    • word1[i] == word2[j],则无需进行替换操作,即dp[i][j] = dp[i-1][j-1]
    • word1[i] != word2[j],则需进行替换操作,即dp[i][j] = dp[i-1][j-1] + 1

边界情况

  • dp[0][0]:二者都为空,无需进行任何操作,即dp[0][0] = 0
  • dp[0][i]:表示word1为空,word1只能通过插入操作变成word2,即dp[0][i] = i
  • dp[i][0]:表示word2为空,word1只能通过删除操作变成word2,即dp[i][0] = i

程序代码

class Solution {
public:int minDistance(string word1, string word2) {int n = word1.size(), m = word2.size();int maxVal = m + n;  // 初始化数组word1 = ' ' + word1;word2 = ' ' + word2;vector<vector<int>> dp(n + 1, vector<int>(m + 1, maxVal));// 边界情况dp[0][0] = 0;for(int i = 1; i <= m; i++) {dp[0][i] = i;}for(int i = 1; i <= n; i++) {dp[i][0] = i;}for(int i = 1; i <= n; i++) {for(int j = 1; j <= m; j++) {// 删除和插入操作dp[i][j] = min(dp[i-1][j] + 1, dp[i][j-1] + 1);// 替换操作if(word1[i] == word2[j]) {dp[i][j] = min(dp[i][j], dp[i-1][j-1]);}else {dp[i][j] = min(dp[i][j], dp[i-1][j-1] + 1);}}}return dp[n][m];}
};

复杂度分析

时间复杂度为 O ( N 2 ) O(N^2) O(N2)

编辑距离

题目描述

给定 n 个长度不超过 10 的字符串以及 m 次询问,每次询问给出一个字符串和一个操作次数上限。

对于每次询问,请你求出给定的 n 个字符串中有多少个字符串可以在上限操作次数内经过操作变成询问给出的字符串。

每个对字符串进行的单个字符的插入、删除或替换算作一次操作。

输入格式

第一行包含两个整数 n 和 m。

接下来 n 行,每行包含一个字符串,表示给定的字符串。

再接下来 m 行,每行包含一个字符串和一个整数,表示一次询问。

字符串中只包含小写字母,且长度均不超过 10。

输出格式

输出共 m 行,每行输出一个整数作为结果,表示一次询问中满足条件的字符串个数。

问题分析

本质上其实就是最短编辑距离问题

程序代码

#include <iostream>
#include <algorithm>
using namespace std;int n, m;
const int N = 1010, INF = 1e9 + 7;
string s[N];
string p;
int k;int solve(string a, string b)
{int n = a.size(), m = b.size();a = ' ' + a;b = ' ' + b;vector<vector<int>> dp(n + 1, vector<int>(m + 1, INF));// 边界情况dp[0][0] = 0;for(int i = 1; i <= m; i++) {dp[0][i] = i;}for(int i = 1; i <= n; i++) {dp[i][0] = i;}for(int i = 1; i <= n; i++) {for(int j = 1; j <= m; j++) {// 删除和插入操作dp[i][j] = min(dp[i-1][j] + 1, dp[i][j-1] + 1);// 替换操作if(a[i] == b[j]) {dp[i][j] = min(dp[i][j], dp[i-1][j-1]);}else {dp[i][j] = min(dp[i][j], dp[i-1][j-1] + 1);}}}return dp[n][m];
}int main()
{cin >> n >> m;for(int i = 0; i < n; i++) {cin >> s[i];}for(int i = 0; i < m; i++) {cin >> p >> k;int cnt = 0;for(int j = 0; j < n; j++) {if( solve(s[j], p) <= k )  cnt++;}printf("%d\n", cnt);}return 0;
}
http://www.lryc.cn/news/271208.html

相关文章:

  • RuntimeError: The NVIDIA driver on your system is too old.
  • Java开发过程中的幂等性问题
  • 基于Docker的软件环境部署脚本,持续更新~
  • C#上位机与欧姆龙PLC的通信08----开发自己的通讯库读写数据
  • 【Redis技术专区】「原理分析」探讨Redis6.0为何需要启用多线程
  • simulink代码生成(六)——多级中断的配置
  • 【Minikube Prometheus】基于Prometheus Grafana监控由Minikube创建的K8S集群
  • 无需翻墙|Stable Diffusion WebUI 安装|AI绘画
  • 在FC中手工创建虚拟机模板
  • OpenSSL provider
  • pandas处理双周数据
  • 2023结婚成家,2024借势起飞
  • linux SHELL语句
  • 音频修复和增强软件:iZotope RX 10 (Win/Mac)中文汉化版
  • 复试 || 就业day03(2023.12.29)算法篇
  • 处理urllib.request.urlopen报错UnicodeEncodeError:‘ascii‘
  • 数据结构模拟实现LinkedList双向不循环链表
  • 性能优化-如何提高cache命中率
  • 分布式【4. 什么是 CAP?】
  • <软考高项备考>《论文专题 - 39采购管理(3) 》
  • Java在SpringCloud中自定义Gateway负载均衡策略
  • 前端 js 基础(1)
  • Android : 使用GestureOverlayView进行手势识别—简单应用
  • API集群负载统计 (100%用例)C卷 (JavaPythonNode.jsC语言C++)
  • 小梅哥Xilinx FPGA学习笔记18——专用时钟电路 PLL与时钟向导 IP
  • 低代码平台在金融银行中的应用场景
  • Css基础内容
  • 微服务(11)
  • 连锁门店管理需要信息化系统
  • UTF-8编码:打破字符编码的国界