当前位置: 首页 > news >正文

力扣 28找到字符串中第一个匹配项的下标 KMP算法

思路:

朴素匹配有很多步骤是多余的

KMP算法能够避免重复匹配

KMP算法主要是根据子串生成的next数组作为回退的依据,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配。

这里讲一下为什么用模式串的最大公共前后缀求解NEXT数组,参考B站木子喵NEKO的视频【【neko算法课】KMP算法【7期】】 https://www.bilibili.com/video/BV1234y1y7pm/?share_source=copy_web&vd_source=5fc45b3a16cefaa9c36d42d5626cd9e6

用例子思考时,我们可以肉眼看到,需要移动的位置是根据B向后移动几个可以最大化的对齐A(在i之前),意味着找到i前面文本子串(A)与模式子串(B)中重合的部分。

既然i前面都是重合(因为i这里发生了不匹配,前面都匹配),直白说就是一样的,那就不用看文本串了,直接看模式串前后是否有重合的部分,也就是看模式串的最大公共前后缀。如果没看懂可以往下看。


kmp整体上分两步

1计算前缀表

2根据前缀表移动两个指针进行匹配

1计算前缀表,就是求解文本串指针回退的位置,

ps:文本串用i指针,模式串用j指针,

以下分别用A,B代指文本串与模式串。

A串中i指针前面(第一次循环时AB发生不匹配的位置)前,用A子串与B子串代称。

当A,B遇到不匹配的字符时,j指针回退,回退依据是当前不匹配位置前一位最大前后缀的长度,

为什么呢?通俗的说就是,不匹配了,看前面有哪些已经最大化的匹配上了,不匹配位置前一位的next值,代表了B自身前后一致的最大长度,根据前面讲的,A子串等效B子串,也就代表了AB子串前后一致的最大长度,也就代表了A子串的后面与B子串的前面一致的最大长度,也就是B需要向后移动几个字符,而j指针的移动代表着B向后移动,也就是j指针要移动到的位置。

j回退到上次最大化匹配的位置

如果还不匹配,再次查看不匹配位置前一位next的值。

如果匹配,j加一,也就意味着j向后移动一位,i向后移动写在了for循环里。

同时每次更新next[i]

void getNext(string s,vector<int> &next)
{int j = 0;next[0] = 0;for(int i = 1;i<s.size();i++){while(j>0 && s[i] != s[j]) j = next[j-1];if(s[i] == s[j]) j++;next[i] = j;}
}

2 模拟匹配过程

如果不匹配,按着next数组回退j指针,如果匹配,J增一

最后如果j指向了模式串的末尾,说明找到了完整匹配,返回匹配的起始下标

如果没找到返回-1

int strStr(string s,string t)
{if(t.size()==0) return 0;//这里需要初始化next数组,这里用址传递传参给getNext函数vector<int> next(t.size());getNext(t,next);int j = 0;for(int i = 0;i<s.size();i++){
//若果遇到s,t不匹配,按着next表回退while(j>0 && s[i]!=t[j]) j = next[j-1];if(s[i] == t[j]) j++;
//如果j指向t的最后一位,说明前面均匹配成功,那么返回的第一个匹配项是当前i位置减去已经匹配的t的长度,再加一if(j == t.size()) return (i - t.size()+1);}return -1;
}

注:修改了一处传参遇到的问题,涉及值传递、指针传递与地址传递的比较,可以略过。

void getNext(string s,vector<int> &next)

 vector<int> next(t.size());
    getNext(t,next);

这里string s是值传递,也可以用地址传递

vector<int> &next,必须用地址传递,这样好处相比于值传递与指针传递有三点

1避免不必要的拷贝,调用函数时不用创建next的副本,不会导致额外的时间内存开销

2保持函数接口整洁,引用传递可以直接修改传入的对象,不需要显示的管理内存。

3避免空指针问题,指针传递需要检查指针是否为空,否则运行错误,引用传递无需担心,因为引用会绑定到有效的对象。

因此地址传递是c++中处理复杂参数中常见于推荐的方法。

http://www.lryc.cn/news/404446.html

相关文章:

  • JavaScript(10)——匿名函数
  • 图片上传成功却无法显示:静态资源路径配置问题解析
  • 【转盘案例-弹框-修改Bug-完成 Objective-C语言】
  • Perl 基础语法
  • 【嵌入式开发之标准I/O】二进制文件的读写及实验
  • Arduino学习笔记1——IDE安装与起步
  • 一个注解解决重复提交问题
  • 在qt的c++程序嵌入一个qml窗口
  • Vue的依赖注入:组件树中的共享数据与功能
  • softmax 函数的多种实现方式 包括纯C语言、C++版本、Eigen版本等
  • R语言学习笔记11-读取csv-xlsx-txt-json-pdf-lua格式文件
  • Vue的计算属性和方法有什么区别
  • 学生成绩管理系统(C语言)
  • C语言 通讯录管理 完整代码
  • 2024北京国际智能工厂及自动化展览会亮点前瞻
  • 《网络安全等级保护制度详解》
  • 使用Wanderboat AI 来规划到巴黎的旅行计划
  • 基于YOLO8的目标检测系统:开启智能视觉识别之旅
  • 实验07 接口测试postman
  • C++常用但难记的语法
  • Qt 快速保存配置的方法
  • RKE部署k8s
  • 从0开始的STM32HAL库学习8
  • 微信小程序数组绑定使用案例(一)
  • Kudu节点数规划
  • flutter 充电气泡
  • 【C++】deque以及优先级队列
  • 手机如何播放电脑的声音?
  • 系统架构设计师教程 第3章 信息系统基础知识-3.6 办公自动化系统(OAS)-解读
  • 解决Element UI 表格组件懒加载数据刷新问题