当前位置: 首页 > news >正文

字符串匹配 - Overview

字符串匹配(String Matchiing)也称字符串搜索(String Searching)是字符串算法中重要的一种,是指从一个大字符串或文本中找到模式串出现的位置。

字符串匹配概念

字符串匹配问题的形式定义:
  • 文本(Text)是一个长度为 n 的数组 T[1..n];

  • 模式(Pattern)是一个长度为 m 且 m≤n 的数组 P[1..m];

  • T 和 P 中的元素都属于有限的字母表 Σ 表;

  • 如果 0≤s≤n-m,并且 T[s+1..s+m] = P[1..m],即对 1≤j≤m,有 T[s+j] = P[j],则说模式 P 在文本 T 中出现且位移为 s,且称 s 是一个有效位移(Valid Shift)。

比如上图中,目标是找出所有在文本 T = abcabaabcabac 中模式 P = abaa 的所有出现。该模式在此文本中仅出现一次,即在位移 s = 3 处,位移 s = 3 是有效位移。

字符串匹配算法通常分为两个步骤:预处理(Preprocessing)和匹配(Matching)。所以算法的总运行时间为预处理和匹配的时间的总和。

上图描述了常见字符串匹配算法的预处理和匹配时间。

字符串匹配算法

解决字符串匹配的算法包括:朴素算法(Naive Algorithm) 即暴力破解、Rabin-Karp 算法、有限自动机算法(Finite Automation)、 Knuth-Morris-Pratt 算法(即 KMP Algorithm)、Boyer-Moore 算法、Simon 算法、Colussi 算法、Galil-Giancarlo 算法、Apostolico-Crochemore 算法、Horspool 算法和 Sunday 算法等。
  • 朴素的字符串匹配算法(Naive String Matching Algorithm)

  • 朴素的字符串匹配算法又称为暴力匹配算法(Brute Force Algorithm),最为简单的字符串匹配算法

  • Knuth-Morris-Pratt 字符串匹配算法(即 KMP 算法)

  • Knuth-Morris-Pratt算法(简称KMP)是最常用的字符串匹配算法之一

  • Boyer-Moore 字符串匹配算法

  • 各种文本编辑器的"查找"功能(Ctrl+F),大多采用Boyer-Moore算法,效率非常高

  • 字符串匹配 - 文本预处理:后缀树(Suffix Tree)

  • 上述字符串匹配算法(朴素的字符串匹配算法, KMP 算法, Boyer-Moore算法)均是通过对模式(Pattern)字符串进行预处理的方式来加快搜索速度。对 Pattern 进行预处理的最优复杂度为 O(m),其中 m 为 Pattern 字符串的长度。那么,有没有对文本(Text)进行预处理的算法呢?本文即将介绍一种对 Text 进行预处理的字符串匹配算法:后缀树(Suffix Tree)

http://www.lryc.cn/news/10711.html

相关文章:

  • 【IP课堂】Ip地址如何进行精准定位?
  • MySQL 临时表相关参数说明区别
  • 第二章 变量和基本类型
  • 【Python】循环语句(while,for)、运算符、字符串格式化
  • 利用设计模式、反射写代码
  • Spring Cloud Alibaba--seata微服务详解之分布式事务(三)
  • [USACO2023-JAN-Bronze] T3 Moo Operations 题解
  • OKCC呼叫中心支持哪些接入方式?
  • 如何让手机共享电脑代理网络的WIFI热点
  • 渲染有问题?怎么办?6种方法让你渲染无忧
  • 中国人寿业务稳定性保障:“1+1+N” 落地生产全链路压测
  • 2/17考试总结
  • 零信任-360连接云介绍(9)
  • 使用dlib进行人脸检测和对齐
  • 将python代码封装成c版本的dll动态链接库
  • AI技术网关如何用于安全生产监测?有什么优势?
  • 2|数据挖掘|关联规则|Association Rules|Apriori算法|Frequent-pattern tree和FP-growth算法|11.11
  • 刷题记录:牛客NC53370 Forsaken的三维数点
  • lombok的原理 和 使用
  • UDP网络编程
  • “合并区间”问题解析及其思考
  • 2023年理想新能源汽车核心部件解密
  • C++ 将一个vector内容赋值给另一个vector,及swap与assign的区别
  • PMP的价值有哪些?
  • OnGUI label 控件||Unity 3D GUI教程||OnGUI Background Color 控件
  • 从 JavaScript 中的数组中删除空对象
  • 【C++】AVL树和红黑树(插入和测试详解)
  • Centos7 安装 Mysql 8.0.32,详细完整教程(好文章!!)
  • Apache Beanutils为什么被禁止使用?
  • sql server执行md5加密的时候,字符串前带N和不带N的结果是不一样的