当前位置: 首页 > news >正文

实用小工具-python esmre库实现word查找

python esmre库实现word查找

前言:
在文本中匹配特定的字符串,一般可以用普通的字符串匹配算法,KMP算法;
python中提供了一个库,esmre, 通过预先将字符串存到esm对象中,利用这些字符串从候选的字符串中进行匹配,返回匹配位置,支持同一个词语的多次匹配。效率比正则表达式快。

import esm
import reindex = esm.Index()
index.enter("he")
index.enter("she")
index.enter("his")
index.enter("hers")
index.fix()
query1 = "this here is history"
query2 = "Those are his sheep!"# 使用esmre
out1 = index.query(query1)
out2 = index.query(query2)
print('out1=', out1, '\nstr1=', query1[out1[0][0][0]:out1[0][0][1]])
print('out2=', out2, '\nstr2=', query1[out2[0][0][0]:out2[0][0][1]])# 使用正则表达式
out3 = re.search(r"he|she|his|hers", query1)
print('out3=',out3)out4 = re.search(r"xxx|yyy", query2)
print('out4=',out4)'''
out1= [((1, 4), 'his'), ((5, 7), 'he'), ((13, 16), 'his')] 
str1= his
out2= [((10, 13), 'his'), ((14, 17), 'she'), ((15, 17), 'he')] 
str2= is 
out3= <re.Match object; span=(1, 4), match='his'>
out4= None
'''

参考:
1.敏感词匹配——python使用esmre实现ac自动机[多模匹配]
2,.esmre 1.0.1
3.python ac模块_python使用esmre代替ahocorasick实现ac自动机[多模匹配]

http://www.lryc.cn/news/369890.html

相关文章:

  • SSM框架整合,内嵌Tomcat。基于注解的方式集成
  • 系统架构设计师【论文-2016年 试题4】: 论微服务架构及其应用(包括写作要点和经典范文)
  • 面试题:String 、StringBuffer 、StringBuilder的区别
  • TLS指纹跟踪网络安全实践(C/C++代码实现)
  • 小白学RAG:大模型 RAG 技术实践总结
  • Doris Connector 结合 Flink CDC 实现 MySQL 分库分表
  • ModbusTCP、TCP/IP都走网线,一样吗?
  • 网络学习(13)|Spring Boot中获取HTTP请求头(Header)内容的详细解析
  • 【漏洞复现】宏景eHR pos_dept_post SQL注入漏洞
  • 82. 删除排序链表中的重复元素 and II
  • C++ 判断目标文件是否被占用(独占)(附源码)
  • 计划任务 之 一次性的计划任务
  • 非比较排序之计数排序
  • Django路由与会话深度探索:静态、动态路由分发,以及Cookie与Session的奥秘
  • 第7章 用户输入和 while 循环
  • xshell远程无法链接上VM的centos7
  • 拥抱AI-图片学习中的卷积神经算法详解
  • 超详解——深入详解Python基础语法——基础篇
  • 系统架构设计师【论文-2017年 试题2】: 论软件架构风格(包括写作要点和经典范文)
  • Spring Boot 事务传播机制详解
  • 【机器学习】生成对抗网络 (Generative Adversarial Networks | GAN)
  • [ADS信号完整性分析]深入理解IBIS AMI模型设计:从基础到实践
  • Plotly : 超好用的Python可视化工具
  • Linux电话本的编写-shell脚本编写
  • 蓝牙开发 基础知识
  • QNX 7.0.0开发总结
  • Golang使用讯飞星火AI接口
  • 矫正儿童发音好帮手
  • wordpress主题导航主题v4.16.2哈哈版
  • 内存分布图