当前位置: 首页 > news >正文

基于规则的命名实体识别

基于规则的命名实体识别(Rule-Based Named Entity Recognition, NER)是一种通过预定义的模式或规则来识别文本中特定实体的方法。这种方法通常使用正则表达式来匹配文本中的实体。下面是一个更完整的示例,展示了如何使用正则表达式来识别文本中的多个实体类型,包括人名、地点和日期

import redef rule_based_entity_recognition(text):# 定义实体识别规则patterns = {'PERSON': r'(?:唐纳德|川普|特朗普)','LOCATION': r'(?:白宫|华盛顿)','DATE': r'\d{4}-\d{2}-\d{2}'  # YYYY-MM-DD 格式}# 存储识别结果entities = []# 遍历所有模式for entity_type, pattern in patterns.items():for match in re.finditer(pattern, text):start, end = match.span()entities.append({'entity': match.group(),'type': entity_type,'start': start,'end': end})return entities# 测试文本
text = "特朗普于2020-01-01在白宫签署了重要文件。"# 调用函数并打印结果
entities = rule_based_entity_recognition(text)for entity in entities:print(f"Entity: {entity['entity']}, Type: {entity['type']}, Start: {entity['start']}, End: {entity['end']}")

运行结果:

Entity: 特朗普, Type: PERSON, Start: 0, End: 3
Entity: 白宫, Type: LOCATION, Start: 15, End: 17
Entity: 2020-01-01, Type: DATE, Start: 4, End: 14

http://www.lryc.cn/news/445764.html

相关文章:

  • C语言从头学63—学习头文件stdlib.h(二)
  • js判断一个对象里有没有某个属性
  • Python(爬虫)正则表达式
  • Linux:进程(二)
  • 【UE5】将2D切片图渲染为体积纹理,最终实现使用RT实时绘制体积纹理【第二篇-着色器制作】
  • 【OceanBase 诊断调优】—— GC问题根因分析
  • 图像面积计算一般方法及MATLAB实现
  • 指挥平台在应急场所中的主要表现有哪些
  • 智能养殖场人机交互检测系统源码分享
  • 数据集-目标检测系列-海洋鱼类检测数据集 fish>> DataBall
  • 网络威慑战略带来的影响
  • 决策树算法在机器学习中的应用
  • Leetcode面试经典150题-39.组合总数进阶:40.组合总和II
  • ProcessOn为什么导出有水印!!!(利用SVG转PNG)
  • 插入、更新与删除MySQL记录
  • 【ARM】armv8的虚拟化深度解读
  • 9/24作业
  • Leetcode 106. 从中序与后序遍历序列构造二叉树
  • 针对考研的C语言学习(定制化快速掌握重点1)
  • 【大数据入门 | Hive】DDL数据定义语言(数据库DataBase)
  • CNVD漏洞和证书挖掘经验总结
  • 阿里rtc旁路推流TypeScript版NODE运行
  • 计算机书籍分享
  • 处理ASAM-MDF格式的开源python库asammdf
  • 物业管理小程序开发
  • 【Vue】Pinia
  • 帕金森病患者的生命长度:科学管理与乐观心态是关键
  • 详解Linux中cat命令
  • Mysql高级篇(中)—— SQL优化之查询截取分析
  • 企业如何制作一个官方网站?