当前位置: 首页 > news >正文

【Elasticsearch】NLP简单应用

文章目录

    • NLP简介
    • ES中的自然语言处理(NLP)
    • NLP演示
      • 将opennlp插件放在ESplugins路径中
      • 下载NER模型
      • 配置opennlp
      • 重启ES、验证

NLP简介

NLP代表自然语言处理,是计算机科学和人工智能领域的一个分支。它涉及使用计算机来处理、分析和生成自然语言,例如英语、中文、西班牙语等等。

NLP的目标是使计算机能够理解人类语言的含义和意图,从而使其能够与人类进行有效的交互。这种交互可以是口头的,例如语音识别和语音合成,也可以是书面的,例如文本分类、文本摘要和情感分析。

简单点理解NLP就是我们可以使用软件来操作和理解口语或书面文本或自然语言的方式。

ES中的自然语言处理(NLP)

将 NLP 模型集成到 Elastic 平台时,为上传和管理模型提供出色的用户体验

NLP演示

下载ES对应的opennlp插件

下载地址:https://github.com/spinscale/elasticsearch-ingest-opennlp

将opennlp插件放在ESplugins路径中

下载NER模型

NER:从非结构化文本构建结构,尝试提取名称、位置或组织等细节

bin/ingest-opennlp/download-models

配置opennlp

修改配置文件:config/elasticsearch.yml

ingest.opennlp.model.file.persons: en-ner-persons.bin
ingest.opennlp.model.file.dates: en-ner-dates.bin
ingest.opennlp.model.file.locations: en-ner-locations.bin

重启ES、验证

  • 创建一个支持NLP的pipeline

    PUT _ingest/pipeline/opennlp-pipeline
    {"description": "A pipeline to do named entity extraction","processors": [{"opennlp": {"field": "message"}}]
    }
    
  • 添加数据

    PUT my-nlp-index
    PUT my-nlp-index/_doc/1?pipeline=opennlp-pipeline
    {"message": "Shay Banon announced the release of Elasticsearch 6.0 in November 2017"
    }PUT my-nlp-index/_doc/2?pipeline=opennlp-pipeline
    {"message" : "Kobe Bryant was one of the best basketball players of all times. Not even Michael Jordan has ever scored 81 points in one game. Munich is really an awesome city, but New York is as well. Yesterday has been the hottest day of the year."
    }
    
  • 查看数据

    GET my-nlp-index/_doc/1
    GET my-nlp-index/_doc/2
    
http://www.lryc.cn/news/64995.html

相关文章:

  • 3. 云计算的落地实践(下)
  • javaEE+mysql学生竞赛管理系统
  • 车辆出险记录查询API接口
  • MySQL的概念,编译及安装
  • 系统性能压力测试
  • 从零开始学习Linux运维,成为IT领域翘楚(三)
  • 轻松搭建自己的ChatGPT聊天机器人,让AI陪你聊天!
  • CompletableFutrue异步处理
  • 【前端面经】JS-对象的可枚举性
  • 沁恒 CH32V208(三): CH32V208 Ubuntu22.04 Makefile VSCode环境配置
  • 日撸 Java 三百行day38
  • 玩转肺癌目标检测数据集Lung-PET-CT-Dx ——④转换成PASCAL VOC格式数据集
  • 两种使用 JavaScript 实现网页高亮关键字的方法
  • 【SpringBoot】SpringBoot集成ElasticSearch
  • 从 Elasticsearch 到 Apache Doris,10 倍性价比的新一代日志存储分析平台
  • 探讨Redis缓存问题及解决方案:缓存穿透、缓存击穿、缓存雪崩与缓存预热(如何解决Redis缓存中的常见问题并提高应用性能)
  • 【Python】怎么在pip下载的时候设置镜像?(常见的清华镜像、阿里云镜像以及中科大镜像)
  • 【AI面试】目标检测中one-stage、two-stage算法的内容和优缺点对比汇总
  • stack、queue和priority_queue的使用介绍--C++
  • python遍历数组
  • 红黑树理论详解与Java实现
  • container的讲解
  • JavaScript 箭头函数
  • 简单理解Transformer注意力机制
  • Vue3面试题:20道含答案和代码示例的练习题
  • Oracle数据库创建用户
  • 互联网摸鱼日报(2023-04-30)
  • 第二章--第一节--什么是语言生成
  • HTML <!--...--> 标签
  • TinyML:使用 ChatGPT 和合成数据进行婴儿哭声检测