当前位置: 首页 > news >正文

elasticsearch 8.x 插件安装(三)之拼音插件

elasticsearch 8.x 插件安装(三)之拼音插件

elasticsearch插件安装合集

elasticsearch插件安装(一)之ik分词器安装(含MySQL更新)

elasticsearch 8.x插件(二)之同义词安装如何解决jdk权限问题

elasticsearch插件安装(二)之dynamic-synonym插件

elasticsearch 8.x 插件安装(三)之拼音插件

elasticsearch 8.x 插件安装(四)之简繁体插件

es 分词器(五)之elasticsearch-analysis-jieba 8.7.0

elasticsearch 8.x 插件安装(六)之Hanlp插件

一、拉取代码

Github地址:https://github.com/infinilabs/analysis-pinyin

image-20241028111157679

二、修改es对应版本

打开elasticsearch目录下的pom文件,将elasticsearch.version版本修改为你需要的版本,此处修改为8.7.0。

image-20241028111225921

点击maven的package命令打包,然后去elasticsearch目录下找到target目录,在release目录下有对应的es插件

image-20241028111334060

image-20241028111458915

三、复制至es plugins目录下

复制到es plugins目录下,并且解压,将原有的名字修改为analysis-pinyin

image-20241028111621621

四、重启es并验证拼音插件

4.1 创建索引

PUT /medcl/ 
{"settings" : {"analysis" : {"analyzer" : {"pinyin_analyzer" : {"tokenizer" : "my_pinyin"}},"tokenizer" : {"my_pinyin" : {"type" : "pinyin","keep_separate_first_letter" : false,"keep_full_pinyin" : true,"keep_original" : true,"limit_first_letter_length" : 16,"lowercase" : true,"remove_duplicated_term" : true}}}}
}

4.2 发送一个拼音分词的请求

GET /medcl/_analyze
{"text": ["刘德华"],"analyzer": "pinyin_analyzer"
}

4.3 返回结果

{"tokens" : [{"token" : "liu","start_offset" : 0,"end_offset" : 1,"type" : "word","position" : 0},{"token" : "de","start_offset" : 1,"end_offset" : 2,"type" : "word","position" : 1},{"token" : "hua","start_offset" : 2,"end_offset" : 3,"type" : "word","position" : 2},{"token" : "刘德华","start_offset" : 0,"end_offset" : 3,"type" : "word","position" : 3},{"token" : "ldh","start_offset" : 0,"end_offset" : 3,"type" : "word","position" : 4}]
}

编程精选网(www.codehuber.com),程序员的终身学习网站已上线!

如果这篇【文章】有帮助到你,希望可以给【JavaGPT】点个赞👍,创作不易,如果有对【后端技术】、【前端领域】感兴趣的小可爱,也欢迎关注❤️❤️❤️ 【JavaGPT】❤️❤️❤️,我将会给你带来巨大的【收获与惊喜】💝💝💝!

http://www.lryc.cn/news/471526.html

相关文章:

  • 快速遍历包含合并单元格的Word表格
  • 手机收银云进销存管理软件,商品档案Excel格式批量导入导出,一键导入Excel的商品档案
  • html 中识别\n自动换行
  • 用QWebSocketServer写websocket服务端
  • 云原生后端:现代应用架构的核心力量
  • arcgis中dem转模型导入3dmax
  • Python自动化测试中的Mock与单元测试实战
  • 物联网海量数据下的时序数据库选型:InfluxDB、TDEngine、MongoDB与HBase对比与建议
  • Python中的数据可视化:Matplotlib基础与高级技巧
  • 数组名和指针数组名深度复习
  • Linux 诞生
  • 借助Aspose.Email,管理受密码保护的 PST 文件
  • MySQL数据库MHA高可用
  • DevEco Studio使用技巧和插件推荐
  • 使用Node.js与Express构建RESTful API
  • 从0开始搭建一个生产级SpringBoot2.0.X项目(二)SpringBoot应用连接数据库集成mybatis-plus
  • Docker部署教程:打造流畅的斗地主网页小游戏
  • redis的客户端
  • 图片分类标注工具python
  • Rust命令行,实现自动反编译Android APK包工具
  • 10. NSTableView Table 数据表格
  • javase笔记8---File与IO流
  • docker上传离线镜像包到Artifactory
  • 【专用名词的离线语音识别在2024年底的解决方法调查-会议签到的补充】
  • OS基础-
  • 《大型语言模型实战指南:应用实践与场景落地》一文详解大型语言模型的11种微调方法
  • 嵌入式浏览器 -- Chromium VS Firefox
  • 权限大、数量多、破坏强、管理难......企业特权访问管理怎么管?
  • UE5 第一人称示例代码阅读0 UEnhancedInputComponent
  • 如何在Linux下安装和配置Docker