当前位置: 首页 > news >正文

Elasticsearch 8.X 分词插件版本更新不及时解决方案

1、关于 Elasticsearch 8.X IK 分词插件相关问题

球友在 ElasticSearch 版本选型问题中提及:如果要使用ik插件,是不是就使用目前最新的IK对应elasticsearch的版本“8.8.2”?

https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v8.8.2

如果要使用最新es版本,而IK没有对应的,老师有推荐的其他类似插件吗?谢谢!——问题来源:https://t.zsxq.com/13YX8fFQy

bb762d980d7915f5d5c143ba9cf90919.png

2、  说一下  Elasticsearch 中文分词插件

  • IK Analyzer

描述:基于词典的中文分词插件。

资源链接:https://github.com/medcl/elasticsearch-analysis-ik

目前业界使用相对广泛,尤其中小型企业。

  • HanLP

描述:基于NLP技术,提供了一系列中文处理能力的分词插件。

资源链接:https://github.com/KennFalcon/elasticsearch-analysis-hanlp
  • Jieba

描述:结巴分词的Elasticsearch插件版本。

资源链接:https://github.com/sing1ee/elasticsearch-jieba-plugin
  • Ansj

描述:速度快,能够识别新词的中文分词插件。

资源链接:https://github.com/NLPchina/elasticsearch-analysis-ansj
  • SmartCN

描述:Elasticsearch自带的基于Lucene的中文分词插件。

资源链接:Elasticsearch官方文档
  • MMSEG

描述:基于词典的复杂切分算法中文分词插件。5.X版本后未再更新

资源链接:https://github.com/medcl/elasticsearch-analysis-mmseg

根据具体的应用场景和需求,可以选择合适的中文分词插件。

另外,需要注意的是,当使用插件时要确保其版本与Elasticsearch版本相匹配,以避免可能出现的兼容性问题。

3、IK 分词插件如何使用最新版本?

开篇提及问题本质:Elasticsearch 更新版本快, 而 IK 更新较慢的问题。举例:如下图所示,当前是 2023年10月20日,Elasticsearch 最新版本为:8.10.4,而 IK 插件的版本为:8.9.0。

149c1952d19d30dd8222dedcd8e7e73f.png

44e72251c5c237fa539a6858e2aeaed0.png

两者类型不匹配,安装的时候会报错。

怎么办?这其实就是开篇问题所在。

咱们可以分析一下 IK 插件的代码,插件源码近1年+几乎没有任何更新。

也就是说:是不是只手动改一下配置文件,自己手动下载部署可不可以呢?

其实是可以的,咱们归拢一下步骤。

步骤1:下载当前最新的 IK 插件。

1c2140d1728a4d814fd35a5efe5c61be.png

步骤2:解压源码

这里的外层文件名是我手动由 8.9.0 改成 8.10.2 的,我的虚拟机集群是 8.10.2 版本。

36aaa913b4cb4a5a4e0a4aebf7a58650.png

修改配置:

36a1c166db9777604692129feff88d98.png

如上内容由原来的版本号 8.9.0,改成 8.10.2 就可以了!

完成后新版本打包,如下所示,打包为:elasticsearch-analysis-ik-8.10.2.zip文件。

ac37a2bb9767871c6dbbd83ecdae2482.png

步骤3:安装 Elasticsearch IK插件。

如下图所示,参考IK的文档,我们采取方式1。

8ecfd79816ff4b494e927710e4be162d.png

第一步:解压elasticsearch-analysis-ik-8.10.2.zip到如下的 plugins 下的 ik 文件夹下。

c0dc5f062bc16d7e1f8f017558126d51.png

ik 文件需要我们提前手动创建。

解压后效果:

第二步:重启 Elasticsearch。

088b0aed86bbda9d9a43920d3a301474.png

步骤4:验证 IK 插件是否成功。

这个创建个索引,指定映射中的某个字段为 ik_max_word 或者  ik_smart 就可以了。

PUT test_index_001
{"mappings": {"properties": {"title": {"type": "text","analyzer": "ik_max_word"}}}
}

4、小结

改动非常小,只为版本适配问题。更多类似问题,欢迎留言交流。

  • 推荐阅读

  • 全网首发!从 0 到 1 Elasticsearch 8.X 通关视频

  • 重磅 | 死磕 Elasticsearch 8.X 方法论认知清单

  • 如何系统的学习 Elasticsearch ?

  • 那些 ChatGPT4 也搞不定的 Elasticsearch 问题,请抛给我们!

84443e0da272f73c85c0dd71c98efc07.jpeg

更短时间更快习得更多干货!

中国50%+Elastic认证专家出自于此!

d8564eabb8553df345608531e9b1355c.gif

比同事抢先一步学习进阶干货!

http://www.lryc.cn/news/204164.html

相关文章:

  • Delete `␍`eslintprettier/prettier
  • 4种实用的制作URL 文件的方法
  • css总结
  • [C语言]排序的大乱炖——喵喵的成长记
  • Docker 网络与Cgroup资源限制
  • D - United We Stand
  • 【1.总纲】
  • I/O模型之非阻塞IO
  • 2023版 STM32实战11 SPI总线读写W25Q
  • Spring Security认证源码解析(示意图)
  • 2023.10.22 关于 定时器(Timer) 详解
  • 【STM32】GPIO控制LED(寄存器版)
  • Spring Boot OAuth 2.0整合—高级配置
  • 软考-虚拟专用网原理与应用
  • clock_property 时钟的常用属性
  • 平板有必要买触控笔吗?推荐的ipad手写笔
  • Qt扫描-QMoive 理论总结
  • 类似东郊到家预约家政保洁小程序搭建
  • [补题记录] Atcoder Beginner Contest 325(E、F)
  • 1024啊啊啊啊啊啊
  • 淘宝商品详情API接口(H5端和APP端),淘宝详情页,商品属性接口,商品信息查询
  • JVM的几个面试重点
  • [yolo系列:YOLOV7改进-添加CoordConv,SAConv.]
  • 【万字实操】可视化运维平台openGauss Datakit,带你轻松玩转openGauss 5.0
  • 《动手学深度学习 Pytorch版》 10.1 注意力提示
  • C# 写入文件比较
  • 医院设备利用(Use of Hospital Facilities, ACM/ICPC World Finals 1991, UVa212)rust解法
  • 解决github ping不通的问题(1024程序员节快乐!
  • QT基础 柱状图
  • 微机原理与接口技术-第七章输入输出接口