当前位置: 首页 > news >正文

ES IK分词器插件

前言

ES中默认了许多分词器,但是对中文的支持并不友好,IK分词器是一个专门为中文文本设计的分词工具,它不是ES的内置组件,而是一个需要单独安装和配置的插件。

Ik分词器的下载安装(Winows 版本)

下载地址: https://github.com/medcl/elasticsearch-analysis-ik

在这里插入图片描述

注意:IK分词器插件的版本要和ElasticSearch的版本一致
我的ES版本是7.8.0
在这里插入图片描述
在 ElasticSearch 所在文件夹中创建ik目录,并解压安装包到ik目录下
在这里插入图片描述
启动ES,查看日志观察是否启动成功
在这里插入图片描述

验证测试

可以在kibana中进行验证

在这里插入图片描述
在这里插入图片描述

ik_smart 与 ik_max_word 的异同
首先来看下官方的FAQs
What is the difference between ik_max_word and ik_smart?
ik_max_word: Performs the finest-grained segmentation of the text. For example, it will segment “中华人民共和国国歌” into “中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”, exhaustively generating various possible combinations, suitable for Term Query.
ik_smart: Performs the coarsest-grained segmentation of the text. For example, it will segment “中华人民共和国国歌” into “中华人民共和国,国歌”, suitable for Phrase queries.
Note: ik_smart is not a subset of ik_max_word.
官方这里简单的描述了一下使用用途,即:
ik_smart 比较适合 match_phrase query,而 ik_max_word 更合适 term query。
ik_smart 的分词结果并不是 ik_max_word 的分词结果的子集。

到这里ik创建安装成功!
使用的时候需要在创建索引mapping的时候指定字段的分析器(已经存在的索引,可以先删除后创建)
在这里插入图片描述

http://www.lryc.cn/news/514498.html

相关文章:

  • 二十三种设计模式-抽象工厂模式
  • python opencv的orb特征检测(Oriented FAST and Rotated BRIEF)
  • 高阶数据结构----布隆过滤器和位图
  • VScode使用密钥进行ssh连接服务器方法
  • 艾体宝产品丨加速开发:Redis 首款 VS Code 扩展上线!
  • 应用架构模式
  • 注入少量可学习的向量参数: 注入适配器IA3
  • 【C++】B2076 球弹跳高度的计算
  • 【Python】selenium结合js模拟鼠标点击、拦截弹窗、鼠标悬停方法汇总(使用 execute_script 执行点击的方法)
  • CatBoost算法详解与PyTorch实现
  • “TypeScript版:数据结构与算法-初识算法“
  • mysql中递归的使用 WITH RECURSIVE
  • 点击取消按钮,console出来数据更改了,页面视图没有更新
  • web框架在什么程度上受限 ?
  • 实践:事件循环
  • C++ 设计模式:建造者模式(Builder Pattern)
  • SQL偏移类窗口函数—— LAG()、LEAD()用法详解
  • 基于Pytorch和yolov8n手搓安全帽目标检测的全过程
  • [CTF/网络安全] 攻防世界 upload1 解题详析
  • 03-其他
  • EasyExcel自定义动态下拉框(附加业务对象转换功能)
  • 2025.1.2
  • 重庆大学软件工程复试怎么准备?
  • Ant Design Pro搭建react项目
  • mysql连接时报错1130-Host ‘hostname‘ is not allowed to connect to this MySQL server
  • 办公 三之 Excel 数据限定录入与格式变换
  • Ubuntu执行sudo apt-get update失败的解决方法
  • torch.nn.functional的用法
  • 最新常见的图数据库对比,选型,架构,性能对比
  • UE5材质节点Camera Vector/Reflection Vector