当前位置: 首页 > news >正文

elasticsearch自定义企业词典

我们中文分词用的是ik,但是ik只是对基本的中文词进行了分词,而对于企业或者人名没有进行分词。

比如,我搜索中国平安,那么ik只能分成中国、平安

如果这样,这肯定是不行滴!

接下来,俺就教你,如何创建词典。

首先写一个词典company.dic,然后写上你要识别的词。

文件的格式别忘记改成utf-8编码以及unix(因为我的es装的是linux里)

打开Es的插件目录添加dict,并且重启

进入ik的配置目录,并且修改

/ES安装好的目录/plugins/ik/config/IKAnalyzer.cfg.xml

<entry key="ext_dict">company.dic</entry>

将company.dic上传到 /ES安装好的目录/plugins/ik/config/目录下

重启es

测试

参考:https://www.cnblogs.com/dmzna/p/14913813.html

http://www.lryc.cn/news/35123.html

相关文章:

  • 【AcWing】学了一坤时才明白的一道题
  • ES6的export和import
  • ASEMI高压MOS管20N60参数,20N60尺寸,20N60体积
  • 【备战面试】TCP的三次握手与四次挥手
  • 【模板进阶】
  • Tech Talk | 电致变色技术带来的智能AR体验
  • ACWING蓝桥杯每日一题python(持续更新
  • 【Linux】进程状态(阻塞、挂起、僵尸进程)
  • 规约第二章
  • 2019年MathorCup数学建模C题汽配件制造业中的生产排程问题解题全过程文档及程序
  • ARM uboot 的移植3 -从 uboot 官方标准uboot开始移植
  • 华为OD机试 - 快递货车(C 语言解题)【独家】
  • 连接微信群、Slack 和 GitHub:社区开放沟通的基础设施搭建
  • 数据中台架构体系理解
  • 高并发性能指标:QPS、TPS、RT、并发数、吞吐量
  • 【微信小程序】-- 案例 - 本地生活(列表页面)(三十)
  • 华为OD机试题,用 Java 解【一种字符串压缩表示的解压】问题
  • 所有科研人警惕,掠夺型期刊和劫持型期刊的区别,千万别投错了
  • 超详细CentOS7 NAT模式(有图形化界面)网络配置
  • 华为OD机试题,用 Java 解【英文输入法】问题
  • 【Redis】主从集群 实现读写分离(二)
  • 【JavaEE】前后端分离实现博客系统(页面构建)
  • MyBatis的基本使用
  • 看完书上的链表还不会实现?不进来看看?
  • 【批处理脚本】-3.2-call命令详解
  • 华为OD机试题,用 Java 解【寻找相同子串】问题
  • 思腾合力深思系列 | 四款高性能 AI 服务器
  • Vue3做出B站【bilibili】 Vue3+TypeScript+ant-design-vue【快速入门一篇文章精通系列(一)前端项目案例】
  • 2.3操作系统-进程管理:死锁、死锁的产生条件、死锁资源数计算
  • 人物百科怎么建?个人百度百科创建的注意事项