当前位置: 首页 > news >正文

solr/ES 分词插件Jcseg设置自定义词库

步骤:

        1、找到配置文件jcseg-core/target/classes/jcseg.properties修改配置:

        下载地址: https://gitee.com/lionsoul/jcseg#5-如何自定义使用词库

lexicon.path = {jar.dir}/../custom-word

 设置lexicon路径,我们这个配置可以自定义,这个就是词库目录信息,{jar.dir}值得是编译完的jar存放目录。

        2、将已有的词库复制到自定义目录中。

                默认在jcseg-core/target/classes/lexicon,将里面的内容复制到自定义目录,我的                                                是/custom-word目录

        3、修改复制过来的目录文件,增加词库数据。他默认已经分类好了,我要添加测试字库solr,暂时放到公司目录。

农村信用社/nt/nong cun xin yong she/null
邮政局/nt/you zheng ju/null
邮政储蓄银行/nt/you zheng chu xu yin xing/null
solr/nt/solr/null

如上面所示,/分割,

        第一个是中文字符;

        第二个是分类和上面一样就行;

        第三个是英文;

        最后一个是使用次数。 

        4、记得重启一下tomcat或者docker容器即可。可以看到分词成功:

http://www.lryc.cn/news/319368.html

相关文章:

  • 嵌入式硬件设计(一)|利用 NodeMCU-ESP8266 开发板和继电器结合APP“点灯•blinker”制作Wi-Fi智能开关(附有关硬件详细资料)
  • CSS扩展选择器
  • 知名Web3投资基金a16z合伙人Jane Lippencott确认出席Hack.Summit() 2024区块链开发者大会
  • 电脑那个部件坏了或者是哪个软件需要修复来看价钱
  • GiT: Towards Generalist Vision Transformer through Universal Language Interface
  • 纽约时报起诉OpenAI和微软将决定未来LLM的发展
  • IntelliJ IDEA 面试题及答案整理,最新面试题
  • T1.数据库MySQL
  • idea中database的一些用法
  • 外卖点餐系统 |基于springboot框架+ Mysql+Java+JSP技术+Tomcat的外卖点餐系统 设计与实现(可运行源码+设计文档)
  • 挑战杯 机器视觉的试卷批改系统 - opencv python 视觉识别
  • Node.js 自带的 http 模块来实现一个简单的本地服务器
  • c++ 设计模式模版方法
  • 踏上机器学习的征程:探索基础概念与学习模式
  • 基于YOLO的自动驾驶目标检测研究综述
  • 深度学习-解读GoogleNet深度学习网络
  • 【LeetCode: 2684. 矩阵中移动的最大次数 + dfs】
  • 第五节:使用SMB开发WebSocket通信
  • Nginx和Ribbon实现负载均衡的区别
  • 流畅的Python(十九)-动态属性和特性
  • 确保云原生部署中的网络安全
  • 【分布式websocket 】前端vuex管理客户端消息crud!使用localStorage来存储【第19期】
  • venv uvicorn python 虚拟服务器外网无法访问
  • 一款博客网站源码
  • Mr-Robot1靶场练习靶场推荐小白入门练习靶场渗透靶场bp爆破wordpress
  • 数据仓库的设计开发应用(三)
  • 【04】WebAPI
  • 数据预处理在数据挖掘中的重要性
  • Java并发编程—JUC线程池架构
  • Android input输入子系统