当前位置: 首页 > news >正文

Java:java版结巴分词:jieba-analysis

文档

  • https://github.com/huaban/jieba-analysis
  • https://mvnrepository.com/artifact/com.huaban/jieba-analysis

依赖

<!-- https://mvnrepository.com/artifact/com.huaban/jieba-analysis -->
<dependency><groupId>com.huaban</groupId><artifactId>jieba-analysis</artifactId><version>1.0.2</version>
</dependency>

使用示例

package com.example.demo;import com.huaban.analysis.jieba.JiebaSegmenter;
import com.huaban.analysis.jieba.SegToken;
import org.junit.Test;import java.util.List;
import java.util.stream.Collectors;public class JiebaTests {@Testpublic void testJieba(){String text = "工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作";JiebaSegmenter segmenter = new JiebaSegmenter();List<SegToken> list = segmenter.process(text, JiebaSegmenter.SegMode.INDEX);List<String> collect = list.stream().map(segToken -> segToken.word).collect(Collectors.toList());System.out.println(collect);// [工信处, 干事, 女干事, 每月, 经过, 下属, 科室, 都, 要, 亲口, 交代, 24, 口, 交换, 换机, 交换机, 等, 技术, 技术性, 器件, 的, 安装, 工作]}
}
http://www.lryc.cn/news/185295.html

相关文章:

  • java生成一个符合密码学和安全性的随机秘钥
  • C++ - 右值引用 和 移动拷贝
  • 项目成员积分规则
  • Linux CentOS7 vim多窗口编辑
  • git使用,一点点
  • 第五章:最新版零基础学习 PYTHON 教程—Python 字符串操作指南(第八节 - 如何在 C/C++、Python 和 Java 中分割字符串?)
  • 【Java】语法特性篇
  • Vim教程
  • selenium查找网页如何处理网站资源一直加载非常卡或者失败的情况
  • 并发工具类库使用的常见问题
  • GD32F10X ----RTC
  • 使用UiPath和AA构建的解决方案 1. 机器人过程自动化入门
  • rust字面量
  • Unix Network Programming Episode 79
  • Cesium展示——wkt 数据绘制
  • 打造完美家庭空间,让生活更加舒适
  • 解决loadDep:omelette: sill install loadAllDepsIntoIdealTree
  • 【深蓝学院】手写VIO第2章--IMU传感器--作业
  • Android多线程学习:线程
  • canvas 入门
  • 建议收藏!混迹职场多年总结出的8大技巧!
  • OpenCV4(C++)—— 视频和摄像头的加载、显示与保存
  • excel功能区(ribbonx)编程笔记6-box的使用
  • oralce配置访问白名单的方法
  • ToBeWritten之让响应团队参与并做好沟通
  • ffmpeg ts 关于av_seek_frame
  • 【C++】set map 的底层封装
  • JavaWeb整体介绍
  • 一些常见分布-正态分布、对数正态分布、伽马分布、卡方分布、t分布、F分布等
  • 科技云报道:押注向量数据库,为时过早?