当前位置: 首页 > news >正文

C# 使用PanGu分词

写在前面

这是官方介绍:盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户。作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。

盘古分词组件需要配合其字典文件使用,该组件提供了多重输出解决分词粒度和分词精度权衡的问题,可配合Lucene.net一起使用实现精准的全文检索功能。还支持中文词性的识别,当然也支持英文分割。

可通过NuGet获取组件

代码实现

 using PanGu;

    public static class SplitWordMgr{/// <summary>/// 分词/// </summary>public static List<string> SplitContent(string word){var seg = new Segment();ICollection<WordInfo> splitWords = seg.DoSegment(word);var words = new List<string>();for (int i = 0; i < splitWords.Count; i++){words.Add(splitWords.ElementAt(i).Word);}return words;}}

 

资源及说明

链接:https://pan.baidu.com/s/1zTHOX5ioTPxQEO2CEhfXlg 
提取码:llos 

请将资源压缩包里的Dictionaries文件夹改名为Dict后,复制到项目的bin目录下。

http://www.lryc.cn/news/246100.html

相关文章:

  • Termius 一款优秀的跨平台 SSH 客户端工具
  • 生命科学领域 - 新药从研发到上市全流程
  • 血的教训------入侵redis之利用python来破解redis密码
  • yolov8-pose 推理流程
  • 笔记十七、认识React的路由插件react-router-dom和基本使用
  • CleanMyMac X4.14.5Crack最新Mac电脑清理优化最佳应用
  • Linux shell单双引号区别
  • ES 8.x开始(docker-compose安装、kibana使用、java操作)
  • 有了倾斜摄影,如何搭建一座智慧城市?
  • 设计测试用例的具体方法总结
  • 计算机毕业设计|基于SpringBoot+MyBatis框架的仿天猫商城购物系统设计与实现
  • JAXB的XmlValue注解
  • Git版本管理(05) git仓库迁移(保留原来记录分支体系)
  • 科技与教育:未来教育的新趋势
  • E云管家微信群聊机器人开发
  • CVE-2023-27524:Apache Superset未授权访问漏洞复现
  • 机器学习——多元线性回归升维
  • [C/C++]用堆实现TopK算法
  • 3D点云目标检测:VoxelNex解读(带源码/未完)
  • 【Docker】从零开始:11.Harbor搭建企业镜像仓库
  • 使用conan包 - 工作流程
  • 【LeeCode】59.螺旋矩阵II
  • rsyslog学习
  • Navicat 技术指引 | GaussDB服务器对象的创建/设计(编辑)
  • 有哪些可信的SSL证书颁发机构?
  • MidJourney笔记(4)-settings
  • 前端开发学习 (三) 列表功能
  • win11渗透武器库,囊括所有渗透工具
  • 13-21-普通数组、矩阵
  • 代码随想录算法训练营第四十六天【动态规划part08】 | 139.单词拆分、背包总结