当前位置: 首页 > news >正文

中文词性标注工具pkuseg例子(运行结果,不太好)

pkuseg_demo.md

pkuseg

预训练模型
预训练模型science

安装

pip3 install pkuseg
cd /rot/pkuseg_home/model/wget https://github.com/lancopku/pkuseg-python/releases/download/v0.0.25/science.zip
uzip science.zip -d ./science/
ls /rot/pkuseg_home/model/science/ #weights.npz features.pkl

例子参考

pkuseg_demo.py

运行

python3 pkuseg_demo.py 
#报错:Downloading: "https://github.com/lancopku/pkuseg-python/releases/download/v0.0.16/postag.zip" to /home/z/.pkuseg/postag.zip
#解决:(手工下载)
cd /home/z/.pkuseg/
HTTP_PROXY=westGW:7890  HTTS_PROXY=westGW:7890  axel -n 10 https://github.com/lancopku/pkuseg-python/releases/download/v0.0.16/postag.zip  python3 pkuseg_demo.py 
#FileNotFoundError: [Errno 2] No such file or directory: '/home/z/.pkuseg/postag/featureIndex.txt_0'
#报错解决:
mkdir /home/z/.pkuseg/postag/
unzip ostag.zip  -d /home/z/.pkuseg/postag/
ls /home/z/.pkuseg/postag/  #features.pkl  weights.npz

python3 pkuseg_demo.py 的运行结果:

[('设', 'v'),('常数', 'n'),('t>', 'n'),('2', 'm'),('.', 'w'),('在', 'p'),('平面', 'n'),('直角', 'n'),('坐标系', 'n'),('xOy', 'n'),('中', 'f'),(',', 'w'),('已', 'd'),('知点', 'v'),('F', 'n'),('(', 'w'),('2', 'm'),(',', 'w'),('0', 'm'),(')', 'w'),(',', 'w'),('直线', 'd'),('l', 'v'),(':', 'w'),('x=t', 'i'),(',', 'w'),('曲线', 'n'),('Γ', 'v'),(':', 'w'),('y', 'v'),('2', 'm'),('=', 'q'),('8', 'm'),('x', 'q'),('(', 'w'),('0', 'm'),('≤', 'q'),('x≤t', 'n'),(',', 'w'),('y≥', 'v'),('0', 'm'),(')', 'w'),('.l', 'n'),('与', 'p'),('x', 'n'),('轴交', 'v'),('于', 'p'),('点', 'n'),('A', 'n'),('、', 'w'),('与', 'p'),('Γ', 'n'),('交于', 'v'),('点', 'n'),('B.P', 'n'),('、', 'w'),('Q', 'n'),('分别', 'd'),('是', 'v'),('曲线', 'n'),('Γ', 'n'),('与', 'p'),('线段', 'n'),('AB', 'v'),('上', 'v'),('的', 'u'),('动点', 'n'),('.', 'w'),('(', 'w'),('1', 'm'),(')', 'w'),('用', 'p'),('t', 'n'),('表示', 'v'),('点', 'q'),('B', 'n'),('到', 'v'),('点', 'n'),('F', 'n'),('的', 'u'),('距离', 'n'),(';', 'w'),('(', 'w'),('2', 'm'),(')', 'w'),('设', 'v'),('t=', 'n'),('3', 'm'),(',', 'w'),('|', 'v'),('FQ', 'v'),('|=', 'v'),('2', 'm'),(',', 'w'),('线段', 'n'),('OQ', 'v'),('的', 'u'),('中点', 'n'),('在', 'p'),('直线', 'n'),('FP', 'v'),('上', 'v'),(',', 'w'),('求△', 'v'),('AQP', 'v'),('的', 'u'),('面积', 'n'),(';', 'w')]

pkuseg_demo.py

#-*- coding: utf-8 -*-import pkusegmath_text="""设常数 t>2.在平面直角坐标系 xOy 中,已知点 F(2,0),直线 l:x=t,
曲线 Γ:y2=8x(0≤x≤t,y≥0).l 与 x 轴交于点 A、与 Γ 交于点 B.P、Q 分别是曲线 Γ 与
线段 AB 上的动点.
(1)用 t 表示点 B 到点 F 的距离;
(2)设 t=3,|FQ|=2,线段 OQ 的中点在直线 FP 上,求△AQP 的面积;"""seg = pkuseg.pkuseg(model_name='/rot/pkuseg_home/model/science/', postag=True)  # 程序会自动下载所对应的细领域模型
text = seg.cut(math_text)              # 进行分词
print(text)
http://www.lryc.cn/news/289864.html

相关文章:

  • 获取URL参数:split方法、URLSearchParams方法示例
  • SparkSql---用户自定义函数UDFUDAF
  • 系统架构15 - 软件工程(3)
  • 两个近期的计算机领域国际学术会议(软件工程、计算机安全):欢迎投稿
  • (二十一)Flask之上下文管理第二篇(细细扣一遍源码)
  • Java项目:基于SSM框架实现的企业员工岗前培训管理系统(ssm+B/S架构+源码+数据库+毕业论文)
  • 深入了解Redis:选择适用于你的场景的持久化方案
  • 【Git配置代理】Failed to connect to github.com port 443 问题解决方法
  • python提取word文档内容的示例
  • MarkDown快速入门-以Obsidian编辑器为例
  • 【计算机网络】协议,电路交换,分组交换
  • 加速应用开发:低代码云SaaS和源码交付模式如何选
  • ATT汇编
  • java split 拆分字符串
  • 【InternLM 大模型实战】作业与笔记汇总
  • 解析PreMaint在石油化工设备预测性维护领域的卓越表现
  • C++面试宝典第25题:阶乘末尾零的个数
  • PCIE 4.0 Equalizaiton(LTSSM 均衡流程)
  • [libwebsockets]lighttpd+libwebsockets支持ws和wss配置方法说明
  • 常用软件安装
  • 翻译: GPT-4 Vision静态图表转换为动态数据可视化 升级Streamlit 三
  • Qt QPlainTextEdit高亮显示当前行
  • Linux编辑器vim(含vim的配置)
  • Oracle DG环境下的秘钥管理
  • 【Sql Server】新手一分钟看懂在已有表基础上增加字段和说明
  • 亚信安慧AntDB打造开放创新的数据库生态
  • 在Mixamo网站上,下载的动画导入unity给自己的模型添加后出错怎么解决
  • java servlet运输公司管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目
  • React中antd的使用技巧
  • 2024年第一篇博客