当前位置: 首页 > news >正文

NLP中一些工具列举

文章目录

  • StanfordcoreNLP
  • Stanza
  • Tankit
  • spaCy
  • SuPar
  • 总结

StanfordcoreNLP

这个老早就出来了,用java写的,但是已经有很多比他效果好的了。

Stanza

2020ACL发表的,看名字就知道和上一个是同一家的。

用已经切好词的句子进行依存分析。

这个功能有什么好处呢?
一开始一直不知道这个功能的好处,这个就是在你已有数据集的基础上,想加点依存或者句法等信息进去的时候,切好词放进去能确保分析结果一一对应,不然切词器用的不一样,结果是不能完美对应回去的,这样处理起来就非常恶心了。

按道理来说应该每个切词器都会有这个功能吧。

import stanza
nlp = stanza.Pipeline(lang='en', tokenize_pretokenized=True)
doc = nlp(["Stanza is a powerful$NLP library.".split()])
for sent in doc.sentences:print(sent.print_dependencies())

输出结果:
在这里插入图片描述

Tankit

2021EACL文章里的
在这里插入图片描述
看这结果好像比Stanza好,但是实际上使用人数Stanza更多毕竟老行家,老客户多,而且github上回答问题也很积极,就是说售后工作不错,实验效果的话,可能还是Stanza会好些。

spaCy

这东西主要是快,工业用的,做研究为了效果应该不差这点时间。看过没用过。

SuPar

https://github.com/yzhangcs/parser
封装了Biaffine和CRF等用了解析依存树或者句法树的模型,不过我好像试了没运行成功,好像是模型下太慢了,用户体验其实不怎么样,但是它里面说效果是SOTA,但现在毕竟2023,只能说效果不会差,工具不算老。

总结

应该还有很多,上面主要是对应英文的,但是其实他们也大部分支持中文,对于中文也有很多,如jieba,哈工大的LTP,百度LAC,jiagu等等。

工具很多,知道名字才能进行信息搜集和对比,不然要干啥都不知道。

http://www.lryc.cn/news/24723.html

相关文章:

  • 面试官:给你一段有问题的SQL,如何优化?
  • 嵌入式 Linux 文件IO操作
  • 植物大战 二叉搜索树——C++
  • [MatLab]矩阵运算和程序结构
  • 【Leedcode】栈和队列必备的面试题(第四期)
  • Windows Server 2016搭建文件服务器
  • 零基础学SQL(十一、视图)
  • web,h5海康视频接入监控视频流记录三(后台node取流)
  • 网络安全从入门到精通:30天速成教程到底有多狠?你能坚持下来么?
  • 世界上最流行的编程语言,用户数超过Python,Java,JavaScript,C的总和!
  • 杂谈:created中两次数据修改,会触发几次页面更新?
  • 原生JS实现拖拽排序
  • Coredump-N: corrupted double-linked list
  • 5个好用的视频素材网站
  • 使用码匠连接一切|二
  • 3.1.1 表的相关设计
  • Vue3 企业级项目实战:认识 Spring Boot
  • Swagger2实现配置Header请求头
  • 4-1 SpringCloud快速开发入门:RestTemplate类详细解读
  • 【IDEA】【工具】幸福感UP!开发常用的工具 插件/网站/软件
  • 【蓝桥杯集训·每日一题】AcWing 1562. 微博转发
  • [busybox] busybox生成一个最精简rootfs(下)
  • Java奠基】运算符的讲解与使用
  • 开发一个会员管理系统
  • 华为OD机试题【找出通过车辆最多颜色】用 C++ 进行编码 (2023.Q1)
  • 如何根据子网掩码计算出网络前缀(prefix)
  • 【FATE联邦学习】Fateboard的使用
  • 解决vue3没有this造成的无法使用vue2
  • 百度前端二面vue面试题指南
  • 【备战面试】每日10道面试题打卡-Day1