当前位置: 首页 > news >正文

Spacy小笔记:zh_core_web_trf、zh_core_web_lg、zh_core_web_md 和 zh_core_web_sm区别

Spacy小笔记

最近频繁用到spacy,就小记一下。
2024.11.29

zh_core_web_trf、zh_core_web_lg、zh_core_web_md 和 zh_core_web_sm区别

首先,它们都是预训练的中文模型:

  • zh_core_web_trf:395M
    架构: 基于 Transformer 架构(bert-base-chinese)。
    大小: 较大,通常在几十到几百 MB 之间。
    性能: 最高,尤其在复杂的自然语言处理任务上表现优秀,如命名实体识别、依存关系解析等。
    资源需求: 需要较多的计算资源和时间来加载和运行。
    适用场景: 需要最高准确性的复杂任务,如情感分析、机器翻译等。
  • zh_core_web_lg:575M
    架构: 基于传统的统计方法。
    大小: 较大,通常在几十 MB 到 100 MB 之间。
    性能: 较好,适用于大多数常见的自然语言处理任务。
    资源需求: 需要的计算资源比 trf 模型少,但比 md 模型多。
    适用场景: 一般用途的任务,如文本分类、实体识别等。
  • zh_core_web_md:74M
    架构: 基于传统的统计方法。
    大小: 中等,通常在几十 MB 之间。
    性能: 适中,适用于大多数常见的自然语言处理任务。
    资源需求: 需要的计算资源较少,适合资源受限的环境。
    适用场景: 一般用途的任务,如文本分类、实体识别等。
  • zh_core_web_sm:46M
    架构: 基于传统的统计方法。
    大小: 较小,通常在几 MB 到十几 MB 之间。
    性能: 较低,但在某些简单任务上仍然有效。
    资源需求: 需要的计算资源最少,适合资源非常有限的环境。
    适用场景: 简单的任务,如基本的分词、词性标注等。

下载地址:https://github.com/explosion/spacy-models/

上面这些库下载后都通过pip安装,注意要和对应版本的spacy匹配!

实际使用过程中,发现md、lg、trf三者的区别并不大,也许md是性价比最高的选择?

http://www.lryc.cn/news/493954.html

相关文章:

  • 第六届智能控制、测量与信号处理国际学术会议 (ICMSP 2024)
  • docker服务容器化
  • 【QT】控件8
  • 漫谈推理谬误——错误因果
  • 【数据结构】队列实现剖析:掌握队列的底层实现
  • 【C++】IO库(二):文件输入输出
  • 105.【C语言】数据结构之二叉树求总节点和第K层节点的个数
  • 力扣637. 二叉树的层平均值
  • 【前端】Next.js 服务器端渲染(SSR)与客户端渲染(CSR)的最佳实践
  • 路径规划之启发式算法之一:A-Star(A*)算法
  • Android复习代码1-4章
  • 【问题】webdriver.Chrome()设置参数executable_path报不存在
  • win10系统安装docker-desktop
  • 小程序-基于java+SpringBoot+Vue的乡村研学旅行平台设计与实现
  • 组件A底部栏(position: fixed )事件使用$emit更新内容失败bug解决
  • 数据结构——排序第三幕(深究快排(非递归实现)、快排的优化、内省排序,排序总结)超详细!!!!
  • C++的类功能整合
  • 《String类》
  • 【docker】docker的起源与容器的由来、docker容器的隔离机制
  • Window 安装 Nginx
  • replace (regexp|substr, newSubstr|function)替换字符串中的指定部分
  • 【ROS2】Ubuntu22.04安装ROS humble
  • cesium 3Dtiles变量
  • 配置泛微e9后端开发环境
  • 【Stable Diffusion】安装教程
  • USB Type-C一线通扩展屏:多场景应用,重塑高效办公与极致娱乐体验
  • 【力扣】541.反转字符串2
  • 什么是防抖与节流
  • springboot vue 开源 会员收银系统 (12)购物车关联服务人员 订单计算提成
  • FFmpeg 推流给 FreeSWITCH