当前位置: 首页 > news >正文

PaddleNLP的简单使用

1 介绍

PaddleNLP是一个基于PaddlePaddle深度学习平台的自然语言处理(NLP)工具库。

它提供了一系列用于文本处理、文本分类、情感分析、文本生成等任务的预训练模型、模型组件和工具函数。

PaddleNLP有统一的应用范式:通过 paddlenlp.Taskflow 调用,简捷易用。


2 安装

2.1 安装依赖包

pip install python==3.8.10 -i https://mirror.baidu.com/pypi/simple
pip install paddlepaddle==2.4.2 -i https://mirror.baidu.com/pypi/simple
pip install paddlenlp==2.5.2 -i https://mirror.baidu.com/pypi/simplepip install opencv-python -i https://mirror.baidu.com/pypi/simple
pip install paddleocr -i https://mirror.baidu.com/pypi/simplepip install --upgrade opencv-python
pip install --upgrade paddlenlp
pip install --upgrade paddleocr


2.2 验证是否安装成功

执行python命令,未报错则代表安装成功

import paddle
paddle.utils.run_check()

2.3 问题排查

(1)执行时如果报错 ModuleNotFoundError: No module named ‘paddle.nn.layer.layers‘,则再次执行以下安装命令

pip install paddlenlp==2.5.2 -i https://mirror.baidu.com/pypi/simple

3 使用

3.1 中文分词

from paddlenlp import Taskflow# 默认模式-实体粒度分词,在精度和速度上的权衡,基于百度LAC
seg = Taskflow("word_segmentation")
print(seg("PaddleNLP是一个基于PaddlePaddle深度学习平台的自然语言处理工具库"))# 指定模式-粗粒度分词,速度更快,基于jieba
seg = Taskflow("word_segmentation", mode="fast")
print(seg("PaddleNLP是一个基于PaddlePaddle深度学习平台的自然语言处理工具库"))# 精确模式-最准:实体粒度切分准确度最高,基于百度解语
seg_accurate = Taskflow("word_segmentation", mode="accurate")
print(seg_accurate("PaddleNLP是一个基于PaddlePaddle深度学习平台的自然语言处理工具库"))# 批量处理——平均速度更快
print(seg(["PaddleNLP是一个基于PaddlePaddle深度学习平台的自然语言处理工具库","它提供了一系列用于文本处理、文本分类等任务的预训练模型、模型组件和工具函数"]))


4 参考文献

(1) 数据处理轻松搞定:如何利用PaddleNLP高效处理大规模文本数据
(2)ModuleNotFoundError

http://www.lryc.cn/news/290219.html

相关文章:

  • 2. MySQL 多实例
  • 两个五层决策树和一个十层决策树的区别
  • 案例分析技巧-软件工程
  • 如何使用docker compose安装APITable并远程访问登录界面
  • 深入了解Matplotlib中的子图创建方法
  • 云计算运维 · 第三阶段 · git
  • 【幻兽帕鲁】开服务器,高性能高带宽(100mbps),免费!!!【学生党强推】
  • 微信小程序|推箱子小游戏
  • 【Linux】—— 信号的产生
  • 【算法】Hash 算法-关注优化细节
  • 回归预测 | Matlab实现CPO-SVR冠豪猪优化支持向量机的数据多输入单输出回归预测
  • Idea设置代理后无法clone git项目
  • tkMapper 通用mapper的批量更新 批量新增 官方实现 springboot项目 依赖引入
  • 【leetcode刷刷】回溯:77.组合
  • 【OOP】Python的OOP编程笔记
  • 一进一出模拟量信号隔离变送器
  • Mybatis-plus原生pages分页未生效的解决方案
  • 【linux】-centos7版本前后-变化篇
  • 001集—shapefile(.shp)格式详解——arcgis
  • ssrf服务器请求伪造漏洞(个人学习)
  • 【前端web入门第二天】03 表单-下拉菜单 文本域 label标签 按钮 【附注册信息综合案例】
  • 回响科技二面面试题解答
  • node学习过程中的终端命令
  • oracle版本号中的i,G,C代表什么含义
  • Unity2D_角色移动跳跃
  • 23-GPTs Actions详细解析:如何查找、对接API,及如何编写Schema
  • 微信小程序canvas画布实现椭圆元素自由缩放、移动功能
  • 使用Excel计算--任务完成总工作日时长
  • JavaWeb后端登录校验功能(JWT令牌技术,Cookie技术,Session,拦截技术,过滤器)
  • 7-上传下载