当前位置: 首页 > news >正文

bert模型笔记

1.各预训练模型说明

在这里插入图片描述
BERT模型在英文数据集上提供了两种大小的模型,Base和Large。Uncased是意味着输入的词都会转变成小写,cased是意味着输入的词会保存其大写(在命名实体识别等项目上需要)。Multilingual是支持多语言的,最后一个是中文预训练模型。

在这里我们选择BERT-Base,Uncased。下载下来之后是一个zip文件,解压后有ckpt文件,一个模型参数的json文件,一个词汇表txt文件。

2.参数错误

当输出出现 args = parser.parse_args()标红时,将 args = parser.parse_args() 替换为:args, unknown = parser.parse_known_args()

3.命令行转换模型(tf到pytorch)chinese_L-12_H-768_A-12

安装:pip install pytorch-pretrained-bert
解压地址:export BERT_BASE_DIR=/path/to/bert/chinese_L-12_H-768_A-12

(地址拼接)转换模型:pytorch_pretrained_bert convert_tf_checkpoint_to_pytorch $BERT_BASE_DIR/bert_model.ckpt $BERT_BASE_DIR/bert_config.json $BERT_BASE_DIR/pytorch_model.bin

4.bert模型的标签

标签默认为0,1,2...n的方式标注,否则需转换。
http://www.lryc.cn/news/547925.html

相关文章:

  • 微信小程序接入deepseek
  • 推荐算法和推荐系统入门第一趴
  • unity pico开发 四 物体交互 抓取 交互层级
  • 基于深度学习的青花瓷图像检索系统开发与实现
  • uniapp 系统学习,从入门到实战(八)—— Vuex 的使用
  • Vue Hooks 深度解析:从原理到实践
  • django中序列化器serializer 的高级使用和需要注意的点
  • 靶场(二)---靶场心得小白分享
  • PHP Error处理指南
  • 视频输入设备-V4L2的开发流程简述
  • 【Manus资料合集】激活码内测渠道+《Manus Al:Agent应用的ChatGPT时刻》(附资源)
  • Mybatis集合嵌套查询,三级嵌套
  • thinkphp5.1 在fetch模版就超时
  • Dockerfile 深入浅出:从基础到进阶全解析
  • CAD2025电脑置要求
  • android App主题颜色动态更换
  • 微服务,服务治理nacos,负载均衡LOadBalancer,OpenFeign
  • 浅论数据库聚合:合理使用LambdaQueryWrapper和XML
  • FastGPT 引申:混合检索完整实例
  • Socket.IO聊天室
  • MySQL表中数据基本操作
  • 可狱可囚的爬虫系列课程 16:爬虫重试机制
  • 第十五届蓝桥杯----B组cpp----真题解析(小白版本)
  • 软考架构师笔记-数据库系统
  • Spring AI 1.0.0-M6 快速开始(一)
  • go 分布式redis锁的实现方式
  • Unity中Stack<T>用法以及删除Stack<GameObject>的方法
  • Vue进阶之Vue3源码解析(二)
  • linux的文件系统及文件类型
  • 如何下载安装 PyCharm?