当前位置: 首页 > news >正文

python-Bert(谷歌非官方产品)模型基础笔记0.1.096

python-bert模型基础笔记0.1.015

    • TODOLIST
    • 官网中的微调样例代码
    • Bert模型的微调限制
    • Bert的适合的场景
    • Bert多语言和中文模型
    • Bert模型两大类
    • 官方建议模型
    • Bert模型中名字的含义
    • Bert模型包含的文件
    • Bert系列模型参数介绍
    • 微调与迁移学习区别
    • Bert微调的方式
    • Pre-training和Fine-tuning区别
    • 关于Fine-tuning需要的硬件资源
    • 模型后缀介绍
    • Bert微调代码
    • Bert的pytorch版本
    • 参考链接

2024年6月7日19:15:13----0.1.095
2024年6月7日19:32:17----0.1.096

TODOLIST

  1. 下游任务
  2. 小数据微调模型
  3. 增量训练

官网中的微调样例代码

  1. 句子分类的样例代码:run_classifier.py
  2. 完形填空的例子:run_squad.py
  3. 句子编码的例子:extract_features.py

Bert模型的微调限制

我们做的具体领域任务对网络的设计要求必然得和预训练任务是一致的,主要包含下面两种任务:
任务一:屏蔽语言模型(Masked LM)
任务二:相邻句子判断(Next Sentence Prediction)

Bert的适合的场景

裸跑都非常优秀,句子级别(例如,SST-2)、句子对级别(例如MultiNLI)、单词级别(例如NER)和跨度级别(例如SQuAD),一般有如下场景:

  1. 一种是 fine-tune(微调)方法,
  2. 一种是 feature extract(特征抽取)方法,就是直接获取预训练的BERT模型的输出作为特征,对预训练的BERT的模型参数不会有任何改动。

Bert多语言和中文模型

参考链接:https://github.com/google-research/bert/blob/master/multilingual.md

  1. 中文简繁体模型(BERT Chinese-only Model )
    BERT-Base, Chinese: Chinese Simplified and Traditional, 12-layer, 768-hidden, 12-heads, 110M parameters
  2. 其他非拉丁字母文本模型(BERT Multilingual Model )
    BERT-Base, Multilingual Cased (New, recommended): 104 languages, 12-layer, 768-hidden, 12-heads, 110M parameters
    BERT-Base, Multilingual Uncased (Orig, not recommended): 102 languages, 12-layer, 768-hidden, 12-heads, 110M parameters

Bert模型两大类

BERT-Base 和 BERT-Large

官方建议模型

  1. Uncased
http://www.lryc.cn/news/366350.html

相关文章:

  • Linux的命令补全脚本
  • 前端 JS 经典:打印对象的 bug
  • 大型语言模型简介
  • javaWeb4 Maven
  • eclipse连接后端mysql数据库并且查询
  • Windows mstsc
  • 百度/迅雷/夸克,网盘免费加速,已破!
  • SOA的参考架构
  • 前端开发-表单和表格的区别
  • Data Management Controls
  • NextJs 数据篇 - 数据获取 | 缓存 | Server Actions
  • 腾讯开源人像照片生成视频模型V-Express
  • pytorch使用DataParallel并行化保存和加载模型(单卡、多卡各种情况讲解)
  • PS初级|写在纸上的字怎么抠成透明背景?
  • Docker面试整理-Docker的网络是如何工作的?
  • 获得抖音商品评论 API 返回值
  • Qt | QtBluetooth(蓝牙电脑当服务端+手机当客户端) 配对成功啦
  • 我找到了全网最低价买服务器的 bug !!!
  • 聚类的外部指标(Purity, ARI, NMI, ACC) 和内部指标(NCC,Entropy,Compactness,Silhouette Index)
  • 国标GB/T 28181详解:国标GBT28181-2022的客户端主动发起历史视音频回放流程
  • Vue项目安装axios报错npm error code ERESOLVE npm error ERESOLVE could not resolve解决方法
  • 【Linux】Centos7升级内核的方法:yum更新(ELRepo)
  • 【CSS】object-fit 和 object-position 属性详解
  • 【算法专题--栈】最小栈--高频面试题(图文详解,小白一看就会!!)
  • Vite项目构建chrome extension,实现多入口
  • 【vector模拟实现】附加代码讲解
  • 本地运行ChatTTS
  • 应用解析 | 面向智能网联汽车的产教融合解决方案
  • 华为设备动态路由OSPF(单区域+多区域)实验
  • R语言探索与分析19-CPI的分析和研究