当前位置: 首页 > news >正文

深度学习算法bert

bert 属于自监督学习的一种(输入x的部分作为label)

1. bert是 transformer 中的 encoder ,不同的bert在encoder层数、注意力头数、隐藏单元数不同

2. 假设我们有一个模型 m ,首先我们为某种任务使用大规模的语料库预训练模型 m 。现在来了一个新任务,并有一个新模型,我们使用已经训练过的模型(预训练的模型) m 的参数来初始化新的模型,而不是使用随机参数来初始化新模型。然后根据新任务调整(微调)新模型的参数

3. bert(预训练做两个任务,一是填空(预测被屏蔽掉的词)二是 NSP 判断是否下一句(预测CLS)),但接下来可以做其他任务,又叫微调(需要一些标注数据

4. 输入到bert模型之前需要编码

token embedding + segment embedding + position embedding

http://www.lryc.cn/news/391978.html

相关文章:

  • PyTorch - 神经网络基础
  • docker-compose搭建minio对象存储服务器
  • vue3使用pinia中的actions,需要调用接口的话
  • Python酷库之旅-第三方库Pandas(003)
  • 社交电商中的裂变营销利器,二级分销模式,美妆家具成功案例分享
  • 【国产开源可视化引擎Meta2d.js】图层
  • 基于Redisson实现分布式锁
  • Android Studio下载Gradle特别慢,甚至超时,失败。。。解决方法
  • leetcode--二叉树中的最长交错路径
  • c++ primer plus 第15章友,异常和其他:15.1.3 其他友元关系
  • uniapp+vue3页面跳转和传参
  • 硬链接和软链接
  • 属性描述符初探——Vue实现数据劫持的基础
  • 字节也没余粮了?天底下没有永远免费的GPT-4;AI产品用订阅制就不合理!让用户掏钱的N种定价技巧嘿嘿 | ShowMeAI日报
  • 【Matlab 路径优化】基于蚁群算法的XX市旅游景点线路优化系统
  • 我关于Excel使用点滴的笔记
  • 【Java安装】windows10+JDK21+IDEA
  • 《简历宝典》01 - 一文带你学会如何写一份糟糕透顶的简历
  • 多链路聚合通信路由在应急救援活动中的重要性及解决方案
  • PyCharm中如何将某个文件设置为默认运行文件
  • 【杂交版】植物大战僵尸杂交版v2.1最新版本下载链接
  • 图像增强及运算篇之图像掩膜直方图和HS直方图
  • Python商务数据分析知识专栏(六)——Python数据分析的应用④Python数据分析实训
  • 【Python机器学习】处理文本数据——将文本数据表示为词袋
  • 论文写作全攻略:Kimi辅助下的高效学术写作技巧
  • 通证经济重塑经济格局
  • linux - cp 命令
  • 基于Qt实现的PDF阅读、编辑工具
  • Linux 内核 GPIO 用户空间接口
  • Hive数据倾斜--处理方法