当前位置: 首页 > news >正文

BERT预训练的MLM和NSP任务的损失函数都是什么?

引言

       BERT预训练过程中包括两个主要任务:Masked Language Modeling(MLM) 和 Next Sentence Prediction(NSP)。

MLM损失函数:

       在MLM任务中,模型需要根据上下文预测被MASK掉的词语。具体来说,输入序列中的一部分词语被随机MASK,模型需要依据未被MASK的词语来预测这些被MASK的词语。

损失函数:

       MLM任务通常使用多类别交叉熵损失函数(Cross-Entropy Loss)。对于每一个被MASK的位置,计算模型预测的词与真实词之间的交叉熵损失。数学表达式为:

L MLM = − ∑ i ∈ M log ⁡ P ( w i ∣ C i ) L_{\text{MLM}} = -\sum_{i \in \mathcal{M}} \log P(w_i | C_i) LMLM=iMlogP(wiCi)

其中:

M \mathcal{M} M:被MASK的词语在序列中的位置集合。
w i

http://www.lryc.cn/news/477411.html

相关文章:

  • 微信发布测试版4.0,碰瓷NT版QQ?
  • 数据库->视图
  • 华为HarmonyOS打造开放、合规的广告生态 - 贴片广告
  • vue3 v-for循环子组件上绑定ref并且取值
  • GitHub个人主页美化
  • 云短信平台优惠活动
  • Pyecharts使用本地文件绘制美国地图
  • lanqiaoOJ 3255:重新排队 ← STL list 单链表
  • 解决虚拟机启动报:此主机支持AMD-V,但AMD-V处于禁用状态
  • 【安装配置教程】二、VMware安装并配置ubuntu22.04
  • ‌5G SSB(同步信号块)位于物理层‌
  • 40.第二阶段x86游戏实战2-初识lua
  • 官方redis安装
  • OpenEuler 使用ffmpeg x11grab捕获屏幕流,rtsp推流,并用vlc播放
  • 呼叫中心报工号功能有没有价值?有没有更好的方案?
  • Unity 6 基础教程(Unity 界面)
  • Vue插槽的使用场景
  • Redis 下载安装(Windows11)
  • 求平面连接线段组成的所有最小闭合区间
  • 编译安装并刷写高通智能机器人SDK
  • 软考:案例题分析1101
  • 如何检查雷池社区版 WAF 是否安装成功?
  • 一周内从0到1开发一款 AR眼镜 相机应用?
  • vue3中setup的作用是什么?
  • java.io.FileNotFoundException: Could not locate Hadoop executable: (详细解决方案)
  • 事件捕获vs 事件冒泡,延申事件委托
  • 接口测试(十一)jmeter——断言
  • 使用buildx构建多架构平台镜像
  • 宠物领养救助管理软件有哪些功能 佳易王宠物领养救助管理系统使用操作教程
  • Spring Boot中实现多数据源连接和切换的方案