当前位置: 首页 > news >正文

GRIT论文阅读笔记

在这里插入图片描述

  • 一篇试图统一生成任务和编码任务的工作,就是把只能完成生成任务的GPT改成既能生成又能encode。
  • 思路其实很简单,就是在输入的时候添加instruction tokens来指引模型做representation还是generation,然后各自算损失。representation任务用的是document和query的对比学习。把最后一层的token给mean pooling(只对word tokens做,不对instruction做)出一个embedding算对比损失,做generation的时候就按generation的流程来,思路很简单没什么特别的。
  • 另一点细节是representation的时候是没有mask的,generation的时候才做mask
    在这里插入图片描述
http://www.lryc.cn/news/379588.html

相关文章:

  • 1980python个性化电影推荐管理系统mysql数据库Django结构layUI布局elasticsearch存储计算机软件工程网页
  • 基于IDEA的Maven(依赖介绍和引用)
  • pytest测试框架pytest-sugar插件生成进度条
  • 若依框架集成微信支付
  • IOS开发学习日记(十七)
  • 【ARMv8/ARMv9 硬件加速系列 2 -- ARM NEON 加速运算介绍】
  • LayoutSystem布局系统
  • 滚球游戏笔记
  • Mysql8死锁排查
  • 程序猿成长之路之数据挖掘篇——决策树分类算法(1)——信息熵和信息增益
  • 数据通信与网络(五)
  • 数据中心容灾考题
  • win10远程桌面连接端口,远Win10远程桌面连接端口修改及无法连接解决方案
  • 基于AT89C52单片机的温度报警系统
  • [保姆级教程]uniapp配置vueX
  • 第二次IAG
  • 智慧校园综合管理系统的优点有哪些
  • 如何跳出认知偏差,个人认知能力升级
  • Scala中的map函数
  • linux安装conda环境实践
  • Flutter-实现头像叠加动画效果
  • MSPM0G3507——特殊的串口0
  • 如何选择合适的大模型框架:LangChain、LlamaIndex、Haystack 还是 Hugging Face
  • TCP 协议详解:三次握手与四次挥手
  • Matlab 单目相机标定(内置函数,棋盘格)
  • C语言第17篇:预处理详解
  • 用 Git 玩转版本控制
  • AJAX中get和post的区别
  • 软件测试笔记
  • Elasticseach RestClient Api