当前位置: 首页 > news >正文

大模型微调--文章3

 原文地址

链接:https://zhuanlan.zhihu.com/p/635848732

思考题

问题1:p-tuning为了解决什么问题?(解决)

答案:该方法的提出主要是为了解决这样一个问题:大模型的Prompt构造方式严重影响下游任务的效果。比如:GPT-3采用人工构造的模版来做上下文学习(in context learning),但人工设计的模版的变化特别敏感,加一个词或者少一个词,或者变动位置都会造成比较大的变化。

问题2:什么是NLU任务?(解决)

答案:自然语言理解,是自然语言处理(NLP)中的一个重要子领域,涉及理解和处理人类语言的语义和语法,以便机器能够从文本中提取有意义的信息。NLU任务通常涉及对文本的深层次理解,包括解析句子结构、理解上下文、推理隐含意义。

问题3:什么是P-tuning?与prefix tuning有什么区别?(解决)

答案:prefix tuning是在每一层中插入可学习的前缀嵌入序列,而不是直接影响输入,在transformer每一层都添加前缀;

p-tuning是直接在输入层中插入可学习的提示词(软提示),优化这些提示词以提高任务性能,仅在输入层进行更改,在其他层没有操作。

问题4:P-tuning v2的原理是怎么样的?(解决)

答案:P-tuning v2不仅仅在输入层添加软提示,还可以在模型的多个中间层或特定层添加这些提示。这种多层次的提示优化使得模型能够更好地捕捉复杂的语义信息。

问题5:prompt-tunin、prefix tuning、p-tuning和p-tuning2有什么区别和联系?(解决)

答案:p-tuning可以看作是prompt-tunin的发展;p-tuning2可以看作是prefix tuning的发展

问题6:文章主要讲了什么内容?文章结构是什么样的?(解决)

答案:文章主要讲了p-tuning和p-tuning是什么,以及原理是什么,和前一篇的对比。结构上也是这样的。

动手题

1:动手实践prompt-tuning、prefix tuning、p-tuning和p-tuning v2(未解决)

http://www.lryc.cn/news/425606.html

相关文章:

  • 游戏测试中需求分析的本质
  • 2024零基础入行软件测试全网最全攻略
  • spring-boot-starter-quartz 自动化配置解析
  • DM8 数据库查询版本号以及授权到期时间SQL
  • 算法【Java】—— 双指针算法
  • 【Python快速入门和实践013】Python常用脚本-目标检测之按照类别数量划分数据集
  • C++ Primer 总结索引 | 第十八章:用于大型程序的工具
  • Python实现GAN(生成对抗网络)图像修复算法
  • java语言中的websocket
  • ASP.NET在线交流论坛管理系统
  • 【Kubernetes】身份认证与鉴权
  • 数据集与数据库:有什么区别?
  • BurpSuite
  • NetApp数据恢复—NetApp存储误删除文件如何恢复数据?
  • 基于springboot的医药管理系统
  • Android中的EventBus的用法
  • 梧桐数据库(WuTongDB):数据库在数据处理中是如何利用缓存机制的
  • C语言-数据类型
  • 左值引用、右值引用、移动构造
  • tekton通过ceph挂载node_modules的时候报错failed to execute command: copying dir: symlink
  • Xil_DCacheFlushRange的用法
  • k8s使用subpathexpr和hostpath分pod名字持久化日志
  • FChen的408学习日记--三次握手和四次握手
  • Unity技巧:轻松实现鼠标悬停文本时的动态变色效果
  • 谷歌账号活动异常,或者申诉回来以后需要手机验证的原因,以及验证手机号的错误操作和正确操作
  • System V IPC奥秘:解锁共享内存、消息队列与信号量的高效通信之路
  • 怎么将pdf转为ppt文件?pdf转ppt的8个方法
  • 【Datawhale AI夏令营第四期】 魔搭-大模型应用开发方向笔记 Task03 大咖项目分享 人话八股文Bakwaan_Buddy项目开发尝试
  • 如何在wordpress当中使用插件WP Coder(将html、css、javascript应用到wordpress上)
  • ActiveMQ、RabbitMQ、Kafka、RocketMQ在消息回溯、消息堆积+持久化、消息追踪、消息过滤的区别