当前位置: 首页 > news >正文

李宏毅生成式AI课程笔记(持续更新

01 ChatGPT在做的事情

image-20231010101131534


image-20231010101455962

02 预训练(Pre-train)

ChatGPT

G-Generative

P-Pre-trained

T-Transformer

GPT3 ----> InstructGPT(经过预训练的GPT3)

生成式学习的两种策略

我们在使用ChatGPT的时候会注意到,网站上的回答几乎是一个字一个字给出来的,这里就是生成式学习的两种策略:

“逐个击破”(文字)与“一次到位”(影像)

三种结构数据:文本(由token构成)、影像(像素点)、语音(采样频率)

  • 中文的token -----> 字
  • 英文的token -----> word piece,如unbreakable ----> un break able
image-20231011201121635 image-20231011200609879

Finetuning 与 Prompting

Adapter,不修改模型本身参数,插入一个额外的模组

image-20231014152258648

image-20231012112312322

image-20231014152429645

上图包括了几种Adapter:Bitfit、Houlsby、AdapterBias、Prefix-tuning、LoRA

思维链

Chain of Thought(COT) Prompting

思维链可以大大提高模型的准确率

image-20231012154058010

上图是在要求大语言模型按步骤输出答案和直接要求其输出答案的准确率区别。

03 大模型+大资料

大模型的顿悟

在某个参数量之前,增加参数量不会提高模型的正确率,当提高参数规模到一定程度,会出现准确率突然变高的情况(如下图)

image-20231014154255670

同理,也只有在参数量达到一定程度的时候,思维链和微调才能起作用,如下图:

image-20231014155242360

模型是否知道自己在胡说八道,在参数量足够大的时候,模型才拥有这个能力,如下图:

image-20231014155119589

模型与资料的平衡

足够大的时候,模型才拥有这个能力,如下图:

[外链图片转存中…(img-MTYfwvWJ-1697377074486)]

模型与资料的平衡

image-20231014164316445

http://www.lryc.cn/news/194011.html

相关文章:

  • nodejs+vue+elementui酒店客房服务系统mysql带商家
  • 【网络协议】聊聊网络分层
  • [开源]基于Vue+ElementUI+G2Plot+Echarts的仪表盘设计器
  • html设置前端加载动画
  • 【git的使用方法】——上传文件到gitlab仓库
  • Kafka 开启SASL/SCRAM认证 及 ACL授权(二)ACL
  • Java8 新特性之Stream(三)-- Stream的终结操作
  • 【Vue面试题二十八】、vue要做权限管理该怎么做?如果控制到按钮级别的权限怎么做?
  • 1、验证1101序列(Moore)
  • Java基础面试-BeanFactroy和ApplicationContext
  • js的入口函数
  • [cpp primer随笔] 10. 函数重载与重载决议
  • java_Stream API
  • 红队专题-工具Fscan
  • 【宏实现二进制奇偶位交换】
  • 【Java零基础入门到就业】第一天:java简介和cmd窗口的一些常见命令
  • ubuntu下yolov5 tensorrt模型部署
  • windows Vscode 连接 虚拟机,超详细,含免密免ip配置 以 linux 虚拟机为例
  • 【Unity】VR基础开发2项目准备-VR基本场景构建(OpenXR方向)
  • git checkout 命令
  • 二.镜头知识之镜头总长,法兰距,安装接口
  • Android studio控制台 输出乱码解决方法
  • Hermes - 指尖上的智慧:自定义问答系统的崭新世界
  • 机器学习笔记 - 使用3D卷积神经网络进行视频分类
  • 在Unity中挂载C#脚本的三种方法
  • vue elementui的select组件实现滑到底部分页请求后端接口
  • 【Java 进阶篇】JavaScript电灯开关案例:从原理到实现
  • 并发、并行、同步、异步、阻塞、非阻塞
  • C语言:冒泡排序
  • Android 内容提供者和内容观察者:数据共享和实时更新的完美组合