当前位置: 首页 > news >正文

机器学习笔记:李宏毅ChatGPT课程1:刨析ChatGPT

ChatGPT——Chat Generative Pre-trained Transformer

1 文字接龙

  • 每次输出一个概率分布,根据概率sample一个答案
    • ——>因为是根据概率采样,所以ChatGPT每次的答案是不一样的
    • (把生成式学习拆分成多个分类问题)
  • 将生成的答案加到原来的句子里面

1.1  同时使用同一个会话中之前的互动作为输入

  • 模型的输入不止有现在的互动,还有同一会话中过去的互动
    • 这里说的1700亿参数是OpenAI GPT3的参数量

 1.2 测试和训练

 

2 背后的技术——预训练

 

2.1 预训练的帮助(不同语言训练的迁移性)

  • 在多种语言上预训练,只需要教某一个语言的某一个任务,其他语言的同样任务可以自动学习

 

2.2 chatGPT的预训练

  • 除了监督学习的Finetune,ChatGPT还使用了强化学习来进行FineTune
    • 不直接给他答案,而是给他结论:答案好还是不好
    • 相比于监督学习,更省事,更容易收集到更多的资料
    • 同时,很多问题人类自己都不知道正确答案(比如创造类的问题,写诗写作文等)

 3 ChatGPT带来的研究问题

  • 精准提出要求(Prompting)
  •  更正错误(neural editing)

    • 改一个错误,可能会让很多原来对的地方的回答错误

  •  偵測 AI 生成的物件

     

    • ​​​​​​​
  • 一些内容不应该被输出(machine unlearning)

     

视频来源:【生成式AI】快速了解機器學習基本原理 (2⧸2) (已經略懂機器學習的同學可以跳過這段)_哔哩哔哩_bilibili

http://www.lryc.cn/news/112717.html

相关文章:

  • Llama 2 with langchain项目详解(三)
  • 牛客 AB30 排序(快排模板)
  • 【Linux旅行记】第一个小程序“进度条“!
  • DeepMind将AI用于可控核聚变:将等离子体形状模拟精度提高65%
  • Scrum是什么意思,Scrum敏捷项目管理工具有哪些?
  • 【从零单排Golang】第十三话:使用WaitGroup等待多路并行的异步任务
  • WSL2安装CentOS7和CentOS8
  • 不平衡电网条件下基于变频器DG操作的多目标优化研究(Matlab代码Simulink实现)
  • 【Leetcode】(自食用)简单题||单词数
  • C语言代码的x86-64汇编指令分析过程记录
  • 基于springboot+vue的房屋租赁系统(前后端分离)
  • Python文件读写操作详解:从基础到高级
  • ThreadLocal基本介绍
  • ffmpeg源码编译成功,但是引用生成的静态库(.a)报错,报错位置在xxx_list.c,报错信息为某变量未定义
  • 2023爱分析·信创云市场厂商评估报告:中国电子云
  • 网络安全学习笔记——XFF攻击流程
  • 微信小程序阻止用户返回上一页,并弹窗给用户确定是否要返回上一页
  • LangChain+ChatGLM整合LLaMa模型(二)
  • 【NLP】训练chatglm2的评价指标BLEU,ROUGE
  • java+springboot+mysql员工工资管理系统
  • FL Studio Producer Edition 21 v21.0.3 Build 3517 Windows/mac官方中文版
  • 探索Python数据容器之乐趣:列表与元组的奇妙旅程!
  • Python自动化实战之使用Pytest进行API测试详解
  • TCP的三次握手以及四次断开
  • 目标检测YOLO实战应用案例100讲-基于视觉与激光雷达信息融合的智能车辆目标检测研究
  • Day 22 C++ STL常用容器——string容器
  • 使用Socket实现UDP版的回显服务器
  • 【MCU学习】GD32F427VG开发
  • Acwing.877 扩展欧几里得算法
  • 基于自组织竞争网络的患者癌症发病预测(matlab代码)