当前位置：首页 > news >正文

机器学习笔记：李宏毅ChatGPT课程1：刨析ChatGPT

news 2025/9/4 20:07:52

ChatGPT——Chat Generative Pre-trained Transformer

1 文字接龙

每次输出一个概率分布，根据概率sample一个答案
- ——>因为是根据概率采样，所以ChatGPT每次的答案是不一样的
- （把生成式学习拆分成多个分类问题）
将生成的答案加到原来的句子里面

1.1 同时使用同一个会话中之前的互动作为输入

模型的输入不止有现在的互动，还有同一会话中过去的互动
- 这里说的1700亿参数是OpenAI GPT3的参数量

1.2 测试和训练

2 背后的技术——预训练

2.1 预训练的帮助（不同语言训练的迁移性）

在多种语言上预训练，只需要教某一个语言的某一个任务，其他语言的同样任务可以自动学习

2.2 chatGPT的预训练

除了监督学习的Finetune，ChatGPT还使用了强化学习来进行FineTune
- 不直接给他答案，而是给他结论：答案好还是不好
- 相比于监督学习，更省事，更容易收集到更多的资料
- 同时，很多问题人类自己都不知道正确答案（比如创造类的问题，写诗写作文等）

3 ChatGPT带来的研究问题

精准提出要求（Prompting）
更正错误（neural editing）
- 改一个错误，可能会让很多原来对的地方的回答错误
偵測 AI 生成的物件
一些内容不应该被输出（machine unlearning）

视频来源：【生成式AI】快速了解機器學習基本原理 (2⧸2) (已經略懂機器學習的同學可以跳過這段)_哔哩哔哩_bilibili

查看全文

http://www.lryc.cn/news/112717.html

Llama 2 with langchain项目详解（三）

牛客 AB30 排序（快排模板）

【Linux旅行记】第一个小程序“进度条“！

DeepMind将AI用于可控核聚变：将等离子体形状模拟精度提高65%

Scrum是什么意思，Scrum敏捷项目管理工具有哪些？

【从零单排Golang】第十三话：使用WaitGroup等待多路并行的异步任务

WSL2安装CentOS7和CentOS8

不平衡电网条件下基于变频器DG操作的多目标优化研究（Matlab代码Simulink实现）

【Leetcode】（自食用）简单题||单词数

C语言代码的x86-64汇编指令分析过程记录

基于springboot+vue的房屋租赁系统(前后端分离)

Python文件读写操作详解：从基础到高级

ThreadLocal基本介绍

ffmpeg源码编译成功，但是引用生成的静态库(.a)报错，报错位置在xxx_list.c，报错信息为某变量未定义

2023爱分析·信创云市场厂商评估报告：中国电子云

网络安全学习笔记——XFF攻击流程

微信小程序阻止用户返回上一页，并弹窗给用户确定是否要返回上一页

LangChain+ChatGLM整合LLaMa模型（二）

【NLP】训练chatglm2的评价指标BLEU，ROUGE

java+springboot+mysql员工工资管理系统

FL Studio Producer Edition 21 v21.0.3 Build 3517 Windows/mac官方中文版

探索Python数据容器之乐趣：列表与元组的奇妙旅程！

Python自动化实战之使用Pytest进行API测试详解

TCP的三次握手以及四次断开

目标检测YOLO实战应用案例100讲-基于视觉与激光雷达信息融合的智能车辆目标检测研究

Day 22 C++ STL常用容器——string容器

使用Socket实现UDP版的回显服务器

【MCU学习】GD32F427VG开发

Acwing.877 扩展欧几里得算法

基于自组织竞争网络的患者癌症发病预测(matlab代码)

1 文字接龙

1.1 同时使用同一个会话中之前的互动作为输入

1.2 测试和训练

2 背后的技术——预训练

2.1 预训练的帮助（不同语言训练的迁移性）

2.2 chatGPT的预训练

3 ChatGPT带来的研究问题

相关文章：