当前位置: 首页 > news >正文

初识chatgpt

GPT到底是什么

首先,我们需要了解GPT的全称:Generative Pre-trained Transformer,即三个关键词:生成式 预训练 变换模型。

(1)什么是生成式?

即能够生成新的文本序列。

(2)什么是预训练?

即能够在模型数据集基础上进行无监督学习,当学习到一些通用的特征或知识,就能够讲这些知识迁移到其他任务上。

这种无监督学习,是没有标签/目标,也没有反馈,它自己会寻找数据中隐藏的结构。下图展示了三种学习模式的差别,而ChatGPT采用的实无监督学习 和 强化学习。
在这里插入图片描述

(3)什么是变换模型?

这是一种神经网络结构,通过对输入序列的层层处理,得到最终的输出。

简单地说,它就是一个黑盒子,例如我们在做文本的翻译任务时,当我们输入一个中文,经过这个黑盒子,输出翻译后的英文。当然,这个黑盒子内部有一系列的复杂操作,通过一些 encoder 和 decoder 生成最终的输出,如下图所示。
在这里插入图片描述

GPT的本质是猜概率

现阶段的GPT都是在“玩文字游戏”,它只是在进行一次又一次的概率解题,和我们玩填字游戏是一个逻辑,只不过,我们人类是靠知识和智慧,而AI主要靠概率计算。经过大量的数据训练后,AI预测到下图所示的空格中可能会出现的最高概率的词,进而将其进行输出。

在这里插入图片描述

在基于大语言模型(LLM)基础上,逐渐演进出了两个最主流的方向:BERT 和 GPT。在GPT3.0发布前,GPT一直弱于BERT,而3.0发布之后GPT貌似一骑绝尘了。GPT方向上,最知名的玩家非OpenAI莫属,从我们开始熟悉的GPT3.5到GPT4.0。

生成式AI全景图

生成式AI应用全景图如下图所示,可以看到,它可以做很多个类别的事情,从文本到编码再到图片,以及今年Sora大模型掀起的视频生成浪潮,基于每个类别提供的动力,我们可以在其上层开发构件潜在的应用程序。
在这里插入图片描述

目前生成式AI应用最广泛的当属 文本 和 编码 了,也可以看到,文本 只是 生成式AI生态中的 一环,而不是全部,而这一环就是我们现在学习的 ChatGPT。

ChatGPT的进化过程

下面这张图完整展示了ChatGPT的进化过程,经过了多年的技术积累,最终形成了针对人类反馈信息学习的大规模预训练语言模型。
在这里插入图片描述

ChatGPT可以做什么

ChatGPT很能干,它可以干50+件事情!

在这里插入图片描述

其中,问答、翻译、写文案、提炼文字、生成代码、代码解释 等是最常见的应用场景。

ChatGPT不可以做什么
首先,我们需要知道:ChatGPT本身不是联网的,它的大模型本身就存在时效性,在解决你的问题之前,它所学到的知识将始终落后当前一段时间,因为大模型的重新训练成本很大,因此不是每天更新的,所以不会联网。

因此,我们便可以知道,ChatGPT还不会很快地取代Google和百度帮你查到最新的技术文档,也没法代替小爱同学帮你查询天气,无法替代高德地图帮你推荐附近的美食 等等。

http://www.lryc.cn/news/450930.html

相关文章:

  • 【60天备战2024年11月软考高级系统架构设计师——第33天:云计算与大数据架构——大数据处理框架的应用场景】
  • 如何设计具体项目的数据库管理
  • 对于 Vue CLI 项目如何引入Echarts以及动态获取数据
  • 【Linux笔记】在VMware中,为基于NAT模式运行的CentOS虚拟机设置固定的网络IP地址
  • 一文上手Kafka【中】
  • Ubuntu如何如何安装tcpdump
  • 3-3 AUTOSAR RTE 对SR Port的作用
  • hive/impala/mysql几种数据库的sql常用写法和函数说明
  • 论文阅读:LM-Cocktail: Resilient Tuning of Language Models via Model Merging
  • 8640 希尔(shell)排序
  • Linux 安装redis主从模式+哨兵模式3台节点
  • [BCSP-X2024.小高3] 学习计划
  • Android Debug Bridge(ADB)完全指南
  • 再次重逢,愿遍地繁花
  • 数据结构和算法基础(一)
  • 【超长好文】网络安全从业者面试指南
  • 基于大数据的高校新生数据可视化分析系统
  • 【cache】浅析四种常用的缓存淘汰算法 FIFO/LRU/LFU/W-TinyLFU
  • STM32的DMA技术介绍
  • C++11 多线程编程-小白零基础到手撕线程池
  • 智源研究院与百度达成战略合作 共建AI产研协同生态
  • Flask-SQLAlchemy:在Flask应用中优雅地操作数据库
  • 智能巡检机器人 数据库
  • Spring AOP异步操作实现
  • 【2006.07】UMLS工具——MetaMap原理深度解析
  • ros2 colcon build 构建后,install中的local_setup.bash 和setup.bash有什么区别
  • Thymeleaf基础语法
  • spring cloud alibaba学习路线
  • 基于 Seq2Seq 的中英文翻译项目(pytorch)
  • 部标主动安全(ADAS+DMS)对接说明