当前位置: 首页 > news >正文

ChatGPT漫谈(二)

        ChatGPT“脱胎”于OpenAI在2020年发布的GPT-3,任何外行都可以使用GPT-3,在几分钟内提供示例,并获得所需的文本输出。GPT-3被认为是当时最强大的语言模型,但现在,ChatGPT模型似乎更强大。ChatGPT能进行天马行空的长对话,可以回答问题,它具备了类人的逻辑、思考与沟通的能力,并且它的沟通能力在一些领域表现得相当惊人,能与人进行堪比专家级的对话。ChatGPT和GPT-3类似人类的输出和惊人的通用性只是优秀技术的结果,而不是真正的“聪明”。它在本质上只是通过概率最大化不断生成数据而已,而不是通过逻辑推理来生成回复。

ChatGPT是如何炼成的

1.1 出色的NLP模型

        本质上,ChatGPT是一个出色的NLP新模型。说到NLP,大多数人先想到的是Alexa和Siri这样的语音助手,因为NLP的基础功能就是让机器理解人类的输入,但这只是技术的冰山一角。NLP是人工智能(AI)和机器学习(ML)的子集,专注于让计算机处理和理解人类语言。虽然语音是语言处理的一部分,但NLP最重要的进步在于它对书面文本的分析能力。它其中的Transformer模型提供了一种并行计算的方法,使得ChatGPT能够快速生成回答。

1.2 庞大的数据训练

         基于Transformer模型,ChatGPT的开发者们开展了大量的数据训练。在ChatGPT出现以前,OpenAI已经推出了GPT-1、GPT-2、GPT-3。虽然前几代声量不大,但模型都是极大的。GPT-1具有1.17亿个参数,OpenAI使用了经典的大型书籍文本数据集进行模型预训练。20

http://www.lryc.cn/news/97763.html

相关文章:

  • 【LangChain】检索器之MultiQueryRetriever
  • 教师ChatGPT的23种用法
  • 【libevent】http客户端1:转存http下载的数据
  • Pytorch学习笔记 | 数据类型 | mnist数据集
  • Linux虚拟机(lvm)报Unmount and run xfs_repair
  • 【ESP32】Espressif-IDE及ESP-IDF安装
  • 基于vue3实现画布操作的撤销与重做
  • php 抽象工厂模式
  • WPF实战学习笔记13-创建注册登录接口
  • 银行API安全解决方案
  • 3d软件动物生活习性仿真互动教学有哪些优势
  • <C语言> 字符串内存函数
  • 知网的caj格式怎么转化成pdf格式?两个方法简单快捷!
  • 【每日一题】2500. 删除每行中的最大值
  • 通俗解释什么是(ip、网段、端口)
  • PyTorch quantization observer
  • 垃圾回收之三色标记法(Tri-color Marking)
  • Individual household electric power consumption个人家庭用电量数据挖掘与时序预测建模
  • 实验三 贪心算法
  • 详解go的hex.Encode原理
  • R730服务器用光盘安装系统(Esxi系统)
  • SpringCloud nacos 集成 gateway ,实现动态路由
  • flutter:角标
  • 基于JAVA SpringBoot和Vue高考志愿填报辅助系统
  • [php-cos]ThinkPHP项目集成腾讯云储存对象COS
  • DuckDB全面挑战SQLite
  • Elasticsearch查询裁剪
  • Hadoop——Hive运行环境搭建
  • (vue)vue项目中引入外部字体
  • ChatGPT在语义理解和信息提取中的应用如何?