当前位置: 首页 > news >正文

人究其一生只是在通用智能模型基础上作微调和对齐

Yann LeCun 在 WGS 上说:

目前的LLM不可能走到AGI,原因很简单,现在训练这些LLM所使用的数据量为10万亿个令牌,也就是130亿个词,如果你计算人类阅读这些数据需要多长时间,一个人每天阅读8小时,需要15万年才能读完。

但如果看一个4岁的孩子,已经清醒了总共16,000个小时,但如果你计算进入视觉皮层的数据量,大约每秒20兆字节,那么4年输入的数据量,将是目前最大的LLM的50倍。

因此仅通过在文本上训练AI,永远无法达到人类水平智能。

文本是一个非常贫瘠的信息来源,带宽非常低,只反映了人类知识的很小一部分。人类的大部分知识来自于我们与真实世界、与他人以及其他世界实体的互动,而不是来自语言。

在AI取得真正的进步之前,我们需要一些突破。这个突破将从哪里来?可能是科学层面,不会仅仅通过扩展现有的架构规模并在更多数据上训练它们就能实现。

首先,随着我们增加LLM的数据量,性能正在趋于饱和,我们没有更多的数据,已经用完了互联网上的所有公开数据,所以这行不通(不认可合成数据?)。

婴儿大约只需要九个月就能学会直觉物理学,即物体如果没有支撑物就会因为重力而掉落,他们使用的是哪种学习方式,这仍然是一个谜,我们正在努力解决这个问题,但还需要一段时间。”

铅笔楼:打个可能不太恰当的比方,婴儿的大脑更像是预训练模型,人类亿万年的进化史给每个人提供了通用智能模型,每一个人究其一生只是在通用智能模型的基础之上作微调和对齐。

http://www.lryc.cn/news/299961.html

相关文章:

  • DS:二叉树的链式结构及实现
  • PhP+vue企业原材料采购系统_cxg0o
  • C++线程池
  • SpringCloud-Hystrix:服务熔断与服务降级
  • 浅谈Linux环境
  • Spring 用法学习总结(一)之基于 XML 注入属性
  • 免费软件推荐-开源免费批量离线图文识别(OCR)
  • 2 scala集合-元组和列表
  • Spring Boot开启SSL/Https进行交互。
  • 88.Go设计优雅的错误处理
  • Python4Delphi: Delphi 程序使用 Python 抓取网页
  • 编辑器Zed
  • Java的接口
  • 【计算机网络】计算机软件工程人工智能研究生复试资料整理
  • 【Network Management】AUTOSAR架构下CanNm User Data详解
  • 量子算法入门——2.线性代数与复数
  • 分别通过select、多进程、多线程实现一个并发服务器
  • 如何在 emacs 上开始使用 Tree-Sitter (archlinux)
  • FL Studio2024最新中文版有哪些其新功能特点?
  • Oracle的学习心得和知识总结(三十二)|Oracle数据库数据库回放功能之论文四翻译及学习
  • 系统架构27 - 软件架构设计(6)
  • STM32 cubemx配置DMA+空闲中断接收不定长数据
  • Pycharm配置运行selenium教程
  • 银河麒麟V10开机后黑屏解决方法
  • 【Git版本控制 02】分支管理
  • 基金分类
  • kali系统概述、nmap扫描应用、john破解密码、抓包概述、以太网帧结构、抓包应用、wireshark应用、nginx安全加固、Linux系统加固
  • Spring Cloud 路由和消息传递 (HTTP 路由)
  • 【PyQt】12-滑块、计数控件
  • 【牛客面试必刷TOP101】Day21.BM11 链表相加(二)和BM12 单链表的排序