当前位置: 首页 > news >正文

AGI思考探究的意义、价值与乐趣 Ⅴ

搞清楚模型对知识或模式的学习与迁移对于泛化意味什么,或者说两者间的本质?相信大家对泛化性作为大语言模型LLM的突出能力已经非常了解了 - 这也是当前LLM体现出令人惊叹的通用与涌现能力的基础前提,这里不再过多赘述,但仍希望大家对泛化能力本身结合特定领域问题进行更延展而深邃的思考,即我们对于泛化本身了解多少?泛化能力是否具备天然分层的特性?泛化本身在真实世界各领域中是否存在一定的结构特异性,即跨不同领域间进一步进行泛化迁移的可能与路径..当前llm的成功或体现出令人惊艳的涌现能力我想对于这种大规模无监督学习以及AR下的next token prediction并非偶然,一定亦是那些先行者洞察到了其中的某些关键要素与内涵后通过不断尝试与实践gradient descent而来的,是的,也许人们的大脑中内置了更加具备泛化的lost function也说不定,就像Ilya去年在伯克利上在无监督学习领域中引入的Kolmogorov(K氏复杂度)、模型对数据压缩的解释以及从条件建模到联合建模压缩的阐释,当然大家也可以回顾之前的几篇笔记,如上一篇「笔记Ⅳ」中的一些洞察和角度...

因此,我想在更多充分的掌握了对于泛化本身更深层次的了解或者仅仅是直觉上的感知也好,在未来针对更复杂的认知模式探索过程中对于模型所采用的训练模式、学习任务、计算方法等将会有着非常重要的指导作用,说不定哪天谁又会带来一些新的炸裂的事情呢?~

78075b2b7503428c900856fa50b80a08.jpg

下面放一段Ilya去年在伯克利上上演讲的一段话,大家可以体会下:)↓

“ 这种联合压缩的思想,才是无监督学习的真正威力所在。因为现实世界的数据往往是相互关联的,存在大量的深层共同模式和规律。如果我们能够用无监督学习去发现和利用这些规律,就能极大地提高学习的效率和泛化能力。”

http://www.lryc.cn/news/415529.html

相关文章:

  • c++: mangle命名规则
  • 系统化学习 H264视频编码(05)码流数据及相关概念解读
  • 【VMware】如何演示使用U盘在VMware虚拟机上安装Windows11
  • HanLP和Jieba区别
  • 荒原之梦考研:考研二战会很难吗?
  • 【Git企业级开发实战指南①】Git安装、基本操作!
  • Leetcode 3239. Minimum Number of Flips to Make Binary Grid Palindromic I
  • C++面试基础算法的简要介绍
  • 【Linux网络编程】套接字Socket(UDP)
  • jvm方法返回相关指令ireturn,areturn,return等分析
  • 宝塔部署springboot vue ruoyi前后端分离项目,分离lib、resources
  • Python 基础教程:List(列表)的使用
  • kubebuilder常用标签
  • ChatTTS文本转语音本地部署结合内网穿透实现远程使用生成AI音频
  • 基于微信小程序的高校大学生信息服务平台设计与实现
  • YOLOV8替换Lion优化器
  • uniapp页面里面的登录注册模板
  • C++新手入门学习教程(完整版)
  • Python 爬虫入门(六):urllib库的使用方法
  • 个人开发神器,一应俱全,有你想要的!
  • 电子电气架构 --- SOVD在域控制器的应用
  • React(四):DOCX文件在线预览
  • Java IO.字符集,流,缓冲流 转换流 对象操作流
  • 线性稳压器的内部电路与构成分析
  • Go语言实现多协程文件下载器
  • 本地方法详解
  • 每日新闻掌握【2024年8月3日 星期六】
  • python入门基础篇(一)
  • windows下在线预览服务kkFileView4.4.0问题记录
  • Java:通过反射获取class类的属性