当前位置: 首页 > news >正文

Think | 大模型迈向AGI的探索和对齐

注:节选自我于24年初所写的「融合RL与LLM思想探寻世界模型以迈向AGI」散文式风格文章,感兴趣的小伙伴儿可以访问我的主页置顶或专栏收录,并制作了电子书供大家参考,有需要的小伙伴可以关注私信我,因为属于技术散文风格,阅读起来不会像论文文献那样过于晦涩。

b8e492216d534add9417122fca534449.jpg

【节选内容】↓

“...想先为大家做一下这方面的思想试验,有的时候我在想很多RL中所运用的那些看似巧妙而又让人略感毛燥的算法,不论在空间的探索与利用阶段,还是在奖励反馈阶段,如AlphaGO在围棋中的复杂决策,是否能够合理且完备的完成探索、反馈、学习中在近乎无限的大量数据中习得泛化经验吗?当然如果数据确实是无限大的,那么对于pre-training来说其代价是否太高了?而对于alignment来说,则会面临数据alignment本身的诸多挑战,如:

如何找到完备且充分的与alignment相匹配的样本数据分布?

alignment过程中的数据多样性的保障?

在复杂的策略空间探索中,其泛化能力集合的分布是怎样的?

对于当下llm合成数据的方式看起来能够基于一定预先规划的策略解决上述部分问题,然而合成数据是否能在生成数据的过程中涌现出新的洞察或知识,即实现基于策略合成上的自主空间探索,且是完备的吗?怎么理解和衡量这种完备性等问题,我想未来都待进一步进行这方面的理论探索以系统性解决,不然我想众多AIer们还将在这里step by step持续的探索,当然这也也是一种美妙和享受的过程:)另外,对大量历史真实世界数据的采样,是否仅仅是学习人类过去已经先验并总结过知识并形成的最终文本表征的结论,其对应的本质等价于这些知识或结论最终仍是来自于真实世界数据的的分布或构象上的表征,而这种历史数据的分布或构象似乎无法通过模型的自回归生成式模式习得到人类在现实世界中未曾见到、更深刻的洞见以及新的知识结构,似乎仅仅是对生成的语言分布概率做了重新排列或组合,并在这种重排列或组合的过程中反复利用已经掌握的泛化能力进行表象知识的发现、探索和链接,从而扩展了某种维度的知识结构。

60148a658d2b4718991448f83c285039.jpg

因此,这里我们是否也会回归到对历史经验的pre-training到当下过程中的exploration再到alignment的一些本质问题的思考?是否在他们之间底层对数据的理解与操作上有着不同的角度或内在联系?

2195a06a237f4a568b80653d31444383.jpg

 

http://www.lryc.cn/news/422904.html

相关文章:

  • 为什么选择在Facebook投放广告?
  • 10 ARM 体系
  • ubuntu中设置开机自动运行的(sudo)指令
  • 删掉Elasticsearch6.x 的 .security-6索引会怎么样?
  • Navicat Premium15 下载与安装(免费版)以及链接SqlServer数据库
  • Vue3配置vite.config.js代理解决跨域问题
  • Solidity面试题,由浅入深
  • 变量的注意或许需要调试
  • C# 增删改查教程 代码超级简单
  • OceanBase V4.2特性解析:OB Oracle模式下的 SDO_GEOMETRY 空间数据类型
  • 简介面向对象的封装、继承、多态和抽象
  • OpenCV + CUDA + cuDNN模块编译
  • Redis 缓存预热、雪崩、穿透、击穿
  • 仿RabbiteMq简易消息队列基础篇(gtest的使用)
  • 图像处理中的图像梯度和幅值是什么???(通俗讲解)
  • 01.计算机网络导论
  • API网关:SpringCloud GateWay
  • 【Leetcode 383】赎金信 —— 哈希表 有注解
  • Linux 常见的冷知识集锦
  • 【喜报】科大睿智祝贺青岛海信网络科技通过CMMI5级评估
  • 2024全国大学生电子设计大赛全国初赛 E题 三子棋游戏装置 一等奖满分最简方案
  • 尚品汇-ES(三十一)
  • NC 跳台阶
  • linux 文件编程
  • 【后端速成 Vue】实现动态表白墙
  • 【日常开发】 java返回ECharts数据结构封装
  • Table表格控件实现单选功能
  • AI技术加速落地 港科广联手思谋打开智能缺陷检测新纪元
  • Python爬虫开发:BeautifulSoup、Scrapy入门
  • 数据科学、数据分析、人工智能必备知识汇总-----常用数据分析方法-----持续更新