当前位置: 首页 > news >正文

上海人工智能实验室明珠湖会议首开,解答AI前沿疑问,推进科学智能

在通用人工智能(AGI)探索如火如荼的当下,如何加速突破?如何凝练关键问题、孕育颠覆性创新?2025年6月13日,上海人工智能实验室主任、首席科学家,清华大学惠妍讲席教授周伯文在首届明珠湖会议(星河社区学术系列活动)的开场报告中,深刻阐述了科学社区的力量、提出关键问题的重要性,并重磅发布了关于人工智能未来3-5年发展的“AI前沿十问”。

科学社区:创新的摇篮与引擎

周伯文教授开篇即强调了开放科学社区对于加速科学突破的不可或缺性。他援引历史案例:从英国皇家学会的前身“隐形学院”(1618年)孕育牛顿、霍金等科学巨匠,到工业革命策源地伯明翰的“月光社”(1765年)推动蒸汽机革新,再到奠定互联网基础的“阿帕社区”(1960年代)成员协作催生个人计算机、GUI等划时代成果并诞生7位图灵奖得主,无不证明紧密的思想碰撞与跨领域交流是创新的沃土。

基于此,上海人工智能实验室着力打造“星河学术社区”,旨在成为前沿推进器与创意实践场。明珠湖会议作为其重要学术活动,首期以“人工智能的多维突破与协同创新”为主题,汇聚全球近60位青年学者与产业领袖,目标正是效仿历史上的伟大社区,通过深度交流、激辩,凝练关键科学问题,并推动技术创新与应用落地。会议已初步形成14个提案和39个关键问题清单。

发现问题的投入,与解决问题同等重要

周伯文教授特别指出,在科学研究中,“对发现问题的投入,与解决问题同等重要”,但这一过程常被忽视。他引用图灵奖得主艾伦·凯的观点:“相比解决问题的过程,对发现问题的过程进行资助往往更重要。” 计算机先驱理查德·汉明著名的“汉明问题”(“你们领域最关键的问题是什么?”“那你们为什么不研究这些问题呢?”)更是直指要害——能清晰回答这些问题的人,往往成就斐然。

明珠湖会议的设计正是围绕“提出问题”展开:通过引导报告启发思考、“结对报告”(Pair Talk)激发碰撞、平行论坛深化讨论,鼓励参与者抛开资源限制,思考18-36个月技术窗口期内真正重要、自己愿意投身研究的根本性问题。

AI前沿十问:勾勒未来关键技术节点

针对人工智能未来3-5年的发展趋势,周伯文教授概括为“三化”:智能技术体系化(追究智能本质,完善理论体系)、智能形态多元化(与产业、社会、生活深度结合,呈现多样态)、智能能力高阶化(持续演进的核心动力)。基于此框架,他提出了引发与会者深度思考的“AI前沿十问”:

1、下一代AI for Science:如何从“工具的革命”到“革命的工具”?

AI for Science要真正发挥革命性作用,必须理解科学研究的本质:研究者、研究工具、研究对象三者的交互关系。目前的AI for Science主要关注研究工具层面的单点效率提升(“工具的革命”),而我们需要追求的是能够带来科学范式转变的“革命性工具”,并实现科研各环节全链条水平提升。下一代For Science的AI,如何从“工具的革命”变成“革命的工具”应该是我们这一代人的使命。

如果要成为“革命的工具”,现在的语言模型是否够用?若没有多模态的智能涌现,或许很难实现革命性的AI for Science工具。当前的多模态模型仍然建立在预测下一个token的基础上,缺乏对图表、分子模型、公式和实验观察的深度理解能力。打造能够推动科学突破的AI系统,需要在多模态统一表征方面取得突破。

2、总体智能 vs 单位智能:如何平衡智能发展的质量与效率?

当前大模型评估过度关注总体智能(参数、数据量、排名),却忽视了单位智能(IQ per token)这一关键指标。它衡量单位数据/计算/存储成本产生的智能效率,类似“人均GDP”。

最大化单位智能能显著提升总体智能。例如,DeepSeek模型通过工程创新实现了更高效率。上海人工智能实验室于2025年初正式提出衡量训练数据“投入产出比”的指标IQPT(数据思维密度)。OpenAI研究负责人近期也强调了单位成本智能的重要性。

3、Deep RL规模化发展的资源悖论:如何平衡“数据合成”和“算法训练”两大任务的算力分配?

深度强化学习(Deep RL) 不仅用于学习,更能高效生成高价值数据(如复杂推理数据)。虽然消耗算力,但这些合成数据能反哺预训练,提升模型性能。

理想情况下,可形成“效率飞轮”:Deep RL 消耗的算力与其生成数据所节省的训练成本达到平衡。一旦突破此临界点,AI 便能以极低成本自我迭代升级(“自己训练自己”)。

4、软硬协同创新:软件向硬件适配,还是硬件向软件兼容?

软硬协同路径差异:

  • 国际(如英伟达): “软件兼容硬件” - 深耕生态(如CUDA),使软件高度适配自家硬件。

  • 国内现状: “硬件兼容软件” - 芯片厂商调整硬件(如算子)适配软件需求。

挑战: 硬件研发周期远长于软件迭代,“硬件兼容软件”路径面临逻辑困境。

方向: 学术界需探索更高效协同路径,兼顾性能优化与产业实际需求,促进产业链升级。

5、算力受限的影响:针对应用、迭代和颠覆性的技术,算力应如何配置?

算力运用可划分为三类:

  1. 应用算力:推动成熟技术产业落地。

  1. 迭代算力:支持现有模型优化升级。

  1. 创新算力:用于验证非主流想法,探索颠覆性技术。

现状与挑战: 应用与迭代算力相对充足,但创新算力严重短缺,抑制了颠覆性突破的产生,加剧研究同质化风险。

关键方向: 必须加大创新算力供给,支持差异化思考和非主流技术路线,以打破僵局。

6、Agent与基础模型的关系:Agent是目的还是过程?如何构建真正自主进化的智能体?

我们2023年提出的“融合语言能力的工具平台”构想,与当前Agent理念高度契合。需思考:Agent与基座模型的关系?是最终目的还是实现手段?

当前Agent依赖基础模型,并通过环境/用户互动学习改进,但多数陷入“僵化学习”。DeepMind最新研究(Jonathan Richens, 2025.6)指出:实现通用智能体(AGI)必须掌握世界模型(环境预测),这是应对动态与复杂任务的基础。

核心追问:智能体能否像人类一样,具备真正持续学习(吸收、适应、总结、迁移)的能力,并最终实现“自主进化”?

7、具身智能:超级大脑与本体的关系? 如何突破“莫拉维克悖论”?实现类人的具身进化和环境自适应?

具身智能的核心挑战在于定义“大脑”(智能决策)与“本体”(物理身体)的最优关系。

人类虽在力量、速度等“本体”能力上不占优,但凭借工具创造、环境交互与学习能力(“大脑”优势)突破了生理限制。

研究需避免两种陷阱:“超脑弱体”(决策强但执行差)与“强体简脑”(本体强但决策弱)。目标是找到资源投入的最佳平衡,推动具身智能取得实质性突破。

8、安全可信 vs 智能:如何从Make AI Safe 到 Make Safe AI?

AI安全面临核心转型:需从被动 “修补漏洞” (Make AI Safe) 转向主动 “构建本质安全” (Make Safe AI)。

核心理念: 安全必须是 核心设计原则(“45°平衡律”、 “设计即安全”),而非事后补救。

技术路径与挑战:

  • 形式化AI(如形式化验证、程序合成)用数学确保行为正确性,潜力巨大。

  • 风险: 可能因限制过严导致灵活性下降,引发系统“规避检查”行为。

  • 疑问: 形式化方法能否实现 100% 安全?是否唯一路径?

  • 替代/补充方案: Causal AI (因果)、Explainable AI (可解释) 等。

关键认知: 真正的安全依赖具备自我修正能力的动态机制,而非追求完美规范。

9、高分 vs 高能:从静态到动态? 训练、评测、解决问题一体化?面向AGI的评测应如何建设?

AI评测体系转型:

  • 上半场问题: 重训练方法/架构,但模型与真实“效用”脱节 → “高分低能”。

  • 下半场焦点: 重构任务定义与评估体系,贴近现实世界价值。

新体系核心: 从能力导向(构建评测题)转向任务导向(解决现实高价值问题),实现“评测-解决一体化”(训练中评测,评测中训练,“边做边学”)。

技术支撑: 如上海AI Lab的 “测试时强化学习”(TTRL)(无准确标签下的奖励估计)。其理念与DeepMind领袖提出的“经验时代”方向一致。

10、颠覆性架构是什么?针对Transformer的不足,什么架构能够带来根本性创新?

Transformer架构虽引领了AI革命并支撑了众多顶尖模型,但其在计算效率、上下文理解、推理能力和动态系统模拟等方面的局限日益凸显;突破这些限制需超越现有思维框架,探索全新架构,并思考多元架构如何在未来共存互补,特别是在决策智能、世界智能及生物智能等前沿领域催生下一代AI架构。

为了带来科学范式转变的“革命性工具”,并实现科研各环节全链条水平提升,和鲸科技联合浙江大学地球科学学院共同发起“DDE深时数字地球国际大科学计划系列工作坊”,积极响应我国主导的深时数字地球(DDE)计划。双方以赋能地学人才为核心,依托和鲸社区构建开放协作平台,通过 “地学Python实战培训+可复现应用案例” 的创新模式,助力科研人员提升数据技能,培养解决地球科学重大问题的能力,推动科研范式转型。

http://www.lryc.cn/news/572935.html

相关文章:

  • python自助棋牌室管理系统
  • AWS EC2使用SSM会话管理器连接
  • Rust 项目文档生成之旅:cargo doc
  • 伸缩线充电宝推荐丨倍思灵动充45W突破移动界限!
  • GDI绘制
  • 如何轻松地将音乐从 iPhone 传输到 Mac?
  • 合并两个有序链表C++
  • 深入理解XGBoost(何龙 著)学习笔记(五)
  • 网络编程简介与Netty实战:从入门到高性能Echo服务器
  • 6、ZYNQ PL UART串口(一)
  • 【JS-4.1-DOM获取元素操作】深入理解DOM操作:高效获取页面元素的方法与实践
  • WebGL图形学总结(二)
  • Python开发中虚拟环境的意义
  • 零基础入门PCB设计 一实践项目篇 第四章(STM32开发板PCB设计)
  • MAC环境安装Appium+JAVA
  • Supervisor进程管理
  • 数据结构-顺序表-求基数乘积
  • 阿里云申请ssl证书,同时需要绑定域名,下载nginx压缩包,nginx添加证书路径即可
  • 云徙科技 OMS:让订单管理变得轻松又高效
  • 联邦学习时间开销优化:现状、挑战与研究进展
  • C#的Dynamic、Object、Var
  • 什么是Vue.js
  • Linux -- 线程、锁
  • 大模型Text2SQL之在CentOS上使用yum安装与使用MySQL
  • LeetCode 680.验证回文串 II
  • 大模型在肺癌预测及个性化诊疗方案中的应用研究
  • 数据结构-顺序表-数值统计
  • 如何自建服务器并开启公网IP:本地内网网址让外网访问详细教学
  • Nginx常见功能
  • 基于YOLO的语义分割实战(以猪的分割为例)