当前位置: 首页 > news >正文

Meta新模型Dualformer:融合快慢思维,推理能力媲美人脑

Meta 的 FAIR 团队最近推出了一款名为 Dualformer 的全新 Transformer 模型,该模型模仿人类的双重认知系统,能够无缝整合快速和慢速推理模式,在推理能力和计算效率上取得了显著突破。

人类的思维过程通常被认为是由两种系统控制的:系统1快速直观,系统2则更慢但更具逻辑性。

传统的 Transformer 模型通常只模拟了系统1或系统2中的一种,导致模型要么速度快但推理能力差,要么推理能力强但速度慢且计算成本高。

image.png

Dualformer 的创新之处在于其训练方式。研究人员利用随机推理轨迹对模型进行训练,在训练过程中随机丢弃轨迹的不同部分,类似于分析人类思维过程并创建捷径。这种训练策略使 Dualformer 能够在推理时灵活切换不同的模式:

快速模式: Dualformer 只输出最终解决方案,速度极快。

慢速模式: Dualformer 会输出完整的推理链和最终解决方案,推理能力更强。

自动模式: Dualformer 可以根据任务的复杂程度自动选择合适的模式。

image.png

实验结果表明,Dualformer 在迷宫导航和数学问题求解等任务上表现出色。在慢速模式下,Dualformer 能够以97.6% 的成功率解决30x30的迷宫导航任务,超越了只使用完整推理轨迹训练的 Searchformer 模型,同时推理步骤减少了45.5%。

image.png

image.png

在快速模式下,Dualformer 的成功率也高达80%,远高于只使用最终解决方案训练的 Solution-Only 模型。在自动模式下,Dualformer 则能够在保持高成功率的同时,显著减少推理步骤。

image.png

image.png

Dualformer 的成功表明,将人类认知理论应用于人工智能模型设计能够有效提升模型的性能。这种融合快慢思维的模式为构建更强大、更高效的 AI 系统提供了新的思路。

参考文章:Meta新模型Dualformer:融合快慢思维,推理能力媲美人脑 | 进击的胖虎

http://www.lryc.cn/news/462248.html

相关文章:

  • CDGA|数据治理:如何让传统行业实现数据智能
  • Spring源码5.2.9 编译踩坑
  • 【前端】如何制作一个自己的网页(5)
  • Unity实战案例全解析 类宝可梦回合制的初级案例 源码分析(加了注释和流程图)
  • AI绘图大模型 Stable Diffusion 使用详解
  • es索引库操作和使用RestHignLevelClient客户端操作es
  • 安卓数据共享
  • Gin框架操作指南02:JSON渲染
  • 【随手记】MySQL单表访问方法
  • 机器学习:情感分析的原理、应用场景及优缺点介绍
  • 基于SSM的医院药品管理系统
  • 特征融合篇 | YOLOv10 引入动态上采样模块 | 超过了其他上采样器
  • 【Linux系列】写入文本到文件
  • 【踩坑随笔】Tensorflow-GPU训练踩坑
  • 【云岚到家】-day07-4-实战项目-优惠券活动-项目准备
  • axios的使用
  • Ubuntu 使用命令克隆和恢复SD卡
  • Java 小游戏《超级马里奥》
  • go语言defer详解
  • 【C语言】循环中断break
  • centos ping能通但是wget超时-解决
  • SDIO - DWC MSHC 电压切换和频率切换
  • EI-CLIP 深度理解 PPT
  • leetcode力扣刷题系列——【最小元素和最大元素的最小平均值】
  • 【线性回归分析】:基于实验数据的模型构建与可视化
  • CountUp.js 实现数字增长动画 Vue
  • 设计模式大全
  • redis IO多路复用机制
  • Oracle漏洞修复 19.3 补丁包 升级为19.22
  • Q2=10 and Q2=1--PLB(Fig.4)