当前位置: 首页 > news >正文

Advances and Challenges in Foundation Agents--Memory调研

https://arxiv.org/pdf/2504.01990#page=64.19
在这里插入图片描述

Memory

1 Representation

名称引用
SensoryText-basedRecAgent202595
SensoryText-basedCoPS202429
SensoryText-basedMemoryBank2024300
SensoryText-basedMemory Sandbox202346
SensoryMulti-modalVideoAgent202488
SensoryMulti-modalWorldGPT202448
SensoryMulti-modalAgentS202451
SensoryMulti-modalOS-Copilot2024117
SensoryMulti-modalMuLan20243
Short-termContextMemGPT2023203
Short-termContextKARMA202410
Short-termContextLSFS20241
Short-termContextOSCAR202415
Short-termContextRCI2023445
Short-termWorkingGenerative Agent20232705
Short-termWorkingRLP202317
Short-termWorkingCALYPSO202362
Short-termWorkingHiAgent202424
Long-termSemanticAriGraph202427
Long-termSemanticRecAgent202595
Long-termSemanticHippoRAG2024124
Long-termEpisodicMobileGPT202330
Long-termEpisodicMemoryBank2024300
Long-termEpisodicEpisodic Verbalization20246
Long-termEpisodicMrSteve20245
Long-termProceduralAAG20241
Long-termProceduralCradle202455
Long-termProceduralARVIS-12024121
Long-termProceduralLARP202320

2 Lifecycle

名称引用
AcquisitionInformation CompressionHiAgent202424
AcquisitionInformation CompressionLMAgent20245
AcquisitionInformation CompressionReadAgent202439
AcquisitionInformation CompressionM2WF20252
AcquisitionExperienceConsolidationExpeL2024300
AcquisitionExperienceConsolidationMindOS2024/54/40
EncodingSelective AttentionAgentCorrd202430
EncodingSelective AttentionMS202419
EncodingSelective AttentionGraphVideoAgent20251
EncodingSelective AttentionA-MEM2024/56/45
EncodingMulti-modalFusionOptimus-1202441
EncodingMulti-modalFusionOptimus-220258
EncodingMulti-modalFusionJARVIS-12024121
DerivationReflectionAgent S202451
DerivationReflectionOSCAR202415
DerivationReflectionR2D220250
DerivationReflectionMobile-Agent-E202539
DerivationSummarizationSummEdits202372
DerivationSummarizationSCM202322
DerivationSummarizationHealthcare Copilot2024/530/59
DerivationKnowledge DistillationKnowagent202456
DerivationKnowledge DistillationAoTD20247
DerivationKnowledge DistillationLDPD20258
DerivationKnowledge DistillationSub-goal Distillation20243
DerivationKnowledge DistillationMAGDi202422
DerivationSelective ForgettingLyfe Agent202341
DerivationSelective ForgettingTiM202357
DerivationSelective ForgettingMemoryBank2024301
DerivationSelective ForgettingS32023/4100/40
RetrievalIndexingHippoRAG2024126
RetrievalIndexingTradingGPT202364
RetrievalIndexingLongMemEval202433
RetrievalIndexingSeCom20255
RetrievalMatchingProduct Keys2019161
RetrievalMatchingOSAgent20245/40
Neural MemoryAssociative MemoryHopfield Networks2017/20277/749
Neural MemoryAssociative MemoryNeural Turing Machines202217
Neural MemoryParameterIntegrationMemoryLLM202434
Neural MemoryParameterIntegrationSELF-PARAM20242
Neural MemoryParameterIntegrationMemoRAG202411
Neural MemoryParameterIntegrationTTT-Layer2024128
Neural MemoryParameterIntegrationTitans202471
Neural MemoryParameterIntegrationR3Mem20253
UtilizationRAGRAGLAB202417
UtilizationRAGAdaptive Retrieval2022681
UtilizationRAGAtlas2023/44/5
UtilizationLong-context ModelingRMT2022/3208/105
UtilizationLong-context ModelingAutoCompresso2023211
UtilizationLong-context ModelingICAE2023169
UtilizationLong-context ModelingGist2023239
UtilizationLong-context ModelingCompAct202427
UtilizationAlleviating HallucinationLamini202411
UtilizationAlleviating HallucinationMemoria20237
UtilizationAlleviating HallucinationPEER202448/65

例如,RecAgent[259]采用基于llm的感觉记忆模块对原始观测进行编码,同时过滤噪声和不相关的内容。
例如,RecAgent[259]采用了一种带有重要性评分系统的注意力机制,该系统为压缩的观察值分配相关性分数,优先考虑关键输入,如特定项目的交互,同时强调不太重要的动作。
例如,RecAgent[259]通过将每个观测值与用户行为模拟环境中模拟回合的开始相对应的时间戳相关联来建模保留,该时间戳表示为⟨observation,重要性评分,时间戳⟩

在像MemoryBank[261]这样的人工智能伙伴系统中,语义记忆以自然语言构建用户画像,而情景记忆保留交互历史,增强个性化和上下文感知行为。
在更细粒度的遗忘机制中,MemoryBank[261]采用艾宾浩斯遗忘曲线(Ebbinghaus forgetting Curve)来量化遗忘率,同时考虑了时间衰减和间隔效应,即重新学习信息比第一次学习更容易的原则。

Expel[96]构建了一个经验库,从训练任务中收集和提取见解,促进对未见任务的推广。
ExpeL[96]利用反思来收集过去的经验,以便将其推广到看不见的任务,并支持失败后的反复尝试。
通过像reflex[75]和ExpeL[96]这样的系统,智能体通过自主管理经验收集、分析和应用的完整周期,实现了复杂的体验式学习,使它们能够从成功和失败中有效地学习。

http://www.lryc.cn/news/614430.html

相关文章:

  • WPF 双击行为实现详解:DoubleClickBehavior 源码分析与实战指南
  • 基于ffmpeg和rk3588的mpp编解码库多路融屏程序设计
  • 贝叶斯定理 vs 条件概率
  • Redis(⑤-线程池隔离)
  • 【从0到1制作一块STM32开发板】6. PCB布线--信号部分
  • React函数组件灵魂搭档:useEffect深度通关指南!
  • 如何实现在多跳UDP传输场景,保证单文件和多文件完整传输的成功率?
  • 三相交流电机旋转磁场产生原理
  • Django模型开发全解析:字段、元数据与继承的实战指南
  • Flutter开发 多孩子布局组件
  • [202403-B]算日期
  • 蓝桥杯----大模板
  • V4L2摄像头采集 + WiFi实时传输实战全流程
  • FreeRTOS入门知识(初识RTOS)(一)
  • Chat GPT5功能
  • 使用 Gulp 替换 XML 文件内容
  • 明厨亮灶场景下误检率↓76%:陌讯多模态融合算法实战解析
  • Ignite节点生命周期钩子机制详解
  • 基于Spring Boot的Minio图片定时清理实践总结
  • 如何使用Databinding实现MVVM架构
  • GPT5新功能介绍以及和其他模型对比
  • InfluxDB漏洞:Metrics 未授权访问漏洞
  • 借助Rclone快速从阿里云OSS迁移到AWS S3
  • 【数据结构】哈希扩展学习
  • 在 Mac 上安装 IntelliJ IDEA
  • 达梦(DM)闪回使用介绍
  • 智能云探索:基于Amazon Bedrock与MCP Server的AWS资源AI运维实践
  • 微信小程序miniprogram-ci 模块实现微信小程序的自动上传功能
  • 微型导轨在半导体制造中有哪些高精密应用场景?
  • 5 种简单方法将 Safari 书签转移到新 iPhone