当前位置: 首页 > news >正文

聊聊AI大模型的上下文工程(Context Engineering)

聊聊AI上下文工程


上下文工程(Context Engineering)技术简介

核心定义

“上下文工程是一门精细的艺术与科学——其本质是在每个Agent执行步骤中,将恰到好处的信息精准填充至上下文窗口。”
—— Andrej Karpathy(前特斯拉AI总监)

技术类比

计算机系统LLM Agent系统
CPU大语言模型(LLM)
RAM上下文窗口(Context Window)
操作系统调度上下文工程策略

为什么需要上下文工程?

Agent在长任务执行中面临三大核心挑战:
⚠️ 上下文污染(幻觉信息混入)
⚠️ 上下文过载(超10万token后性能骤降)
⚠️ 工具混淆(>30个工具时准确率下降70%)

案例:Anthropic实验显示,多Agent系统通过上下文隔离使研究任务准确率提升90.2%


四大核心策略框架

🔧 1. 写入策略(Write)

场景:保存中间结果避免污染主上下文
技术实现

  • 动态草稿本:LangGraph的State对象持久化会话状态
# LangGraph状态对象示例
state = {"scratchpad": "当前计划步骤:1.检索用户历史 2.验证策略合规性"}
  • 长期记忆:Reflexion架构的自我反思记忆机制

ChatGPT实践:自动生成跨会话的用户偏好记忆

🎯 2. 选择策略(Select)

突破点:动态装载关键信息
关键技术

  • 工具动态装载:RAG筛选相关工具描述
# RAG工具选择(工具数>30时准确率↑3倍)
relevant_tools = vector_db.search("支付API", top_k=3)
  • 记忆精准召回:Embedding+知识图谱双索引

Claude Code实践:CLAUDE.md文件固化高频指令

🗜️ 3. 压缩策略(Compress)

临界值:上下文达窗口95%时自动触发
最佳实践

技术压缩率适用场景
递归摘要(Recursive)70%长对话历史
Provence修剪器85%问答场景
结构化提取90%合同/代码等文档处理
🛡️ 4. 隔离策略(Isolate)

架构革新

  • 多Agent沙箱:HuggingFace的CodeAgent架构

HuggingFace的CodeAgent架构

  • 状态隔离:LangGraph字段级上下文控制

优势:隔离高风险操作,阻止92%的提示注入攻击


LangGraph工程实践

🛠️ 全链路支持方案
策略实现方式性能增益
写入控制Checkpoint持久化机制减少40%重复推理
动态选择BigTool语义工具检索库工具选择速度↑77%
智能压缩消息列表自动摘要APIToken消耗↓65%
沙箱隔离E2B/Pyodide安全执行环境错误率↓58%
📊 效能监控方案
# LangSmith监控示例(关键指标)
metrics = {"context_utilization": "92%", "tool_call_success": "98%","hallucination_rate": "0.7%"
}

行业应用启示

  1. 金融合规场景
    Anthropic航空客服系统:

    • 结合think工具+政策提示模板
    • 合规检查准确率↑54%
  2. 代码Agent设计
    Windsurf最佳实践:

    1. AST语义代码分块  
    2. 知识图谱索引  
    3. 动态重排上下文
    
  3. 医疗诊断Agent
    关键创新:

    • DICOM影像隔离沙箱处理
    • 诊断依据动态装载机制

核心结论

上下文≠内存垃圾场:精准度 > 信息量
动态优于静态:实时装载击败全量加载
隔离创造价值:多Agent架构提升上限

“未来3年,上下文工程能力将成为Agent开发者的核心竞争力” - LangChain CTO

立即行动

  1. 用LangSmith分析上下文瓶颈
  2. 在关键节点实施Write-Select-Compress-Isolate四步策略
  3. 优先测试工具动态装载与沙箱隔离

文档版本:v2.1 | 基于LangChain技术白皮书(2025)
注:保留英文术语便于跨团队协作,关键概念附技术实现参考


参考

https://blog.langchain.com/context-engineering-for-agents/

更多技术干货欢迎关注微信公众号“风雨同舟的AI笔记”~

【转载须知】:转载请注明原文出处及作者信息

http://www.lryc.cn/news/585512.html

相关文章:

  • Spring 声明式事务:从原理到实现的完整解析
  • 运行ssh -T git@github.com报错
  • 多端协作白板:如何改变传统会议模式!
  • 设计模式 - 面向对象原则:SOLID最佳实践
  • 多态 使用场景
  • 【三维重建工具】NeRFStudio、3D GaussianSplatting、Colmap安装与使用指南
  • VOB如何转换成MP4格式?3种快速转换教程推荐
  • GT IP核仿真测试
  • Kubernetes 高级调度特性
  • 基于kafka的分布式日志收集与实时监控平台(原理,框架)
  • Spring MVC中异常处理
  • unity VR linerenderer的线会被UI盖住
  • 博客系统开发全流程解析(前端+后端+数据库)与 AI 协作初体验
  • [electron]升级功能
  • Android 12系统源码_分屏模式(一)从最近任务触发分屏模式
  • 有限状态机FSM(Finite State Machine)自动初始化
  • 提升你的AI交互技能:使用Anthropic互动提示教程
  • 2025年亚太中文赛B题第一版本超详细解题思路
  • CMU15445-2024fall-project1踩坑经历
  • 学弟让我帮忙写一个学生管理系统的后端,我直接上科技
  • 【八股消消乐】浅尝Kafka性能优化
  • IAR携手矽力杰与普华基础软件,共推RISC-V车规芯片高安全应用落地
  • 必备软件推荐:1、Everything:Windows 文件查找的终极利器
  • PyInstaller打包完整指南1
  • 【web应用】若依框架前端报表制作与导出全攻略(ECharts + html2canvas + jsPDF)
  • 8-day06预训练模型
  • CReFT-CAD 笔记 带标注工程图dxf,png数据集
  • 上位机知识篇---常见的文件系统
  • 灰盒级SOA测试工具Parasoft SOAtest重新定义端到端测试
  • QT控件 使用QtServer系统服务实现搭建Aria2下载后台服务,并使用Http请求访问Json-RPC接口调用下载退出