当前位置：首页 > news >正文

理解大模型智能体生态：从 Prompt 到 Agent 的完整信息流解析

news 2025/7/9 7:45:07

前言
1 核心组件概览
- 1.1 用户提示（User Prompt）
- 1.2 系统提示（System Prompt）
- 1.3 MCP（Model Context Protocol）
2 AI Agent：让模型拥有“执行力”的大脑
- 2.1 什么是 AI Agent？
- 2.2 Agent 的核心工作流程
3 Function Calling 与 Agent Tools：让模型“动手做事”的执行机制
- 3.1 Function Calling：结构化函数调用能力
- 3.2 Agent Tools：模型的“外挂能力”
4 一图看懂信息流：Prompt 到 Agent 的完整协同路径
5 角色对照表：概念与功能快速对照
6 实际案例演示：行程规划 Agent
结语

前言

大语言模型（LLM）的应用正从单轮问答走向更复杂的智能体系统，具备“理解需求、拆解任务、调用工具、执行动作”一体化的能力。这个过程中，用户的输入（Prompt）只是开端，大模型如何组织上下文、调用外部工具、完成复杂任务，背后则涉及一整套协同机制。

本文将系统介绍以下关键概念之间的关系与工作原理：

User Prompt
System Prompt
MCP（Model Context Protocol）
AI Agent
Agent Tools
Function Calling
大语言模型（LLM）

我们将通过信息流图与实际示例，展示它们如何协同构建一个“能做事”的 AI 系统。

1 核心组件概览

1.1 用户提示（User Prompt）

这是用户直接发出的自然语言请求，是 AI 交互的起点。

例如：

“帮我制定一份一周的云南旅行计划。”

用户可能并不明确期望模型执行什么样的中间步骤，比如天气查询、景点筛选、路线排序等——但智能体需要自己识别这些任务并分解。

1.2 系统提示（System Prompt）

System Prompt 是系统赋予模型的“角色设定”和“行为规范”，通常用于引导模型的身份、语气、风格及应答范围。

例如：

“你是一位经验丰富的旅行规划师，请根据用户提供的信息推荐科学合理的旅游行程。”

System Prompt 通常在会话开始前由开发者注入，不由用户可见。
在这里插入图片描述

1.3 MCP（Model Context Protocol）

MCP，全称 Model Context Protocol，是一种标准化的上下文组织协议，用于向大模型传递结构化、分层次的上下文信息。

相比传统把全部对话拼成一段长文本的做法，MCP 能以模块化方式组织以下内容：

system（系统提示）
user（用户请求）
assistant（模型历史回答）
function_call（调用记录）
function_result（工具返回值）
memory（长期记忆或知识库引用）
tool_list（当前可用工具集）

MCP 让模型在执行任务时，具备对话历史记忆、多轮逻辑追踪、工具调用记录等完整上下文，是 Agent 系统智能行为的关键支撑。
在这里插入图片描述

2 AI Agent：让模型拥有“执行力”的大脑

2.1 什么是 AI Agent？

AI Agent 是运行在大模型之上的智能体框架，具备如下特征：

能理解用户目标和意图
能判断是否需要调用工具
能规划任务步骤并执行
能处理反馈结果并调整策略

例如，在构建一个“行程规划 Agent”时，它不仅能生成路线推荐，还能根据天气情况调整出行顺序，并在必要时调用地图或航班查询 API。

2.2 Agent 的核心工作流程

一个完整的 Agent 交互流程大致如下：

接收用户请求（User Prompt）
组合上下文（MCP）
调用大模型推理是否需要外部信息
若需外部函数 → 发起 Function Calling 请求
等待工具调用结果返回
模型继续生成中间输出或最终回答
如有需要，进入下一轮任务规划与执行

AI Agent 就像一个“具备逻辑控制的调度器”，在大模型与工具之间做出合理调度。

3 Function Calling 与 Agent Tools：让模型“动手做事”的执行机制

3.1 Function Calling：结构化函数调用能力

Function Calling 是大语言模型（如 GPT-4、文心4.5、通义千问等）新增的重要能力，它允许模型以结构化格式请求调用外部函数或插件。

例如，用户提问：

“明天北京的天气如何？”

模型可能输出如下函数调用请求：

{"function_call": {"name": "get_weather","arguments": {"location": "北京","date": "2025-07-09"}}
}

这个请求不是直接生成回答，而是告诉系统：“我需要这个外部函数的结果，才能回答用户。”
在这里插入图片描述

3.2 Agent Tools：模型的“外挂能力”

Agent Tools 是一组由开发者定义、可供大模型调用的外部能力，可以包括：

第三方 API（如天气、翻译、搜索）
内部服务（如知识库、数据库、图谱查询）
插件（如浏览器、文件分析器）
本地函数（如数学计算、代码执行）

系统中可为 Agent 提供多个工具，每个工具定义：

名称（如 get_weather）
输入参数说明
返回结构说明
可见性与调用条件

模型通过 Function Calling 与这些工具互动，Agent 调度这些调用完成更复杂的任务链。

4 一图看懂信息流：Prompt 到 Agent 的完整协同路径

┌──────────────────────────────────────────┐
│                👤 用户                   │
│         发出自然语言请求 (User Prompt)   │
└──────────────────────────────────────────┘│▼
┌──────────────────────────────────────────┐
│        🧠 AI Agent / MCP 构建上下文       │
│ - system：角色定义（System Prompt）      │
│ - user：当前输入                         │
│ - assistant：历史回答                    │
│ - function_result：调用返回              │
│ - tools：可用工具清单                    │
└──────────────────────────────────────────┘│▼
┌──────────────────────────────────────────┐
│        🤖 大语言模型（LLM）               │
│  - 分析上下文                            │
│  - 判断是否调用函数                      │
│  - 输出结构化调用请求（Function Calling）│
└──────────────────────────────────────────┘│┌──────────────┴───────────────┐▼                              ▼
┌───────────────────────┐    ┌────────────────────────────┐
│ 📞 触发函数调用请求     │    │ ✅ 直接生成回答（无需调用） │
│ - JSON结构输出         │    │ - 适用于简单问答             │
└───────────────────────┘    └────────────────────────────┘│▼
┌──────────────────────────────────────────┐
│ 🔧 Agent Tools / APIs / Plugins           │
│ - 实际执行请求                           │
│ - 返回结构化结果                         │
└──────────────────────────────────────────┘│▼
┌──────────────────────────────────────────┐
│ 🤖 LLM 接收工具结果后继续推理              │
│ - 整合结果生成中间/最终回答               │
└──────────────────────────────────────────┘│▼
┌──────────────────────────────────────────┐
│ 👤 用户获得自然语言回答                   │
└──────────────────────────────────────────┘

5 角色对照表：概念与功能快速对照

概念	中文含义	功能作用
User Prompt	用户提示	用户提出自然语言请求
System Prompt	系统提示	设定模型身份与风格，限制任务范围
MCP	上下文协议	组织多段上下文并提供给模型
LLM	大语言模型	推理、理解、生成，判断是否调用外部工具
Function Calling	函数调用机制	模型发出结构化函数请求
Agent Tools	可调用工具	实际执行函数的组件，可为 API、本地插件等
AI Agent	智能体调度器	管理任务规划、上下文拼接、模型与工具调度