AI智能体——MCP 模型上下文协议
1、什么是 MCP
MCP 是一种开放协议,它标准化了应用程序如何向大模型提供上下文的方式。可以将 MCP 想象成 AI 应用的 USB 接口。就像 USB 为设备连接各种外设和配件提供了标准化方式一样,MCP 为 AI 模型连接不同的数据源和工具提供了标准化的方法。
总的来说,MCP 是一种协议或标准,它本身不提供服务,但通过定义统一规范,让 AI 应用可以方便地接入各种外部服务(如网页搜索、数据库查询、API 调用等),从而扩展 AI 能力、降低开发成本、提高开发效率。类似 HTTP 协议,MCP 的标准化有助于避免重复开发,促进服务复用,最终形成一个共享的服务市场,让开发者可以像拼积木一样组合各类服务。
就如NPM 包之于前端, Maven 仓库还有 Docker 镜像源之于后端,以及手机应用市场,应该就能理解了。
MCP 的三大作用
- 轻松增强 AI 的能力
- 统一标准,降低使用和理解成本
- 打造服务生态,造福广大开发者
2、MCP架构
2.1、宏观架构
MCP 的核心是 “客户端 - 服务器” 架构,其中 MCP 客户端主机可以连接到多个服务器。客户端主机是指希望访问 MCP 服务的程序,比如 Claude Desktop、IDE、AI 工具或部署在服务器上的项目
2.2、SDK 3 层架构
如果我们要在程序中使用 MCP 或开发 MCP 服务,可以引入 MCP 官方的 SDK,比如 Java SDK
- 客户端 / 服务器层:MCP Client 处理客户端操作,而 MCP Server 管理服务器端协议操作。两者都使用 MCP Session 进行通信管理。
- 会话层(MCP Session):通过 DefaultMCP Session 实现管理通信模式和状态。
- 传输层(MCP Transport):处理 JSON-RPC 消息序列化和反序列化,支持多种传输实现,比如 Stdio 标准 IO 流传输和 HTTP SSE 远程传输。
2.3、MCP 客户端
MCP Client 是 MCP 架构中的关键组件,主要负责和 MCP 服务器建立连接并进行通信。它能自动匹配服务器的协议版本、确认可用功能、负责数据传输和 JSON-RPC 交互。此外,它还能发现和使用各种工具、管理资源、和提示词系统进行交互。
除了这些核心功能,MCP 客户端还支持一些额外特性,比如根管理、采样控制,以及同步或异步操作。为了适应不同场景,它提供了多种数据传输方式,包括:
- Stdio 标准输入 / 输出:适用于本地调用
- 基于 Java HttpClient 和 WebFlux 的 SSE 传输:适用于远程调用
2.4、MCP 服务端
MCP Server 也是整个 MCP 架构的关键组件,主要用来为客户端提供各种工具、资源和功能支持。
它负责处理客户端的请求,包括解析协议、提供工具、管理资源以及处理各种交互信息。同时,它还能记录日志、发送通知,并且支持多个客户端同时连接,保证高效的通信和协作。0zoaKH6BZg/Se67mI5njP//s7wr5iv8VsCjsA5Qi4Z0=
和客户端一样,它也可以通过多种方式进行数据传输,比如 Stdio 标准输入 / 输出、基于 Servlet / WebFlux / WebMVC 的 SSE 传输,满足不同应用场景。