Claude Agent SDK、OpenAI Agents SDK 与 Google ADK:您应该基于哪一个构建?
2025 年,三款生产级 AI 智能体 SDK 相继发布或达到稳定状态。Claude Agent SDK v0.1.48、OpenAI Agents SDK v0.10.2 以及 Google ADK v1.26.0 均已走出预览阶段,进入生产环境。现在的问题不再是要不要基于 SDK 构建,而是该选哪一款契合您的技术栈。
截至 2026 年 3 月,六款生产级智能体框架正在激烈竞争,本文涵盖的三款 SDK 代表了由主流 AI 实验室支持的主要选项(Langfuse,2026)。本次对比涵盖架构、MCP 支持、模型锁定、状态管理、部署灵活性,以及在生产系统中真正重要的决策标准。
为何此刻需要做这项对比#
SDK 的选择影响的远不止初始构建。它决定了您实际上被锁定在哪些模型上、智能体如何连接外部工具、本地部署方案的形态,以及生产环境中出问题时如何调试。后期迁移的代价,远高于一开始就把选择做对。
三款 SDK 没有一款是全面领先的。每一款都有真正的优势和实际的局限。本文的目标是为您的实际决策提供准确的参考信号,而不是评出一个冠军。
三款 SDK 概览#
Claude Agent SDK:Anthropic 的生产级智能体运行时#
Claude Agent SDK 源自 Anthropic 自家的编程智能体 Claude Code。这一渊源非常关键:其内置工具目录(Read、Write、Edit、Bash、Glob、Grep、WebSearch、WebFetch、AskUserQuestion、Agent)反映的是真实生产用途,而不是玩具演示。该 SDK 于 2025 年从 Claude Code SDK 更名为 Claude Agent SDK,以体现其超越编程工作流的适用范围(Anthropic,2025)。
其编排模型基于工具使用链:Claude 推理任务、调用工具执行、评估结果、持续自主推进。子智能体通过 Agent 工具派生;主智能体将聚焦的子任务委派给专门的子智能体,子智能体完成后回报结果。其在生产使用中最重要的差异化优势是权限架构:工具默认被阻止,生命周期钩子允许您拦截每一次工具调用,两者共同为可审计性提供支持,而无需修改智能体的核心逻辑。
OpenAI Agents SDK:构建多智能体系统的最简路径#
OpenAI Agents SDK 于 2025 年 3 月发布,是三款中最易上手的一款。其核心心智模型是交接(handoff):一个分诊智能体接收输入,然后连同完整对话上下文一起,将控制权转交给专家智能体。每个智能体由指令、模型引用、工具列表以及可交接给哪些其他智能体的列表定义。
防护栏(Guardrails)与执行并行运行,而非串行,因此在正常路径下安全检查不会增加延迟。追踪功能默认开启。状态默认是短暂的,这对无状态工作流没问题,但对任何长时间运行的场景都是个问题。
Google ADK:面向 Google Cloud 技术栈的企业级框架#
Google 的 Agent Development Kit(Python v1.0 稳定版,2025 年 4 月发布)是三款中最结构化的。智能体以层级树组织,具备显式的工作流类型:顺序、并行和循环。该框架与 Vertex AI 深度集成,Model Garden 提供跨提供商的 200 多款模型访问,这是 ADK 相对其他两款最明显的优势。
ADK 的状态管理采用黑板模式(blackboard pattern),即一个显式的 State 对象,智能体在共享上下文中读取和写入。A2A(Agent2Agent)协议是 ADK 对跨框架通信的回答:这是一项用于跨不同框架和供应商进行智能体间调用的开放标准。A2A v0.3 增加了 gRPC 支持,并提升了稳定性(Google Cloud Blog,2025)。
坦率地说,代价是:ADK 很啰嗦。您需要预先定义很多内容。如果您不在 Google Cloud 生态系统中,学习曲线要比其他两款陡峭。
架构:每款 SDK 如何编排智能体#
Claude Agent SDK:带子智能体和生命周期钩子的工具使用链#
Claude 推理任务、调用工具执行、评估结果、继续推进。当任务适合委派时,通过 Agent 工具派生子智能体。会话通过 session ID 持久化,可以恢复或分叉,这对长时间运行或需要分支的工作流非常重要。
权限架构正是该 SDK 真正赢得生产级口碑的地方。每个工具默认被阻止,必须通过 allowedTools 显式允许。PreToolUse 和 PostToolUse 的生命周期钩子提供了在每次工具调用前后的干预点:记录、阻止或变换输入,而无需触碰智能体的核心逻辑。这正是合规团队想要、而大多数框架都无法干净提供的能力。
OpenAI Agents SDK:专业智能体之间的显式交接#
每个智能体都有清晰的职责范围。当它判断另一个智能体更适合当前任务时,会显式地连同上下文一起交接控制权。结果是多智能体系统易于追踪:您可以精确追踪哪一个智能体处理了哪一步,以及为什么。
局限在于僵硬。基于交接的架构在任务边界清晰且稳定时效果很好。当工作流可预测性较差,或智能体需要动态决定如何委派时,这种模型需要更多重构。
Google ADK:带显式工作流控制的层级智能体树#
ADK 显式的工作流类型——顺序(先 A 后 B)、并行(A 与 B 同时)、循环(重复直到满足条件)——赋予您对执行模式的直接控制。您不是依赖模型自行推理排序,而是由您来指定。对于复杂结构化管道,这是一项真正的优势。
代价是冗长。ADK 要求对工作流结构进行大量预先定义,远多于 Claude Agent SDK 或 OpenAI Agents SDK。这到底是特性还是成本,取决于您有多信任模型自主推理排序。
功能对比矩阵#
| 功能 | Claude Agent SDK | OpenAI Agents SDK | Google ADK |
|---|---|---|---|
| 主要模型 | Claude(Anthropic) | GPT-4o 及其变体 | Gemini,通过 Model Garden 支持多模型 |
| 非原生模型支持 | 通过 Bedrock、Vertex、Azure | 有文档说明,但非主流 | 通过 Model Garden 支持 200 多款模型 |
| 编排模型 | 带子智能体的工具使用链 | 智能体之间的显式交接 | 层级智能体树(顺序 / 并行 / 循环) |
| MCP 支持 | 一等公民:内置、进程内 MCP 服务器 | 支持,但非一等公民 | 通过工具生态系统支持 |
| 状态 / 会话持久化 | Session ID,支持恢复与分叉 | 默认短暂,需外部记忆层 | State 对象(黑板模式),可插拔后端 |
| 内置追踪 | 通过 Claude Code 工具链 | 是:Traces 仪表盘,默认开启 | 通过 Vertex AI 和 Cloud Observability |
| 防护栏 | 权限模式、allowedTools / disallowedTools、生命周期钩子 | 与智能体执行并行运行的输入/输出防护栏 | 通过 Vertex AI Agent Builder 实现工具治理 |
| 自托管部署 | 是:本地、进程内或私有基础设施运行 | 有限,主要依赖云 API | 通过 Docker / Cloud Run / GKE;Vertex AI 为默认目标 |
| 智能体间协议 | MCP 与子智能体派生 | SDK 边界内的交接 | 原生 A2A(Agent2Agent)协议 v0.3 |
| 语言 | Python、TypeScript | Python、TypeScript | Python(稳定)、Java(beta) |
| 生产成熟度 | 高:基于 Claude Code 经过实战考验的运行时 | 高:从第一天起便内置追踪与防护栏 | 高:Python ADK v1.0 稳定 |
| 供应商生态适配 | Anthropic API、AWS Bedrock、Google Vertex | OpenAI 生态系统、Azure OpenAI | Google Cloud、Vertex AI、GKE |
MCP 支持:哪一款 SDK 将工具连接视为一等公民#
三款 SDK 现在都支持 MCP(ClickHouse,2025),但集成深度差异显著。
Claude Agent SDK 将 MCP 视为基础设施。您可以运行进程内 MCP 服务器(纯 Python,无独立进程)、通过 HTTP 挂接远程 MCP 服务器,或从持续壮大的生态中配置标准 MCP 服务器。每一个 MCP 兼容的工具服务器都可以无需定制集成代码直接接入。截至 2025 年 12 月,已发布超过 10,000 个 MCP 服务器,SDK 月下载量达 9700 万次(Anthropic / Linux Foundation,2025 年 12 月)。这个生态已经存在且正在积极增长。
OpenAI Agents SDK 增加了 MCP 支持,但它并不是基础集成层。该 SDK 的工具模型早于 MCP,MCP 连接作为附加层存在,而非主要机制。它能用,只是不是 SDK 最初的设计出发点。
Google ADK 通过自有工具生态支持工具连接,并越来越多地通过 A2A 支持智能体间调用。MCP 不是主要模式。A2A 是 ADK 对跨系统连接的回答。
如果 MCP 兼容性对您的技术栈很重要——无论是因为您想基于不断壮大的生态构建,还是因为您希望工具服务器可以跨框架移植——那么 Claude Agent SDK 目前拥有最深入的原生实现。
模型支持与供应商锁定#
Claude Agent SDK 是为通过 Anthropic API、Amazon Bedrock、Google Vertex AI 或 Azure AI Foundry 访问的 Claude 模型而构建的。支持多云推理路由。不支持非 Claude 模型;该 SDK 的架构专门围绕 Claude 的工具使用能力设计。
OpenAI Agents SDK 针对 GPT-4o 和 OpenAI 模型优化。有文档化的路径可以使用非 OpenAI 模型,但默认体验、追踪以及大多数示例都假定使用 OpenAI API。使用它的生产团队绝大多数运行在 OpenAI 或 Azure OpenAI 模型上。
Google ADK 通过 Model Garden 提供最灵活的模型选择:跨提供商 200 多款模型,包括 Gemini 变体、开放权重模型(Llama、Mistral)以及专用模型。如果提供商灵活性是核心要求,ADK 是最清晰的选择。
坦率地说:三款 SDK 都与其创建方的模型生态保持一致。选择一款 SDK,某种程度上就是在赌您愿意依赖哪家模型提供商。
状态管理与会话持久化#
Claude Agent SDK 通过 session ID 持久化会话。会话可以被恢复(从上次中断处继续)或分叉(从某一点分支出去进行并行探索)。这对于单个任务跨越数小时、或在中间步骤需要人工输入的工作流非常重要。
OpenAI Agents SDK 的状态默认是短暂的。每次运行从零开始。对于需要跨运行保留记忆的工作流,团队通常会添加外部记忆层,通常是向量数据库或键值存储,在每次运行开始时读取。架构是可行的;只是增加了 SDK 本身不提供的基础设施。
Google ADK 使用 State 对象(黑板模式):一个显式的共享上下文,智能体在工作流期间从中读取和写入。State 是结构化和类型化的,使其在智能体之间的信息流推理更容易。可插拔后端允许在需要时将 State 持久化到外部。
部署灵活性:云、自托管与混合#
Claude Agent SDK 在本地部署方面最为灵活。进程内 MCP 服务器、本地工具执行,以及对智能体可触达范围的显式控制。如果不是直接访问 Anthropic,认证可通过 Bedrock、Vertex AI 或 Azure AI Foundry 进行推理。对于有数据驻留要求或云供应商承诺的团队,该架构无需绕开即可适配。
OpenAI Agents SDK 主要依赖云:推理通过 OpenAI API(或 Azure OpenAI)运行,数据会离开您的环境,除非您在 Azure 上签订了适当的协议。对于数据驻留是硬性要求的受监管环境,这是一个实际的约束。
Google ADK 支持 Docker / Cloud Run / GKE 部署,并为 Vertex AI 而设计。这是云基础设施,具体来说是 Google Cloud 基础设施,如果您已经在那里就没问题。真正的气隙本地推理需要将 ADK 与自托管模型服务器(如 Ollama 等)结合使用,这是可能的,但会增加配置工作。
可观测性、追踪与生产防护栏#
Claude Agent SDK 的追踪通过 Claude Code 工具链。PreToolUse、PostToolUse、Stop、SessionStart 与 SessionEnd 的生命周期钩子提供了结构化的干预点:在每一步记录、阻止或变换。这对于自行构建可观测性层的团队来说非常灵活。如果您希望开箱即用的仪表盘,需要更多集成工作。
OpenAI Agents SDK 在三款中拥有最易用的可观测性。追踪默认开启,捕获所有 LLM 生成、工具调用、交接和防护栏事件,在可搜索的 Traces 仪表盘中呈现。如果您希望无需自建可观测性就能获得生产可见性,这是最短路径。防护栏与执行并行运行;在正常路径下不会增加延迟。
Google ADK 通过 Vertex AI 和 Cloud Observability 路由可观测性。如果您已经在 GCP 中,这是自然的选择。如果不是,则会增加一个基础设施依赖。
何时使用每款 SDK#
选择 Claude Agent SDK 的时机……#
- 您的团队正在基于 Claude 模型构建,并希望使用驱动 Claude Code 的原生运行时
- MCP 原生工具连接很重要:您需要通过 MCP 生态系统连接数据库、API 和内部系统
- 您需要对智能体可以使用哪些工具进行细粒度权限控制,特别是在合规敏感的工作流中
- 您正在构建开发工具、代码智能体或与文件系统和终端交互的智能体工作流
- 本地部署是硬性要求
- 您需要带恢复与分叉能力的会话持久化
选择 OpenAI Agents SDK 的时机……#
- 您已经在 OpenAI 或 Azure OpenAI 生态中,希望摩擦最小
- 您的架构可映射为互相交接的专家智能体:客户支持路由、具有清晰阶段转换的多步骤管道
- 您希望快速原型开发;该 SDK 的原语在三款中最易用
- 通过 Traces 仪表盘的内置追踪无需额外设置即可满足您的可观测性需求
选择 Google ADK 的时机……#
- 您的基础设施在 Google Cloud 上,目标是 Vertex AI
- 您需要跨框架智能体通信:A2A 协议允许 ADK 智能体与 LangGraph、CrewAI 等其他框架通信,无需自定义桥接代码
- 您的智能体工作流是复杂的结构化管道,适合显式的顺序/并行/循环控制
- 模型多样性很重要:Model Garden 的 200 多款模型在混合提供商或需要专用模型时提供灵活性
- 多模态能力(双向音视频流)是智能体界面的一部分
这些 SDK 都无法为您解决的问题#
选择 SDK 是构建生产级智能体中较容易的一步。更难的工作无论使用哪种框架都一样:梳理真实工作流、定义每个智能体的成功标准、优雅处理部分执行和故障、编写能在生产前捕获回归的评估、构建能告诉您智能体为何做出某种行为的可观测性。
这些 SDK 提供原语。不错的原语,但终究只是原语。能在生产中站得住脚的系统,是由理解被自动化操作的工程师构建的——他们能在出现意外时设计出安全失败的智能体。
如果您正在决定标准化使用哪款 SDK,或您已经准备好构建并希望获得全栈支持——架构、SDK 选型、MCP 服务器构建、智能体设计、部署——我们的审计页面是起点。我们构建生产级智能体系统,并在实际中使用过所有三款框架。
常见问题#
Claude Agent SDK 可以使用 Claude 以外的模型吗?
不可以。该 SDK 是专门为通过 Anthropic API、Amazon Bedrock、Google Vertex AI 或 Azure AI Foundry 访问的 Claude 模型而构建的。如果您在推理层需要模型无关的灵活性,Google ADK 通过 Model Garden 或 LangGraph 之类的框架是更合适的选择。
OpenAI Agents SDK 能配合非 OpenAI 模型使用吗?
有文档化的路径,但该 SDK 为 OpenAI 模型优化,其工具链(追踪、防护栏)围绕 OpenAI API 设计。大多数使用它的生产团队运行在 GPT-4o 或其变体上。
哪款 SDK 的自托管部署支持最好?
Claude Agent SDK。进程内 MCP 服务器、本地工具执行,以及在需要时通过 Bedrock 或 Vertex 路由推理。Google ADK 支持 Docker 和 GKE 部署,但那仍然是云基础设施。若要在这三款 SDK 中实现真正的气隙推理,您需要将 SDK 与自托管模型服务器结合。
什么是 A2A 协议,为什么它对 Google ADK 重要?
Agent2Agent(A2A)是 Google 针对跨框架智能体通信的开放协议。它允许 ADK 智能体调用基于 LangGraph、CrewAI 或其他框架构建的智能体,反之亦然,无需自定义桥接代码。A2A v0.3(2025)增加了 gRPC 支持并提升了稳定性。这在不同团队基于不同框架构建智能体、但需要彼此通信的企业环境中尤为重要。
MCP 只针对 Claude Agent SDK 吗?
不是。MCP 是一项开放标准,三款 SDK 都支持。Claude Agent SDK 将其视为一等公民的集成层;OpenAI Agents SDK 将其作为附加层支持;Google ADK 与之集成,但将 A2A 视为主要的跨系统模式。您作为 MCP 服务器构建的工具可以在整个生态中移植,这正是基于标准构建的意义。
刚开始构建智能体的团队适合哪款 SDK?
OpenAI Agents SDK。干净的交接语义、默认开启的追踪,以及新团队可以快速理解的概念模型。如果您的团队已经使用 Claude,Claude Agent SDK 几乎同样容易上手。Google ADK 需要更多前期学习,不过 Python v1.0 稳定版发布后,它比早期版本易用许多。
