谷歌开源 AI 智能体开发套件 (Agent SDK),支持 MCP、A2A


谷歌开源了首个Agent开发套件—ADK,这也是OpenAI之后第二家大厂发布的标准化智能体SDK。

ADK能帮助开发人员极大简化开发超复杂流程的智能体,从大模型选择、自动化流程编排、测试到应用部署可一站式完成,并且支持双向音频、视频、MCP和最新的A2A协议。

例如,通过ADK开发一个跨平台的语音客服智能体,大概只需要100多行甚至更少的代码就能全部完成。再也不用像以前那样,切换不同平台API,模型选择或交互逻辑编写复杂代码,极大提升了开发效率。

开源地址:https://github.com/google/adk-python

ADK介绍

ADK架构以Python为主,在参数定义、模型集成、工具整合和指令驱动方面非常好用。

例如,下面这个案例只用了6行代码,就完成了一个简单的问答智能体开发。咱们只设置了使用的模型、智能体名称、功能描述、指令驱动和工具实例。其他的管理状态、协调工具调用以及和底层大模型的交互全部由ADK完成。

简单来说,用ADK开发就有点像拼乐高积木一样,喜欢哪块就拼哪个完全释放你的天马行空想法,再也不用为工具和底层技术发愁了。

from google.adk.agents import Agent
from google.adk.tools import google_search

root_agent = Agent(
name="search_assistant",
model="gemini-2.0-flash", # Or your preferred Gemini model
instruction="You are a helpful assistant. Answer user questions using Google Search when needed.",
description="An assistant that can search the web.",
tools=[google_search]
)

虽然ADK是谷歌开源的,但在大模型兼容方面还是非常灵活的,除了谷歌的Gemini系列模型之外,还支持Anthropic、Meta、Mistral AI、AI21 Labs、CAMB.AI、Qodo等200多个第三方开闭源模型。

ADK的亮点之一便是轻松开发复杂智能体,支持多层级结构组合的智能体实现复杂的协调和委派。开发者可以构建一个主智能体来处理主要任务,并将特定子任务委派给其他专业智能体。

简单来说,就是让主智能体指挥其他智能体来执行具体的任务。例如,你是一家电商公司需要开发客服智能体。希望能自动处理订单查询、商品推荐、售后服务等多种服务。

传统的方法会非常繁琐,你需要为不同的业务编写不同的逻辑代码并,且优化、重构也很麻烦。通过ADK你可以直接定义4个智能体,主体负责接收用户问题,并根据问题类型委派给相应的子智能体;订单查询智能体,专门处理与订单相关的问题,如订单状态、物流信息等。

商品推荐智能体,根据用户的历史购买记录和浏览行为,推荐相关商品;售后服务智能体,处理退换货、退款等售后服务问题。

上面这些只是为大家简单讲解,其实实际用ADK开发更简单高效,因为它还集成了搜索、地图、代码执行、服务等很多实用工具,也支持LangChain、CrewAI、MCP等第三方服务。

更详细的示例开源地址:https://github.com/google/adk-samples

谷歌ADK详细文档:https://google.github.io/adk-docs/get-started/tutorial/#step-1-your-first-agent-basic-weather-lookup

相关阅读:谷歌推出 A2A 开放协议,实现智能体间的自由 “对话”


相關推薦

2025-06-17

ing 信息兼容 OpenTelemetry,因此理论上可接入市面上主流的开源平台如 Langfuse,或者阿里云 ARMS。 从聊天机器人、工作流到多智能体 聊天机器人(ChatBot) AI 应用开发不只是无状态大模型的 API 调用过程,由于大模型预训练的特

2025-06-13

sp;AI Agent Protocol社区组于今年5月成立,致力于孵化下一代智能体之间的交互协议,让智能体能够在互联网上使用协议进行高效的连接与协作,推动智能体在Web上的安全、高效、可信连接与协作。 小组现发布《智能体网络协议技

2025-05-27

安全领域的正向赋能。 开放生态:拥抱智能体互联网与开源协作 在技术架构上,微软全面拥抱开放协议,加入 MCP 指导委员会,并在 GitHub、Copilot Studio 等平台支持 MCP 与 A2A 协议,推动智能体间互操作。李冕在专访中表示,AI

2025-04-23

Chat 与 Builder 面板。你可以通过 @Builder 方式将 Builder 作为智能体使用。详情参考《智能体》。 支持将文档内容和网页内容作为上下文: #Web:支持联网搜索,AI 会自动提取网页内的相关内容作为上下文。 #Doc:支持通过 URL

2025-04-23

更高效、更流畅、更定制 升级中,Trae新版本不仅带来了智能体与上下文理解能力,还提供多种 AI 工具,并支持MCP自由接入各类外部资源;在产品交互形态上,Trae新版本把原先的Builder与Chat板块融合,打破了传统以代码为中心

2025-05-21

下文协议(MCP),旨在未来使 Windows 11 成为一个智能代理操作系统。 MCP 与 Windows 的集成将为 AI 智能体连接原生 Windows 应用提供标准化框架,使应用能够无缝参与智能体交互。未来几个月内,这项功能将向部分合作伙

2025-06-13

Hugging Face 开源了专用于评估 GUI 智能体的综合测试套件 ScreenSuite。 什么是 GUI Agent?简单说,就是“能像人一样操作屏幕”的 AI!它能识别界面内容、点击按钮、输入文字、滚动页面……实现真实的“虚拟助手”体验。

2025-04-03

AutoDev 是一个开源的 AI 编程工具,最近发布了 2.0 版本!在 AutoDev 2.0 中,你可以: 编码智能体 Sketch 进行自动化编程 自动化编程的规划器 AutoDev Planner 系统迁移 Bridge 辅助旧系统重构 观察者 Observer,动态观察 IDE 中

2025-06-12

通用智能体 Genspark 发布了 AI 浏览器产品,官方称其具有极速、广告拦截、全能智能体、自动驾驶模式的特性,并提供了 MCP 商店。   下载地址:https://www.genspark.ai/browser Genspark 由百度前高管景鲲创立,今年 4 月宣布推

2025-05-04

做事的Agent"转变。5 月 7 日晚,DeepChat 作者谢孟军将做客开源PHP OSChina 直播栏目《技术领航》 ,在线演示要怎么用 DeepChat,它到底能干些什么? 直播主题:开源领域的桌面端 Manus:DeepChat 直播时间:5 月 7 日周三 19:00-20:00

2025-05-20

谷歌 DeepMind 团队推出 AlphaEvolve,这是一个基于 Gemini 的编程智能体 (Coding Agent),用于通用算法设计和优化。AlphaEvolve 结合了 Gemini 模型的创造性问题解决能力与验证答案的自动评估器,并使用进化框架来改进最有潜力的想法。

2024-07-19

在印度班加罗尔谷歌 I/O Connect 开发者活动期间, Go 语言开发团队宣布推出 Oscar ,这是一个用于构建 AI 智能体的开源平台,可以帮助软件产品团队监控问题或错误。 Oscar 源代码:https://go.googlesource.com/oscar Oscar 包地址:https://

2025-05-15

企业级多租户团队协作工具,免费开源8件套:企业IM、在线客服、企业知识库/帮助文档、客户之声、工单系统、AI对话、工作流、项目管理。 语言 English 中文 介绍 企业IM 局域网即时通讯 企业成员管理 聊天记

2025-06-06

新变化包括自动化代码审查工具 BugBot、全面开放的背景智能体(Background Agent)、首次亮相的记忆功能(Memories)、一键式 MCP 安装、Jupyter Notebook 支持以及全新的设置与仪表盘界面。 Bugbot:能够自动在 GitHub 的 Pull Request 中