谷歌首推开源标准智能体交互协议A2A

近日，谷歌在Google Cloud Next 2025大会上宣布开源首个标准智能体交互协议——Agent2Agent Protocol（简称A2A），标志着智能体交互领域的一大突破。此前，Anthropic的模型上下文协议(MCP)为智能体提供了一种结构化的工具使用方式，而A2A则为智能体提供了一种相互协作的方式，将孤立的机器人转变为数字工作团队。此外，谷歌还开源了Agent开发套件ADK，内部测试工具Agent Engine，新的Agent市场等。

A2A

A2A协议将打破系统孤岛，对智能体的能力、跨平台、执行效率产生质的改变，支持Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等主流企业应用平台。

A2A协议的开源，类似于谷歌当年牵头80多家企业共同开发安卓系统，首批就有50多家著名企业加入。随着更多企业的加入，A2A的商业价值将得到极大提升，并推动整个智能体生态的快速发展。这一举措对于促进AI代理在企业间的通信、信息交换和行动协调具有重要意义。

A2A协议介绍

A2A是一种开放协议，为Agent提供了一种标准的交互方式，使它们能够相互协作，无论底层框架或供应商是什么。在与合作伙伴设计协议时，谷歌遵循了五个关键原则，如下：

第一、A2A专注于使Agent能够在它们自然的、非结构化的模式下进行协作，即使它们不共享内存、工具和上下文。谷歌正在启用真正的多Agent场景，而不是限制Agent成为一个工具。
第二、该协议是基于现有的、流行的标准构建的，包括HTTP、服务器端事件（SSE）、JSON-RPC等，这意味着它更容易与企业日常已经使用的现有IT堆栈进行集成。
第三、A2A被设计为支持企业级的认证和授权，在推出时与OpenAPI的认证方案具有对等性。这点还是很人性的不排斥OpenAI，使用A2A协议能快速通过身份验证，安全地获取数据，保障数据传输的安全性和合规性，防止数据泄露风险。
第四、谷歌设计A2A使其具有灵活性，能够支持从快速任务到可能需要数小时甚至数天（当人类参与其中时）的深入研究等各种场景。在整个过程中，A2A可以向用户提供实时反馈、通知和状态更新。
第五、Agent的世界不仅限于文本，所以，A2A支持各种模态，包括音频、图像和视频流。

A2A的工作原理是通过促进客户端Agent和远程Agent之间的通信来实现的。客户端Agent负责制定和传达任务，而远程Agent则根据这些任务采取行动，以提供正确的信息或执行相应的操作。在这个过程中，A2A协议有以下几个关键能力。