近日,谷歌在Google Cloud Next 2025大会上宣布开源首个标准智能体交互协议——Agent2Agent Protocol(简称A2A),标志着智能体交互领域的一大突破。此前,Anthropic的模型上下文协议(MCP)为智能体提供了一种结构化的工具使用方式,而A2A则为智能体提供了一种相互协作的方式,将孤立的机器人转变为数字工作团队。此外,谷歌还开源了Agent开发套件ADK,内部测试工具Agent Engine,新的Agent市场等。
A2A协议将打破系统孤岛,对智能体的能力、跨平台、执行效率产生质的改变,支持Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等主流企业应用平台。
A2A协议的开源,类似于谷歌当年牵头80多家企业共同开发安卓系统,首批就有50多家著名企业加入。随着更多企业的加入,A2A的商业价值将得到极大提升,并推动整个智能体生态的快速发展。这一举措对于促进AI代理在企业间的通信、信息交换和行动协调具有重要意义。
A2A协议介绍
A2A是一种开放协议,为Agent提供了一种标准的交互方式,使它们能够相互协作,无论底层框架或供应商是什么。在与合作伙伴设计协议时,谷歌遵循了五个关键原则,如下:
- 第一、A2A专注于使Agent能够在它们自然的、非结构化的模式下进行协作,即使它们不共享内存、工具和上下文。谷歌正在启用真正的多Agent场景,而不是限制Agent成为一个工具。
- 第二、该协议是基于现有的、流行的标准构建的,包括HTTP、服务器端事件(SSE)、JSON-RPC等,这意味着它更容易与企业日常已经使用的现有IT堆栈进行集成。
- 第三、A2A被设计为支持企业级的认证和授权,在推出时与OpenAPI的认证方案具有对等性。这点还是很人性的不排斥OpenAI,使用A2A协议能快速通过身份验证,安全地获取数据,保障数据传输的安全性和合规性,防止数据泄露风险。
- 第四、谷歌设计A2A使其具有灵活性,能够支持从快速任务到可能需要数小时甚至数天(当人类参与其中时)的深入研究等各种场景。在整个过程中,A2A可以向用户提供实时反馈、通知和状态更新。
- 第五、Agent的世界不仅限于文本,所以,A2A支持各种模态,包括音频、图像和视频流。
A2A的工作原理是通过促进客户端Agent和远程Agent之间的通信来实现的。客户端Agent负责制定和传达任务,而远程Agent则根据这些任务采取行动,以提供正确的信息或执行相应的操作。在这个过程中,A2A协议有以下几个关键能力。
- 1、Agent卡:以JSON格式存在的,它们能够让客户端Agent识别出哪个远程Agent最适合执行特定的任务。
- 2、任务管理:客户端和远程Agent之间的通信都是围绕完成任务展开的。
- 3、支持Agent之间的协作。
- 4、具备用户体验协商的功能。
A2A协议一经发布就受到了大批著名企业的青睐,埃森哲、波士顿咨询集团、凯捷、科尼、Salesforce、德勤、甲骨文、HCL科技、印孚瑟斯、KPMG、SAP、麦肯锡、普华永道等50多家企业都纷纷加入。
相关推荐:《什么是AI Agent AI Agent能干啥》