OpenAI开源首个Agent SDK

最近,OpenAI在技术直播中发布了专为构建AI Agents设计的新工具和API,核心产品包括Agents SDK和Responses API,极大简化、增强智能体开发流程。

Agent SDK

OpenAI联合创始人兼首席执行官Sam Altman曾多次强调,2025年将是全球Agent大年,OpenAI将会发布一大批硬核产品。前段时间还爆料将发布2万美元一月的博士级Agent。但是自己看好的瓜却被国内的Manus给摘下了,仅是邀请测试阶段就在全球外产生了巨大影响,并被称为“中国第二个DeepSeek”。所以,OpenAI连忙发布了Agent SDK和API反击Manus,来快速开发超复杂的混合智能体。

Agent SDK特色功能之一就是支持多Agent之间的动态任务协作,可以像Manus那样开发超复杂的智能自动化业务流程。例如,跨国电商需要处理来自全球不同地区的订单,通过Agent SDK可以开发语言识别、库存查询、订单实时更新、售后服务等多个Agent,并且在整个销售、售后的过程中让它们之间协同自动化工作。

目前,已经有很多平台通过Agent SDK开发了高效的复杂Agent。例如,Coinbase使用Agents SDK快速原型化并部署了AgentKit,这是一个工具包,使AI Agent能够与加密钱包和各种链上活动无缝交互。

Responses API将Chat Completions API的简洁性与Assistants API的工具使用能力相结合,提供一个更加灵活且功能强大的开发平台。开发者通过Responses API,可以设计一个Agent,首先通过网络搜索工具查找最新的相机评测和用户反馈,然后利用大模型的推理能力对这些信息进行分析和总结,最终为用户生成一份详细符合标准的推荐报告。

Responses API的另一个亮点就是易用性。采用了统一的基于项目的可视化界面设计,简化了多态性,并提供了直观的流式事件处理机制。可以帮助开发者能够更轻松地构建和管理Agent的逻辑流程。此外,Responses API可以与Agent SDK相结合使用,这对于开发超长、复杂的自动化业务流程非常有帮助,就像Manus那种完全自主的Agent。

为了让AI Agents更加实用,OpenAI还提供了三大内置工具,包括Web搜索工具、文件搜索工具、计算机使用工具。

1、Web搜索工具

支持GPT-4o和GPT-4o-mini模型,能够实时从互联网上抓取最新数据,并提供清晰且相关的引用来源。这就像给智能体配备了一个实时更新的知识库,让它们能够随时掌握最新的动态。

2、文件搜索工具

支持向量存储与元数据过滤,能够快速、准确地从大量文档中检索相关信息。对于企业来说,这无疑是一个高效的知识检索利器。

3、计算机使用工具

相当于在API中内置了Operator,可以自动控制计算机,实现点击、输入、拖动等复杂操作。这对于需要与传统系统交互的场景来说,是一个巨大的突破。

OpenAI认为,Agent将很快成为全球劳动力的重要组成部分,以提升各行业生产效率节省成本。今天只是发布的第一批聚焦在Agent的餐品。未来,我们会持续大力投入,优化API集成和开发新工具。

行业动态

OpenAI发布最新研究CoT监控器

2025-3-11 9:48:49

行业动态

谷歌宣布开源最新模型Gemma-3 号称能媲美DeepSeek

2025-3-13 9:56:15

相关推荐