OpenAI推出AI智能体Operator

OpenAI宣布上线名为Operator的首款AI智能体,它能通过网页执行各种任务。该智能体可以像人类一样使用按钮、浏览菜单和填写网页上的表格,并自动执行预订旅行住宿、预订餐厅和在线购物等任务。

Operator

与传统Agent和RPA不同的是,Operator的最大技术特点是无需依赖API或特定网站就能完成所有自动化操作,它是通过对屏幕截图的分析,识别页面元素,然后使用鼠标和键盘进行模拟。Operator是基于新模型CUA(在GPT-4o基础上研发的,未来会开放API)开发而成,专门对视觉UI界面的理解和交互进行了额外专项训练,这也是Operator无需依赖API的主要原因之一。

除此之外,Operator还内置了一个浏览器,能查看网页并通过打字、点击和滚动来与网页进行交互。可处理各种重复性的浏览器任务,包括填写表格、订购杂货,甚至制作表情包等。

其实说到这传统的RPA、按键精灵都能做,Operator另外一大特点就是自我纠错能力,当预见错误或识别不明确时,可以根据大模型的推理能力进行实时修正。实在解决不了,会主动把控制权交给人类寻求帮助。

Operator的使用方法也很简单,无需专业的编程背景或者繁琐的开发流程,就像使用ChatGPT那样用文本描述你的需求即可。此外,Operator还可以处理更复杂的任务,包括安排活动、购买演唱会门票、预订旅行计划等,只需简单地描述你的需求,Operator会通过互联网为你找到最佳选项,并完成预订或购买操作。

目前,Operator处于预览版状态,仅提供给美国Pro用户使用,很快会扩大应用范围。

行业动态

OpenAI发布o1模型新方法

2025-1-23 9:28:38

行业动态

柯瑞文:夯实国云底座,加快建设数字中国

2023-5-4 11:00:27

相关推荐