本月,微软开源全新通用AI代理Magentic-One,具备五级架构,能够在法律、医疗、金融、教育等多个领域中实现高度自动化的任务处理。这一创新系统的设计旨在帮助用户提高工作效率,简化复杂的日常工作任务。
在教育领域,通过在线浏览,帮助用户自动找到论文中未被引用的新论文,并总结这些论文,然后使用执行器将它们写入到txt文件中;在金融领域,可以通过对大量金融数据进行深度分析和评估,为金融机构制定风险管理策略,包括市场波动、企业财务数据,同时能预测潜在的安全风险。
Magentic-One是基于多智能体架构,一共有5层级组成,以下是五级架构介绍:
1、Orchestrator
主要负责任务分解、规划、指导其他智能体执行子任务、跟踪整体进度并在需要时采取纠正措施。
2、WebSurfer
通过AI大模型能操作、解析网页浏览器内容,执行特定的任务。
3、FileSurfer
基于大模型,可读取多种本地文件并执行预定任务,包括整合、重写等。
4、Coder
同样基于大模型,主要用于编写、分析信息和创建代码
5、ComputerTerminal
主程序控制台,可执行Coder的程序并安装新编程库。
这5大层级智能体会协同分工完成不同的工作,从而加速对任务的自动解析和执行。
Magentic-One的工作流程:
- Magentic-One接到一个自动化任务时,先由Orchestrator将这个复杂的任务分解为多个子任务。
- Orchestrator会根据任务的性质和要求,初步规划出需要哪些智能体参与,以及它们大致的工作顺序。
- WebSurfer会按照Orchestrator的要求,找到目标网站,执行搜索、点击链接、与在线元素交互等操作,收集网站上相关的数据。同时FileSurfer会读取多种本地文件,并从中提取可能对完成任务有用的信息。
- 在收集到的网站数据和本地文件信息会被汇总到Coder智能体。Coder会通过大模型,利用其编写代码、分析信息和创建新工件的能力,开始对这些数据进行处理。它会编写代码来清洗、整理和分析从WebSurfer和FileSurfer获取的数据,挖掘其中的关联和价值。
- Coder根据任务要求和数据内容,开始创建新的内容。ComputerTerminal则提供控制台功能,能够执行Coder编写的程序,并且如果程序需要安装新的编程库来更好地处理数据或者完成其他功能,也可以完成安装操作。
注意:如果在动态变化的网络和文件系统环境中发生了明显变化,各个智能体也能自主适应。同样如果本地文件系统的结构或者文件内容发生变化,FileSurfer能够及时感知并调整自己的读取和分析策略,将最新的信息传递给其他智能体,确保整个系统能够继续有效地协同工作,最终完成任务。