希望部署多个 AI 代理的企业通常需要实施一个框架来管理它们。
为此,微软研究人员最近推出了一种名为Magentic-One 的新型多智能体基础设施,该基础设施允许单个 AI 模型为各种辅助智能体提供支持,这些辅助智能体可以协同工作,在不同场景中完成复杂的多步骤任务。微软称 Magentic-One 是一种通用智能体系统,可以“完全实现智能体系统的长期愿景,即提高我们的生产力并改变我们的生活”。
该框架是开源的,在定制的 Microsoft 许可证下可供研究人员和开发人员使用,包括用于商业目的。在发布 Magentic-One 的同时,微软还发布了一款名为 AutoGenBench 的开源代理评估工具来测试代理系统,该工具建立在其之前发布的Autogen 框架之上,用于多代理通信和合作。
通用代理系统背后的想法是弄清楚自主代理如何解决组织日常运作甚至个人日常生活中经常发现的需要多个步骤才能完成的任务。
从微软提供的示例来看,该公司似乎希望 Magentic-One 能够完成几乎平凡的任务。研究人员指出,Magentic-One 可以完成诸如描述标准普尔 500 指数趋势、查找和导出缺失引文,甚至订购沙瓦玛等任务。
Magnetic-One 的工作原理
Magentic-One 依靠 Orchestrator 代理来指挥其他四个代理。Orchestrator 不仅管理代理,指挥它们执行特定任务,而且在出现错误时还会重定向它们。
该框架由除 Orchestrator 之外的四种类型的代理组成:
- Websurfer 代理可以控制基于 Chromium 的 Web 浏览器,导航至各个网站或执行 Web 搜索。它还可以进行点击和输入操作(类似于Anthropic最近发布的 Computer Use),并总结内容。
- FIleSurfer 代理读取本地文件列表目录并浏览文件夹。
- 编码代理编写代码、分析来自其他代理的信息并创建新的工件。
- ComputerTerminal 提供了一个控制台,可以在其中执行 Coder 代理的程序。
Orchestrator 负责指挥这些代理并跟踪他们的进度。它首先规划如何完成任务。它创建了微软研究人员称之为任务分类账的东西,用于跟踪工作流。随着任务的继续,Orchestrator 会构建一个进度分类账,“它会在其中自我反思任务进度并检查任务是否完成。”Orchestrator 可以指派代理来完成每项任务或更新任务分类账。如果代理仍然停滞不前,Orchestrator 可以创建新计划。
研究人员在论文中写道:“Magentic-One 的代理共同为 Orchestrator 提供了解决各种开放式问题所需的工具和能力,以及自主适应和在动态不断变化的网络和文件系统环境中行动的能力。”
虽然微软使用OpenAI 的GPT-4o开发了 Magentic-One (OpenAI 毕竟是微软的投资),但它与 LLM 无关,尽管研究人员“建议为 Orchestrator 代理使用强大的推理模型,例如 GPT-4o”。
Magentic-One 支持代理背后的多种模型,例如,开发人员可以为 Orchestrator 代理部署推理 LLM,并为不同的代理部署其他 LLM 或小型语言模型的混合。微软的研究人员尝试了不同的 Magentic-One 配置,“使用 OpenAI 01-preview 作为 Orchestrator 的外循环和 Coder,而其他代理继续使用 GPT-4o。”
代理框架的下一步
随着部署代理的选项越来越多,从现成的代理库到可定制的组织特定代理,代理系统变得越来越流行。微软于 10 月宣布推出一套适用于 Dynamics 365 平台的 AI 代理。
科技公司现在开始在人工智能编排框架方面展开竞争,尤其是管理代理工作流的系统。OpenAI 发布了Swarm 框架,为开发人员提供了一种简单而灵活的方式来让代理指导代理协作。CrewAI的多代理构建器也提供了一种管理代理的方法。同时,大多数企业都依赖 LangChain来帮助构建代理框架。
然而,企业中的 AI 代理部署仍处于早期阶段,因此找出最佳的多代理框架仍将是一项持续的实验。大多数 AI 代理仍在自己的游乐场中玩耍,而不是与其他系统的代理对话。随着越来越多的企业开始使用 AI 代理,管理这种蔓延并确保 AI 代理无缝地相互交接工作以完成任务变得更加重要。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/wei-ruan-de-xin-magenticone-xi-tong-zhi-hui-duo-ge-ai-dai