微软的新 Magentic-One 系统指挥多个 AI 代理完成用户任务

王浩然 • 2024年11月10日上午9:00 • AI前沿 • 175 views

希望部署多个 AI 代理的企业通常需要实施一个框架来管理它们。

为此，微软研究人员最近推出了一种名为Magentic-One 的新型多智能体基础设施，该基础设施允许单个 AI 模型为各种辅助智能体提供支持，这些辅助智能体可以协同工作，在不同场景中完成复杂的多步骤任务。微软称 Magentic-One 是一种通用智能体系统，可以“完全实现智能体系统的长期愿景，即提高我们的生产力并改变我们的生活”。

该框架是开源的，在定制的 Microsoft 许可证下可供研究人员和开发人员使用，包括用于商业目的。在发布 Magentic-One 的同时，微软还发布了一款名为 AutoGenBench 的开源代理评估工具来测试代理系统，该工具建立在其之前发布的Autogen 框架之上，用于多代理通信和合作。

通用代理系统背后的想法是弄清楚自主代理如何解决组织日常运作甚至个人日常生活中经常发现的需要多个步骤才能完成的任务。

从微软提供的示例来看，该公司似乎希望 Magentic-One 能够完成几乎平凡的任务。研究人员指出，Magentic-One 可以完成诸如描述标准普尔 500 指数趋势、查找和导出缺失引文，甚至订购沙瓦玛等任务。

Magnetic-One 的工作原理

Magentic-One 依靠 Orchestrator 代理来指挥其他四个代理。Orchestrator 不仅管理代理，指挥它们执行特定任务，而且在出现错误时还会重定向它们。

该框架由除 Orchestrator 之外的四种类型的代理组成：

Websurfer 代理可以控制基于 Chromium 的 Web 浏览器，导航至各个网站或执行 Web 搜索。它还可以进行点击和输入操作（类似于Anthropic最近发布的 Computer Use），并总结内容。
FIleSurfer 代理读取本地文件列表目录并浏览文件夹。
编码代理编写代码、分析来自其他代理的信息并创建新的工件。
ComputerTerminal 提供了一个控制台，可以在其中执行 Coder 代理的程序。

Orchestrator 负责指挥这些代理并跟踪他们的进度。它首先规划如何完成任务。它创建了微软研究人员称之为任务分类账的东西，用于跟踪工作流。随着任务的继续，Orchestrator 会构建一个进度分类账，“它会在其中自我反思任务进度并检查任务是否完成。”Orchestrator 可以指派代理来完成每项任务或更新任务分类账。如果代理仍然停滞不前，Orchestrator 可以创建新计划。

研究人员在论文中写道：“Magentic-One 的代理共同为 Orchestrator 提供了解决各种开放式问题所需的工具和能力，以及自主适应和在动态不断变化的网络和文件系统环境中行动的能力。”

虽然微软使用OpenAI 的GPT-4o开发了 Magentic-One （OpenAI 毕竟是微软的投资），但它与 LLM 无关，尽管研究人员“建议为 Orchestrator 代理使用强大的推理模型，例如 GPT-4o”。

Magentic-One 支持代理背后的多种模型，例如，开发人员可以为 Orchestrator 代理部署推理 LLM，并为不同的代理部署其他 LLM 或小型语言模型的混合。微软的研究人员尝试了不同的 Magentic-One 配置，“使用 OpenAI 01-preview 作为 Orchestrator 的外循环和 Coder，而其他代理继续使用 GPT-4o。”

代理框架的下一步

随着部署代理的选项越来越多，从现成的代理库到可定制的组织特定代理，代理系统变得越来越流行。微软于 10 月宣布推出一套适用于 Dynamics 365 平台的 AI 代理。

科技公司现在开始在人工智能编排框架方面展开竞争，尤其是管理代理工作流的系统。OpenAI 发布了Swarm 框架，为开发人员提供了一种简单而灵活的方式来让代理指导代理协作。CrewAI的多代理构建器也提供了一种管理代理的方法。同时，大多数企业都依赖 LangChain来帮助构建代理框架。

然而，企业中的 AI 代理部署仍处于早期阶段，因此找出最佳的多代理框架仍将是一项持续的实验。大多数 AI 代理仍在自己的游乐场中玩耍，而不是与其他系统的代理对话。随着越来越多的企业开始使用 AI 代理，管理这种蔓延并确保 AI 代理无缝地相互交接工作以完成任务变得更加重要。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/wei-ruan-de-xin-magenticone-xi-tong-zhi-hui-duo-ge-ai-dai

Like (0)

王浩然作者

0 0

介绍“叙事指挥”，这一有助于解释 2024 年大选的新商业论点

Previous 2024年11月9日

零售商通过 AI 投资创造和获取价值的 3 个步骤

Next 2024年11月10日

AI前沿

数据新时代的交易枢纽：Carbon Arc打造授权交易数据市场，赋能LLMs与企业应用

在数据被誉为“新石油”的当今时代，数据的重要性不言而喻。然而，尽管数据被视为一种宝贵的资源，但其交易与流通却远不如石油那样顺畅。数据的获取往往伴随着法律纠纷与版权问题，使得企业在追…

王浩然
2025年3月24日
000
AI前沿

思科AI防御如何抵御你从未见过的网络威胁

随着企业在各个业务领域中加速采用AI技术，其快速适应性也带来了一个安全悖论——如何在系统不断演变的同时，将其安全扩展到整个企业范围？目前，对抗性AI正主导着威胁态势，引发了一场隐形…

王浩然
2025年2月23日
000
AI前沿

DeepSeek 真的在向中国发送数据吗？让我们来解密

上周，中国初创公司DeepSeek发布了性能强大但成本低廉的开源版本 DeepSeek-R1，在人工智能界引起轩然大波。该模型使用纯强化学习 (RL)，在一系列基准测试中与 Ope…

王浩然
2025年1月28日
000
AI前沿

ChatGPT 集成如何与 Apple Intelligence 协同工作

周三，借助新发布的 iOS 18.2、iPadOS 18.2 和 macOS Sequoia 15.2 更新，开发人员首次体验了 Apple Intelligence 的 Chat…

王浩然
2024年10月25日
000
AI前沿

5.25 亿美元债券资助智能能源扩张

台达电子宣布发行 5.25 亿美元债券，以加速开发基于物联网的下一代智能节能解决方案，以支持人工智能、智能制造、电动汽车和能源转型。此次通过台湾子公司台达国际控股有限…

王浩然
2025年1月26日
000
AI前沿

无形的、自主的且可被攻击的：无人预见的AI代理困境

随着人工智能（AI）技术的飞速发展，一种新型的网络安全威胁正在悄然兴起——无形的、自主的AI代理。这些AI代理在后台默默运行，能够自我学习、自我决策，并在不被察觉的情况下执行恶意任…

王浩然
2025年2月23日
000
AI前沿

Lightmatter 获得 4 亿美元融资，AI 超大规模企业对光子数据中心充满期待

光子计算初创公司Lightmatter已筹集 4 亿美元，旨在突破现代数据中心的一个瓶颈。该公司的光学互连层可让数百个 GPU 同步工作，从而简化了昂贵而复杂的 AI 模型训练和运…

王浩然
2024年10月17日
000
AI前沿

人工智能热潮中英伟达成为全球最大公司

得益于全球人工智能的推动，英伟达周二市值超过苹果，成为全球最大公司。据彭博社报道，自 2022 年底以来，这家芯片制造商的市值增长了 850%。截至收盘，Nvidia 市值为 3…

王浩然
2024年11月6日
000
AI前沿

Meta 有很大机会赢得 AI 硬件竞赛

在人工智能设备失败的一年里，雷朋 Meta 智能眼镜的表现超出预期。但它能保持这种势头吗？人工智能可穿戴设备经历了糟糕的一年。就在几个月前，科技界还坚信人工智能硬件将成为下一个…

王浩然
2024年9月23日
000
AI前沿

Uber ChatGPT AI 助手鼓励人们使用电动汽车

在 OpenAI 的 GPT-4o 的支持下，Uber 的司机应用程序将配备人工智能助手，为所有可以想象到的电动汽车问题提供类似人类的答案

点点
2024年10月16日
000
AI前沿

从 AI 代理到企业预算，20 家风险投资公司分享了他们对 2025 年企业技术的预测

尽管人工智能被一些人誉为工业革命以来最大的技术突破，但企业——可以说是该技术最大的潜在客户群——采用人工智能的速度却很慢。尽管一些投资者预测 2024 年将是企业开始采用更多 A…

王浩然
2024年12月31日
000
AI前沿

Python 数据验证器 Pydantic 推出与模型无关的 AI 代理开发平台

为了不被本周 AWS re:Invent 上的众多 AI 公告所掩盖，领先的开源 Python 编程语言数据验证库背后的团队Pydantic推出了PydanticAI，这是一个新的…

王浩然
2024年12月5日
000
AI前沿

OpenAI 确认新前沿模型 o3 和 o3-mini

OpenAI 正在慢慢邀请选定的用户测试一整套新的推理模型，名为 o3 和 o3 mini，它们是本月初刚刚全面发布的o1 和 o1-mini 模型的后继者。 OpenAI o3 …

王浩然
2024年12月21日
000
AI前沿

人工智能增强型量子大型语言模型发布

Secqai 是一家专门从事超安全硬件和软件的公司，推出了混合量子大语言模型 (QLLM)。 QLLM 旨在通过将量子计算与传统大型语言模型 (LLM) 相结合来增强人工智能应用，…

王浩然
2025年2月11日
000
AI前沿

Sakana AI 的 CycleQD 优于多技能语言模型的传统微调方法

Sakana AI的研究人员开发了一种资源高效的框架，可以创建数百种专门用于不同任务的语言模型。该技术称为CycleQD，它使用进化算法来结合不同模型的技能，而无需昂贵且缓慢的训练…

王浩然
2024年12月7日
000
AI前沿

Apple Intelligence 的真正威力将在第三方应用中展现出来

Apple Intelligence 是 iPhone 制造商在 iOS 18 中推出的一套新的 AI 功能，它为应用程序的新使用方式奠定了基础。如今，过时的 App Store…

王浩然
2024年9月11日
000
AI前沿

Level AI 首席执行官兼创始人 Ashish Nagar – 访谈系列

Ashish Nagar 是Level AI的首席执行官兼创始人，他利用自己在亚马逊 Alexa 团队的工作经验，利用人工智能来改变联络中心的运营。Ashish 拥有深厚的技术和创…

点点
2024年11月6日
000
AI前沿

人工智能代理入门（第 2 部分）：自主性、保障措施和陷阱

在我们的第一部分中，我们概述了利用 AI 代理提高企业效率的关键策略。我解释了与独立 AI 模型不同，代理如何使用上下文和工具迭代地优化任务以增强代码生成等结果。我还讨论了多代理系…

王浩然
2024年11月27日
000
AI前沿

Thesys 融资 400 万美元，利用自适应“生成式 UI”改造 AI 驱动的用户界面

在充斥着旨在增强用户体验的人工智能代理的技术领域，Thesys 的使命是重新定义用户与人工智能的互动方式。在由Together Fund领投的新一轮 400 万美元种子融资以及8V…

王浩然
2024年11月10日
000
AI前沿

为什么生成视频系统不能制作完整的电影？

生成式人工智能视频的出现和进步促使许多普通观察者预测，机器学习将导致我们所知的电影业的消亡——相反，单个创作者将能够在家里通过本地或基于云端的 GPU 系统创作好莱坞风格的大片。 …

王浩然
2024年9月24日
000

发表回复

Please Login to Comment

微软的新 Magentic-One 系统指挥多个 AI 代理完成用户任务

Magnetic-One 的工作原理

代理框架的下一步

相关推荐

发表回复

Share To :