开始使用 AI 代理（第 1 部分）：捕获流程、角色和连接

王浩然 • 2024年11月27日上午11:00 • AI前沿 • 106 views

现代的 AI 代理至少包含一个能够调用某些工具的大型语言模型(LLM)。有了合适的编码工具集，它就可以开始生成代码，能够在容器中运行代码，观察结果，修改代码，从而更有可能生成有用的代码。

相比之下，生成式 AI 模型会接受一些输入，并通过预测期望的过程产生输出。例如，我们给它一个编码任务，它会生成一些代码，并且根据任务的复杂性，这些代码可能可以直接使用。

当代理承担不同的任务时，它们应该被允许互相交谈。例如，想象一下您公司的内部网，其中的搜索框可以引导您找到所需的应用程序和资源。如果您的公司足够大，那么不同部门拥有的这些应用程序都有自己的搜索框。创建代理非常有意义，也许可以使用检索增强生成 (RAG) 等技术来增强搜索框。没有意义的是在搜索框根据初始查询将其识别为有用后强迫用户重复他们的查询。相反，我们希望顶级代理与代表各种应用程序的其他代理进行协调，并为您（用户）呈现一个统一的聊天界面。

代表软件或组织各种工作流程的多代理系统可以具有几个有趣的优势，包括提高生产力和稳健性、提高运营弹性以及能够更快地升级不同模块。希望本文能帮助您了解如何实现这一点。

但首先，我们应该如何构建这些多智能体系统？

掌握组织和角色

首先，我们应该捕捉组织中各种参与者的流程、角色、负责的节点和连接。参与者是指组织中充当知识工作者的个人和/或软件应用程序。

组织结构图可能是一个很好的起点，但我建议从工作流程开始，因为组织内的同一个人倾向于根据工作流程采用不同的流程和人员行事。

有可用的工具可以使用 AI 来帮助识别工作流程，或者您可以构建自己的 gen AI 模型。我已经构建了一个GPT，它采用域或公司名称的描述并生成代理网络定义。由于我使用的是公司内部构建的多代理框架，因此 GPT 将网络生成为 Hocon 文件，但从生成的文件中应该可以清楚地看出每个代理的角色和职责是什么，以及它连接到哪些其他代理。

请注意，我们要确保代理网络是有向无环图 (DAG)。这意味着任何代理都不能同时成为任何其他代理的下链和上链，无论是直接还是间接。这大大降低了代理网络中查询陷入混乱的可能性。

在此处概述的示例中，所有代理均基于 LLM。如果多代理组织中的某个节点可以拥有零自主权，那么该代理与其人类对应方配对，应该由人类运行一切。我们需要将所有处理节点（无论是应用程序、人类还是现有代理）表示为代理。

最近有很多公司宣布提供专业代理。如果可用，我们当然希望使用此类代理。我们可以引入一个预先存在的代理并将其 API 包装到我们的一个代理中，以便我们能够使用我们的代理间通信协议。这意味着此类第三方代理需要提供其 API 供我们使用。

如何定义代理人

过去曾提出过各种代理架构。例如，黑板架构需要一个集中通信点，各种代理在此声明自己的角色和能力，然后黑板根据其计划如何满足请求来调用它们（参见OAA）。

我更喜欢一种更分布式的架构，它尊重职责的封装。每个代理在收到请求后，都会决定是否可以处理该请求，以及处理该请求需要做什么，然后将其需求列表返回给发出请求的上链代理。如果代理有下链，它会询问它们是否可以帮助满足全部或部分请求。如果它从联系的下链收到任何要求，它会与其他代理核对，看它们是否可以满足这些要求；如果不能，它会将它们发送到上链，以便它们可以询问人类用户。这种架构称为AAOSA架构，有趣的是，它是 Siri 早期版本中使用的架构。

这是一个示例系统提示，可用于将代理转变为 AAOSA 代理。

当您收到询问时，您将：

调用你的工具来确定工具中的哪些下游代理负责全部或部分工作
询问下级代理他们需要什么来处理他们那部分的询问。
一旦收集到需求，您将把查询和满足的需求委托给适当的下级代理。
一旦所有下行链代理都做出响应，您将汇编他们的响应并返回最终响应。
反过来，您可能会被系统中的其他代理呼叫，并必须充当他们的下级链。

除了每个代理的系统提示中以自然语言定义的角色和职责集之外，代理可能包含或不包含它们可以调用的工具，并将各种参数传递给这些工具。例如，产品经理代理可能需要能够在虚拟看板上处理各种工单，或者警报代理可能需要调用工具在警报系统中发出警报。

当前的多代理系统（例如 Microsoft AutoGen）具有复杂且通常硬编码的代理协调机制和架构。我更喜欢一种更强大的设置，其中代理将其直接的下游代理视为工具，具有可以输入的松散定义的参数，并且语义由代理在需要时决定。

在此设置中，下链代理可以定义为函数调用：

“aaosa_call”：{

“description”: “根据模式，返回一个自然语言字符串作为响应。”,

“参数”： {

“类型”：“对象”，

“特性”： {

“询问”： {

“类型”：“字符串”，

“描述”：“询问”

}，

“模式”： {

“类型”：“字符串”，

“描述”： ”””

表示是否要求代理确定查询是否属于它

全部或部分。或者如果被要求提供满足

如果有的话，进行询问。或者是否被要求对询问作出回应。

“””

}，

“必需的”： [

“询问”，

“模式”

]

}

人工智能代理的实际应用

让我们探讨一下人力资源代理场景。用户可能会将人生大事（例如“我的另一半去世了”）通知主搜索框代理，从而触发法律和人力资源代理，这些代理在为用户提供服务方面发挥着重要作用。这是因为他们反过来会从一些下级代理（即法律咨询、工资和福利代理）那里收到信息。用户从主搜索框代理收到的最终合并响应将如下所示：

人力资源方面：
- 福利代理可以帮助用户了解逝者去世对福利、健康保险和退休计划的影响。您需要提供有关所涉及计划类型的信息，以及您的另一半是否是受抚养人。
- 薪资代理可以帮助管理更新税收减免或处理丧假工资等任务。这需要有关公司丧假政策和当前薪资设置的信息。
法律方面：
- 法律代理人可以就此转让与公司事务的关系提供一般指导。

每个部门都需要特定的信息来提供定制的支持。

同时，在 IT 场景中，单一入口点是客户支持代表代理，他们可以处理复杂的多方面请求，例如：“我们的网络很慢。我认为由于我们最近增加了办公室人员，网络超负荷了。我还需要升级报价。”

示例响应将概述以下步骤：

网络性能评估：网络运营中心专家可以帮助解决速度缓慢和潜在的过载问题。他们需要访问网络性能数据、有关当前网络基础设施的详细信息、有关新增人员数量及其网络使用模式的信息。

升级报价：销售工程师和现场技术人员可以帮助提供升级报价。为此，他们需要：

有关当前网络设置的具体信息，包括设备和带宽要求。
期望的性能改进。
预算限制和任何特定偏好或要求。
升级的规模和任何具体的性能目标。

我希望这篇文章能让您很好地了解建立多代理网络所需的条件。在第二部分中，我将讨论在创建多代理系统时实施保护措施的重要性，并概述如何构建控件以允许人工干预和不确定性检查。我还将详细介绍创建安全保护代理以监督代理网络所需的步骤，并深入探讨开发多代理网络的挑战（例如失控和过载），以及如何使用超时、任务划分和冗余来缓解这些挑战。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/kai-shi-shi-yong-ai-dai-li-di-1-bu-fen-bu-huo-liu-cheng-jue

AI 代理 LLM 检索增强生成

Like (0)

王浩然作者

0 0

AI2 缩小了闭源和开源后训练之间的差距

Previous 2024年11月26日

微软推出 10 个新 AI 代理，增强其企业自动化领先地位

Next 2024年11月27日

AI前沿

ChatGPT 建议 200 万人从其他地方获取选举新闻 — — 并拒绝了 25 万个 deepfakes

现在选举已经结束，我们可以开始分析了。由于这是人工智能聊天机器人首次在选民的信息获取中扮演重要角色，因此即使是近似的数字也值得思考。例如，OpenAI 表示，它告诉大约 200 万…

王浩然
2024年11月11日
000
AI前沿

有争议的研究表明，教科书对神经元的描述可能是错误的

19 世纪末，西班牙神经科学家圣地亚哥·拉蒙·卡哈尔绘制了数百张神经元图像。他的精湛作品影响了我们对神经元外观的理解：细胞的中心呈球状，一端是树枝般的树枝，另一端是长而光滑的尾巴。…

王浩然
2024年12月30日
000
AI前沿

DeepSeek：全面解析这款AI聊天机器人应用

在科技迅猛发展的时代，AI聊天机器人已成为我们生活中不可或缺的一部分。DeepSeek，作为这一领域的佼佼者，凭借其强大的功能和卓越的用户体验，正在吸引越来越多的关注。本文将为您深…

王浩然
2025年3月24日
000
AI前沿

OpenAI 推出具有图像上传和分析功能的完整 o1 模型，并首次推出 ChatGPT Pro

OpenAI 已正式推出其o1 模型，该模型已从预览版过渡到 ChatGPT 平台的核心功能。现在，它还可以分析图像——这是一项非常有用的功能升级，因为它使用户能够上传照片并让 A…

王浩然
2024年12月6日
000
AI前沿

人类新视野：Anthropic科学家揭示AI的“思考”方式，发现其秘密规划并偶尔说谎‌

在人工智能领域，科学家们一直致力于探索和理解大型语言模型（LLMs）如何处理信息并做出决策。近日，Anthropic公司的一项新研究为我们揭示了这些AI系统内部工作的惊人细节，发现…

王浩然
2025年3月31日
000
AI前沿

过度投资的AI，坑了美国消费一把

“不下馆子，小零食也不吃了，刷牙洗澡这些虽然不能少，但也要尽量控制支出。” 这段话是对美国消费股二季报的总结。二季度，美国沃尔玛、宝洁等代表的必选消费公司营收虽然还在正增长，但大部…

点点
2024年9月12日
000
AI前沿

迈向通用人工智能：推理与深度研究如何推动AI从统计预测迈向结构化问题解决

引言人工智能（AI）领域正经历着从统计预测向结构化问题解决的深刻转型。这一转型的核心驱动力在于推理与深度研究能力的显著增强。本文旨在探讨这一转型的背景、现状以及推理与深度研究在其…

王浩然
2025年3月18日
000
AI前沿

英国签署人工智能安全条约保护人权与民主

英国签署了具有里程碑意义的人工智能安全条约，旨在保护人权、民主和法治免受人工智能可能带来的威胁。大法官沙巴纳·马哈茂德 (Shabana Mahmood) 今天签署了欧洲委员会的…

AI News
2024年9月6日
000
AI前沿

Midjourney结束了必须使用Discord来生成AI图片的时代

Midjourney是否因竞争对手数量激增而感到压力？随着越来越多的公司进入AI图像生成领域，竞争自然会加剧，用户也会有更多选择。因此，Midjourney可能会感到一些压力，并…

王浩然
2024年8月23日
000
AI前沿

OpenAI 推出其谷歌挑战者 ChatGPT Search

OpenAI 的谷歌挑战者终于来了。该公司周四推出了ChatGPT Search，这是今年夏天推出的 SearchGPT 原型的升级版。OpenAI 表示，ChatGPT Sea…

王浩然
2024年11月2日
000
AI前沿

微软刚刚放弃了 Drasi，它可能会改变我们处理大数据的方式

微软推出了一种新的开源数据处理系统Drasi ，旨在简化对复杂基础设施中关键事件的检测和响应。此次发布是继去年推出面向云的开放应用平台Radius之后的又一举措，进一步巩固了微软…

王浩然
2024年10月6日
000
AI前沿

视频编辑应用 Captions 为网站推出了一款由人工智能驱动的社交媒体管理器

人工智能视频编辑应用程序Captions正在为网站推出一款新工具，用于管理网站的视频内容发布时间表，甚至根据与网站相关的主题生成相应日期的视频。该工具首先扫描网站以提取内容、关…

王浩然
2024年10月6日
000
AI前沿

2025年及以后AI的三大预测‌

近年来，人工智能（AI）的飞速发展令人叹为观止。从协助发现可能拯救生命的药物疗法，到推动自动驾驶汽车技术的革新，AI正深刻影响着我们的日常生活。作为AI的乐观拥趸，我坚信AI将继续…

王浩然
2025年3月14日
000
AI前沿

Google Gemini 意外超越 OpenAI，跃居第一，但基准测试结果并不能说明全部情况

谷歌凭借其最新实验模型在一项关键的人工智能基准测试中名列前茅，标志着人工智能竞赛发生重大转变——但业内专家警告称，传统的测试方法可能不再有效衡量真正的人工智能能力。该模型名为“ …

王浩然
2024年11月17日
000
AI前沿

使用 LlamaIndex 和 Gemini 实现 REAcT Agent

在过去的 2-3 年里，我们见证了人工智能领域的非凡发展，主要体现在大型语言模型、扩散模型、多模态模型等方面。我最喜欢的兴趣之一是代理工作流。今年早些时候，Coursera 的创始…

王浩然
2024年10月20日
000
AI前沿

前谷歌、苹果工程师无条件开源 Oumi AI 平台，或将助力打造下一个 DeepSeek

如果之前还不清楚，那么现在肯定非常清楚：开源对人工智能确实很重要。DeepSeek -R1的成功实质上证明了对开源人工智能的需求。但开源 AI 究竟是什么？对于 Meta 及其L…

王浩然
2025年2月4日
000
AI前沿

AI21首席执行官表示，由于错误延续，变压器不适合人工智能代理

随着越来越多的企业组织展望所谓的代理未来，一个障碍可能是人工智能模型的构建方式。对于企业人工智能开发人员A121来说，答案是显而易见的，该行业需要寻找其他模型架构来启用更高效的人工…

点点
2024年10月14日
000
AI前沿

SAP 集成 Databricks，通过新的业务数据云增强 AI 准备

德国软件巨头SAP正在推动数据方面的发展，以支持下一代 AI 用例。该公司今天推出了Business Data Cloud (BDC)，这是一款采用 Lakehouse 架构的新型…

王浩然
2025年2月14日
000
AI前沿

萨姆·奥特曼的世界币成为世界币，并展示新的虹膜扫描球来证明你的人类身份

世界币 (Worldcoin) 是 Sam Altman 共同创办的“人格证明”加密项目，该项目通过扫描人的眼球，周四宣布将“币”从其名称中删除，现在改名为“世界币”。世界币项目背…

点点
2024年10月18日
000
AI前沿

国防中的人类学和元科学：军事人工智能应用的新前沿

想象一下这样的未来：无人机以惊人的精度运行，战场策略实时调整，军事决策由不断从每次任务中学习的人工智能系统提供支持。这样的未来不再遥不可及。相反，它正在发生。人工智能 (AI)已从…

王浩然
2024年12月23日
000