Agentic RAG 如何改变数据处理和检索的格局

王浩然 • 2024年11月13日下午7:00 • AI前沿 • 107 views

当大型语言模型 (LLM) 出现时，企业迅速将其纳入工作流程。他们使用检索增强生成 (RAG)开发 LLM 应用程序，该技术利用内部数据集来确保模型提供具有相关业务背景并减少幻觉的答案。这种方法非常有效，导致了功能性聊天机器人和搜索产品的兴起，这些产品可帮助用户立即找到所需的信息，无论是保单中的特定条款还是有关正在进行的项目的问题。

然而，即使 RAG 在多个领域继续蓬勃发展，企业也遇到了无法提供预期结果的情况。代理 RAG 就是这种情况，其中一系列 AI 代理增强了 RAG 管道。它仍然是新事物，偶尔会遇到问题，但它有望彻底改变 LLM 驱动的应用程序处理和检索数据以处理复杂用户查询的方式。

矢量数据库公司Weaviate 的技术合作伙伴经理 Erika Cardenas 和 ML 工程师 Leonie Monigatti 在一篇联合博客文章中描述了代理RAG 的潜力：“代理 RAG……将 AI 代理纳入 RAG 管道，以协调其组件并执行除了简单信息检索和生成之外的其他操作，以克服非代理管道的局限性。”

“普通” RAG 的问题

尽管传统 RAG 在各种用例中被广泛使用，但它常常因其工作方式的固有特性而受到影响。

核心部分，原始 RAG 管道由两个主要组件组成：检索器和生成器。检索器组件使用向量数据库和嵌入模型来接收用户查询，并对索引文档运行相似性搜索，以检索与查询最相似的文档。同时，生成器将连接的 LLM 与检索到的数据相结合，以生成具有相关业务上下文的响应。

该架构可帮助组织提供相当准确的答案，但当需要超越一个知识源（矢量数据库）时，问题就开始了。传统的管道无法将 LLM 与两个或多个来源联系起来，从而限制了下游产品的功能，并使其仅限于特定应用程序。

此外，在某些复杂情况下，使用传统 RAG 构建的应用程序可能会因缺乏对检索数据的后续推理或验证而出现可靠性问题。检索器组件一次性提取的任何数据最终都会成为模型给出答案的基础。

Agentic RAG 来救援

随着企业不断升级其 RAG 应用程序，这些问题变得越来越突出，迫使用户探索更多功能。代理 AI 就是这样一种功能，其中具有记忆和推理能力的 LLM 驱动的 AI 代理可以规划一系列步骤并跨不同的外部工具采取行动来处理任务。它特别用于客户服务等用例，但也可以协调 RAG 管道的不同组件，从检索器组件开始。

据 Weaviate 团队介绍，人工智能代理可以访问各种工具（如网络搜索、计算器或软件 API（如 Slack/Gmail/CRM））来检索数据，而不仅仅是从一个知识源获取信息。

因此，根据用户查询，具有推理和记忆功能的 AI 代理可以决定是否应该获取信息、哪个是获取所需信息的最合适工具以及检索到的上下文是否相关（以及是否应该重新检索），然后将获取的数据推送到生成器组件以产生答案。

该方法扩展了支持下游 LLM 应用程序的知识库，使它们能够对复杂的用户查询产生更准确、更扎实和更有效的响应。

例如，如果用户拥有一个充满支持票的矢量数据库，并且查询是“今天最常见的问题是什么？”，代理体验将能够运行网络搜索以确定查询的日期，并将其与矢量数据库信息相结合以提供完整的答案。

“通过添加有权使用工具的代理，检索代理可以将查询路由到专门的知识源。此外，代理的推理能力可以在检索到的上下文用于进一步处理之前对其进行一层验证。因此，代理 RAG 管道可以带来更稳健、更准确的响应，”Weaviate 团队指出。

实施起来很容易，但挑战依然存在

由于具有函数调用功能的大型语言模型的广泛使用，组织已经开始从原始 RAG 管道升级到代理 RAG。DSPy、 LangChain 、CrewAI、LlamaIndex 和 Letta等代理框架也已兴起，它们通过将预构建的模板组合在一起来简化代理 RAG 系统的构建。

建立这些管道主要有两种方式。一种是整合一个单一代理系统，该系统通过多个知识源来检索和验证数据。另一种是多代理系统，其中由主代理运行的一系列专用代理跨各自的源工作以检索数据。然后，主代理处理检索到的信息并将其传递给生成器。

然而，无论使用何种方法，值得注意的是，代理 RAG 仍然很新，并且可能会偶尔遇到问题，包括由多步骤处理和不可靠性引起的延迟。

“根据底层 LLM 的推理能力，代理可能无法充分完成任务（甚至根本无法完成任务）。当 AI 代理无法完成任务时，加入适当的故障模式来帮助其摆脱困境非常重要，”Weaviate 团队指出。

该公司首席执行官 Bob van Luijt 还告诉 VentureBeat，代理 RAG 管道也可能很昂贵，因为 LLM 代理提出的请求越多，计算成本就越高。不过，他还指出，从长远来看，整个架构的设置方式可能会对成本产生影响。

“代理架构对于下一波人工智能应用至关重要，这些应用可以“执行”任务，而不仅仅是检索信息。随着团队将第一波 RAG 应用程序投入生产并熟悉 LLM，他们应该寻找有关新技术的教育资源，例如代理 RAG 或生成反馈循环，这是一种用于数据清理和丰富等任务的代理架构，”他补充道。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/agentic-rag-ru-he-gai-bian-shu-ju-chu-li-he-jian-suo-de-ge

Like (0)

王浩然作者

0 0

Box 继续拓展数据共享以外的业务，推出代理驱动的企业 AI 工作室和无代码应用程序

Previous 2024年11月13日

边缘数据对人工智能至关重要——戴尔如何帮助企业释放其价值

Next 2024年11月13日

AI前沿

AI可穿戴设备1.0：Humanes的AI胸针是否过于野心勃勃？

自2021年11月1日起，Yahoo服务套件在中国大陆已无法访问，但这并不影响我们在全球其他地区的讨论。今日，我们聚焦于AI可穿戴设备领域，特别是Humanes推出的AI胸针项目。…

王浩然
2025年2月25日
000
AI前沿

Koyeb无服务器云平台：助力开发者快速部署Tenstorrent AI加速器‌

近日，Koyeb无服务器云平台宣布了一项重大更新，允许开发者在该平台上轻松部署Tenstorrent AI加速器。这一更新为开发者提供了更为灵活和高效的AI计算资源，助力他们加速A…

王浩然
2025年2月27日
000
AI前沿

谷歌开始在乌拉圭建设价值 8.5 亿美元的数据中心

新设施旨在提高人工智能能力、支持经济增长和实现可持续发展

点点
2024年9月5日
000
AI前沿

Lapsi 正在重新启动听诊器作为健康跟踪数据平台

医疗技术消费化正在继续：总部位于阿姆斯特丹的初创公司Lapsi Health刚刚获得 FDA 对其首款临床支持工具——数字听诊器的批准。美国医疗器械监管机构食品药品管理局已将其列为…

王浩然
2024年10月1日
000
AI前沿

ApertureData 获得 825 万美元种子资金并推出 ApertureDB Cloud 以彻底改变多模式 AI

ApertureData是一家处于多模态 AI 数据管理前沿的公司，该公司在超额认购的种子轮融资中筹集了 825 万美元，以推动其开创性平台 ApertureDB 的开发和扩展。此…

点点
2024年10月11日
000
AI前沿

伦敦国王商学院：人工智能如何改变问题解决方式

英国国王商学院和Wazoku研究人员开展的一项新研究表明，人工智能正在改变全球问题的解决方式。报告发现，在过去一年中，Wazoku 70 万名问题解决者网络中近一半（46%）利用…

点点
2024年10月8日
000
AI前沿

Persado 联合创始人兼总裁 Assaf Baciu – 访谈系列

Assaf Baciu 拥有近二十年为市场领先的 SaaS 组织制定企业战略和产品方向的经验。作为Persado的联合创始人兼总裁，他推动了 Persado 不断增长的产品组合的发…

点点
2024年10月24日
000
AI前沿

Slack 的人工智能代理有望利用情境能力重塑生产力

Slack将把Salesforce 的Agentforce AI 代理深度整合到其工作场所协作平台中，强调情境智能是日益拥挤的 AI 代理市场中的关键差异化因素。 Slack 首席…

王浩然
2024年12月19日
000
AI前沿

2024 年证明控制人工智能是可能的

今年几乎所有的人工智能重大新闻都是关于该技术发展速度有多快、它造成的危害，以及关于它多久会发展到人类无法控制的程度的猜测。但 2024 年，各国政府也在监管算法系统方面取得了重大进…

王浩然
2024年12月26日
000
AI前沿

日本最有趣的独角兽

尽管日本的创业行业是世界上最大的行业之一，但就独角兽企业数量和风险投资规模而言，日本仍落后于美国、中国和英国等其他地区。多年来，人口老龄化、整体经济通缩以及工薪阶层倾向于在传统的大…

点点
2024年10月13日
000
AI前沿

谁最常使用人工智能？人类经济指数对数据进行了分析

人工智能正在重塑现代职场，但到目前为止，其对个人任务和职业的影响仍然难以量化。Claude背后的人工智能初创公司Anthropic的一份新报告以数据为依据，展示了企业和专业人士如何…

王浩然
2025年2月11日
000
AI前沿

谷歌称其下一代人工智能代理最早要到 2025 年才会推出

谷歌最早要到明年才会推出Project Astra的技术。Project Astra 是谷歌为实现实时、多模式理解而开展的一项广泛努力，旨在构建人工智能应用程序和“代理”。谷歌首…

王浩然
2024年10月30日
000
AI前沿

谷歌首席执行官 Sundar Pichai 宣布为全球人工智能教育设立 1.2 亿美元基金

谷歌首席执行官桑达尔·皮查伊 (Sundar Pichai) 周六在联合国未来峰会上发表讲话，将人工智能描述为“迄今为止最具变革性的技术”，并宣布在全球范围内设立一项用于人工智能教…

王浩然
2024年9月23日
000
AI前沿

为什么 AI 领域的每个人都对 DeepSeek 着迷

就在几天前，只有最书呆子的书呆子（我就是其中之一）才听说过DeepSeek ，它是名字同样引人入胜的High-Flyer Capital Management的中国 AI 子公司，…

王浩然
2025年1月25日
000
AI前沿

人工智能工具包有望加快机器人开发速度

总部位于丹麦的Universal Robots推出了一款全新即用型硬件和软件工具包，旨在简化人工智能协作机器人应用程序的开发。该公司生产用于工业用途的小型灵活机械臂，其新产品 U…

王浩然
2024年11月7日
000
AI前沿

人工智能初创公司宣布获得 160 万美元融资

平台旨在帮助企业实现 99% 的 AI 应用准确率人工智能基础设施初创公司 Future AGI 宣布获得 160 万美元的种子前融资，以扩展其生命周期管理平台，使企业能够构建和…

王浩然
2025年2月21日
000
AI前沿

连接代码和良知：马里兰大学对道德和包容性人工智能的追求

随着人工智能系统日益渗透到我们日常生活中的关键决策过程，将道德框架融入人工智能开发正成为研究重点。在马里兰大学 (UMD)，跨学科团队致力于解决规范推理、机器学习算法和社会技术系统…

点点
2024年10月9日
000
AI前沿

微软的新 Magentic-One 系统指挥多个 AI 代理完成用户任务

希望部署多个 AI 代理的企业通常需要实施一个框架来管理它们。为此，微软研究人员最近推出了一种名为Magentic-One 的新型多智能体基础设施，该基础设施允许单个 AI 模…

王浩然
2024年11月10日
000
AI前沿

克服人工智能基础设施部署障碍的 5 种方法

如今，企业面临着利用人工智能作为竞争优势的巨大压力，但我们仍处于早期阶段。只有约40% 的大型企业在其业务中积极部署人工智能，但障碍使另外 40% 的企业处于探索和实验阶段。尽管人…

王浩然
2024年11月1日
000
AI前沿

利用人工智能节省照片筛选时间

如果您是摄影师，没有什么比在大型活动或拍摄后整理数百张（甚至数千张）照片更耗时的事情了。您是否知道专业摄影师平均每小时拍摄一次，要花 3-4 个小时进行编辑？我最近偶然发现了Af…

AI评测师
2024年10月7日
000