当大型语言模型 (LLM) 出现时,企业迅速将其纳入工作流程。他们使用检索增强生成 (RAG)开发 LLM 应用程序,该技术利用内部数据集来确保模型提供具有相关业务背景并减少幻觉的答案。这种方法非常有效,导致了功能性聊天机器人和搜索产品的兴起,这些产品可帮助用户立即找到所需的信息,无论是保单中的特定条款还是有关正在进行的项目的问题。
然而,即使 RAG 在多个领域继续蓬勃发展,企业也遇到了无法提供预期结果的情况。代理 RAG 就是这种情况,其中一系列 AI 代理增强了 RAG 管道。它仍然是新事物,偶尔会遇到问题,但它有望彻底改变 LLM 驱动的应用程序处理和检索数据以处理复杂用户查询的方式。
矢量数据库公司Weaviate 的技术合作伙伴经理 Erika Cardenas 和 ML 工程师 Leonie Monigatti 在一篇联合博客文章中描述了代理RAG 的潜力:“代理 RAG……将 AI 代理纳入 RAG 管道,以协调其组件并执行除了简单信息检索和生成之外的其他操作,以克服非代理管道的局限性。”
“普通” RAG 的问题
尽管传统 RAG 在各种用例中被广泛使用,但它常常因其工作方式的固有特性而受到影响。
核心部分,原始 RAG 管道由两个主要组件组成:检索器和生成器。检索器组件使用向量数据库和嵌入模型来接收用户查询,并对索引文档运行相似性搜索,以检索与查询最相似的文档。同时,生成器将连接的 LLM 与检索到的数据相结合,以生成具有相关业务上下文的响应。
该架构可帮助组织提供相当准确的答案,但当需要超越一个知识源(矢量数据库)时,问题就开始了。传统的管道无法将 LLM 与两个或多个来源联系起来,从而限制了下游产品的功能,并使其仅限于特定应用程序。
此外,在某些复杂情况下,使用传统 RAG 构建的应用程序可能会因缺乏对检索数据的后续推理或验证而出现可靠性问题。检索器组件一次性提取的任何数据最终都会成为模型给出答案的基础。
Agentic RAG 来救援
随着企业不断升级其 RAG 应用程序,这些问题变得越来越突出,迫使用户探索更多功能。代理 AI 就是这样一种功能,其中具有记忆和推理能力的 LLM 驱动的 AI 代理可以规划一系列步骤并跨不同的外部工具采取行动来处理任务。它特别用于客户服务等用例,但也可以协调 RAG 管道的不同组件,从检索器组件开始。
据 Weaviate 团队介绍,人工智能代理可以访问各种工具(如网络搜索、计算器或软件 API(如 Slack/Gmail/CRM))来检索数据,而不仅仅是从一个知识源获取信息。
因此,根据用户查询,具有推理和记忆功能的 AI 代理可以决定是否应该获取信息、哪个是获取所需信息的最合适工具以及检索到的上下文是否相关(以及是否应该重新检索),然后将获取的数据推送到生成器组件以产生答案。
该方法扩展了支持下游 LLM 应用程序的知识库,使它们能够对复杂的用户查询产生更准确、更扎实和更有效的响应。
例如,如果用户拥有一个充满支持票的矢量数据库,并且查询是“今天最常见的问题是什么?”,代理体验将能够运行网络搜索以确定查询的日期,并将其与矢量数据库信息相结合以提供完整的答案。
“通过添加有权使用工具的代理,检索代理可以将查询路由到专门的知识源。此外,代理的推理能力可以在检索到的上下文用于进一步处理之前对其进行一层验证。因此,代理 RAG 管道可以带来更稳健、更准确的响应,”Weaviate 团队指出。
实施起来很容易,但挑战依然存在
由于具有函数调用功能的大型语言模型的广泛使用,组织已经开始从原始 RAG 管道升级到代理 RAG。DSPy、 LangChain 、CrewAI、LlamaIndex 和 Letta等代理框架也已兴起,它们通过将预构建的模板组合在一起来简化代理 RAG 系统的构建。
建立这些管道主要有两种方式。一种是整合一个单一代理系统,该系统通过多个知识源来检索和验证数据。另一种是多代理系统,其中由主代理运行的一系列专用代理跨各自的源工作以检索数据。然后,主代理处理检索到的信息并将其传递给生成器。
然而,无论使用何种方法,值得注意的是,代理 RAG 仍然很新,并且可能会偶尔遇到问题,包括由多步骤处理和不可靠性引起的延迟。
“根据底层 LLM 的推理能力,代理可能无法充分完成任务(甚至根本无法完成任务)。当 AI 代理无法完成任务时,加入适当的故障模式来帮助其摆脱困境非常重要,”Weaviate 团队指出。
该公司首席执行官 Bob van Luijt 还告诉 VentureBeat,代理 RAG 管道也可能很昂贵,因为 LLM 代理提出的请求越多,计算成本就越高。不过,他还指出,从长远来看,整个架构的设置方式可能会对成本产生影响。
“代理架构对于下一波人工智能应用至关重要,这些应用可以“执行”任务,而不仅仅是检索信息。随着团队将第一波 RAG 应用程序投入生产并熟悉 LLM,他们应该寻找有关新技术的教育资源,例如代理 RAG 或生成反馈循环,这是一种用于数据清理和丰富等任务的代理架构,”他补充道。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/agentic-rag-ru-he-gai-bian-shu-ju-chu-li-he-jian-suo-de-ge