微软研究人员提出了构建数据增强型 LLM 应用程序的框架

王浩然 • 2024年10月3日下午12:00 • AI前沿 • 157 views

利用训练数据以外的知识来增强大型语言模型 (LLM) 是一个重要领域，尤其是对于企业应用而言。将特定领域和客户知识融入 LLM 的最著名方法是使用检索增强生成(RAG)。然而，在许多情况下，简单的 RAG 技术是不够的。

构建有效的数据增强型 LLM 应用程序需要仔细考虑几个因素。在一篇新论文中，微软的研究人员提出了一个框架，用于根据 RAG 任务所需的外部数据类型及其涉及的推理复杂性对不同类型的 RAG 任务进行分类。

研究人员写道：“数据增强的 LLM 应用并不是一刀切的解决方案。现实世界的需求，特别是在专家领域，非常复杂，并且与给定数据的关系以及所需的推理难度可能会有很大差异。”

为了解决这种复杂性，研究人员根据所需的外部数据类型以及生成准确和相关响应所涉及的认知处理，提出了对用户查询进行四级分类的建议：

– 明确的事实：需要从数据中检索明确陈述的事实的查询。

– 隐含事实：需要推断数据中未明确说明的信息的查询，通常涉及基本推理或常识。

– 可解释的基本原理：需要理解和应用外部资源中明确提供的特定领域的基本原理或规则的查询。

– 隐藏的理由：需要揭示和利用数据中未明确描述的隐式特定领域推理方法或策略的查询。

每个级别的查询都呈现出独特的挑战，需要特定的解决方案才能有效地解决它们。

显式事实查询

显式事实查询是最简单的类型，侧重于检索所提供数据中直接陈述的事实信息。研究人员写道：“这一级别的定义特征是对特定外部数据的明确和直接依赖。”

解决这些查询的最常见方法是使用基本 RAG，其中 LLM 从知识库中检索相关信息并使用它来生成响应。

然而，即使有明确的事实查询，RAG 管道在每个阶段也面临多项挑战。例如，在索引阶段，RAG 系统会创建一个数据块存储，稍后可以将其作为上下文检索，这时它可能必须处理大型非结构化数据集，其中可能包含图像和表格等多模态元素。这可以通过多模态文档解析和多模态嵌入模型来解决，这些模型可以将文本和非文本元素的语义上下文映射到共享嵌入空间中。

在信息检索阶段，系统必须确保检索到的数据与用户的查询相关。在这里，开发人员可以使用技术来改善查询与文档存储的一致性。例如，LLM 可以为用户的查询生成合成答案。答案本身可能不准确，但它们的嵌入可用于检索包含相关信息的文档。

在答案生成阶段，模型必须确定检索到的信息是否足以回答问题，并在给定的上下文和其自身的内部知识之间找到适当的平衡。专门的微调技术可以帮助 LLM 学会忽略从知识库中检索到的不相关信息。检索器和响应生成器的联合训练也可以带来更一致的性能。

隐式事实查询

隐性事实查询要求法学硕士不仅要检索明确陈述的信息，还要进行一定程度的推理或演绎来回答问题。研究人员写道：“这一级别的查询需要收集和处理来自集合中多个文档的信息。”

例如，用户可能会问“X 公司上个季度销售了多少产品？”或“X 公司和 Y 公司的战略主要有什么不同？”回答这些问题需要结合知识库中来自多个来源的信息。这有时被称为“多跳问答”。

隐式事实查询带来了额外的挑战，包括需要协调多个上下文检索以及有效地整合推理和检索能力。

这些查询需要高级 RAG 技术。例如，交叉检索与思维链 ( IRCoT ) 和检索增强思维 ( RAT ) 等技术使用思维链提示根据先前回忆的信息来指导检索过程。

另一种有前途的方法是将知识图谱与 LLM 相结合。知识图谱以结构化格式表示信息，使其更容易执行复杂的推理并链接不同的概念。图 RAG 系统可以将用户的查询转换为包含来自图数据库的不同节点的信息的链。

可解释的理由查询

可解释的原理查询要求 LLM 不仅理解事实内容，还应用特定领域的规则。这些原理可能不存在于 LLM 的预训练数据中，但在知识语料库中也不难找到。

研究人员写道：“可解释的原理查询代表了应用程序中相对简单的类别，这些类别依赖外部数据来提供原理。这些类型的查询的辅助数据通常包括用于解决问题的思维过程的清晰解释。”

例如，客户服务聊天机器人可能需要将处理退货或退款的记录指南与客户投诉提供的背景信息结合起来。

处理这些查询的关键挑战之一是有效地将提供的理由整合到 LLM 中，并确保它能够准确遵循这些理由。及时调整技术（例如使用强化学习和奖励模型的技术）可以增强 LLM 遵循特定理由的能力。

LLM 还可用于优化自己的提示。例如，DeepMind 的 OPRO 技术使用多个模型来评估和优化彼此的提示。

开发人员还可以使用 LLM 的思路链推理功能来处理复杂的原理。但是，手动设计可解释原理的思路链提示可能非常耗时。Automate -CoT等技术可以帮助自动化此过程，方法是使用 LLM 本身从小型标记数据集中创建思路链示例。

隐藏理由查询

隐藏的原理查询是最大的挑战。这些查询涉及数据中未明确说明的特定领域的推理方法。法学硕士必须发现这些隐藏的原理并应用它们来回答问题。

例如，模型可能可以访问历史数据，这些数据隐含着解决问题所需的知识。模型需要分析这些数据，提取相关模式，并将其应用于当前情况。这可能涉及将现有解决方案调整为新的编码问题，或使用以前法律案件的文档对新问题进行推断。

研究人员写道：“解答隐藏的合理查询……需要复杂的分析技术来解码和利用隐藏在不同数据源中的潜在智慧。”

隐藏理由查询的挑战包括检索与查询在逻辑上或主题上相关的信息，即使它在语义上并不相似。此外，回答查询所需的知识通常需要从多个来源整合。

一些方法利用LLM 的情境学习能力来教学生如何从多个来源选择和提取相关信息并形成逻辑原理。其他方法则侧重于为少量和多次提示生成逻辑原理示例。

然而，有效解决隐藏理由查询通常需要某种形式的微调，尤其是在复杂领域。这种微调通常是针对特定领域的，涉及使用示例训练 LLM，使其能够推理查询并确定需要哪种外部信息。

对构建 LLM 申请的意义

微软研究团队编制的调查和框架显示了 LLM 在将外部数据用于实际应用方面取得了多大的进展。然而，这也提醒我们，还有许多挑战尚未解决。企业可以使用此框架做出更明智的决策，确定将外部知识集成到其 LLM 中的最佳技术。

RAG 技术可以在很大程度上克服原始 LLM 的许多缺点。但是，开发人员还必须意识到他们所用技术的局限性，并知道何时升级到更复杂的系统或避免使用 LLM。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/wei-ruan-yan-jiu-ren-yuan-ti-chu-le-gou-jian-shu-ju-zeng

Like (0)

王浩然作者

0 0

加州否决人工智能法案可能会让规模较小的开发者和模型“蓬勃发展”

Previous 2024年10月3日上午11:00

麻省理工学院衍生公司 Liquid 首次推出非变压器 AI 模型，它们已经是最先进的

Next 2024年10月3日下午1:00

AI前沿

大地测量局：探索人工智能在地理空间技术中的作用和道德考量

随着我们即将迎来充满潜力的新年，技术领域，尤其是人工智能 (AI) 和机器学习 (ML)，即将迎来重大变革。英国国家测绘机构 Ordnance Survey (OS) 的首席技术官…

王浩然
2024年12月24日
000
AI前沿

人工智能建筑安全风险平台正式上线

Highwire 工具分析安全文档以帮助管理承包商风险

点点
2024年9月5日
000
AI前沿

Nvidia 赢得关键设计大奖，将 AI 引入自动驾驶汽车车队

Nvidia宣布已赢得丰田、Aurora 和大陆等汽车制造商的自动驾驶汽车关键设计订单。这些合作伙伴是 Nvidia 不断增长的合作伙伴名单的一部分，他们正在推出下一代高度自动化…

王浩然
2025年1月8日
000
AI前沿

DeepMind 的 Genie 2 可以生成类似视频游戏的交互式世界

谷歌的人工智能研究机构 DeepMind 推出了一个可以生成“无限”可玩 3D 世界的模型。该模型名为 Genie 2，是今年早些时候发布的 DeepMind Genie 的继任…

王浩然
2024年12月5日
000
AI前沿

上海杀出超级独角兽公司，一次融了5个亿

又一个师生联手创业的案例。

点点
2024年9月3日
000
AI前沿

谷歌Gemini新功能：现在可通过视频或屏幕内容提问‌

在不断创新与进步的科技浪潮中，谷歌再次引领潮流，为其Gemini搜索平台带来了革命性的新功能。近日，谷歌宣布Gemini已支持用户通过上传视频或利用屏幕截图中的内容来提问，这一变革…

王浩然
2025年3月4日
000
AI前沿

Jony Ive 证实他正在与 OpenAI 合作开发一款新设备

/《纽约时报》在一篇重要人物特写报道中证实了艾维离开苹果后的动向。乔尼·艾维已确认他正在与 OpenAI 首席执行官山姆·奥特曼合作开发一个人工智能硬件项目。这一确认是今天《纽约…

王浩然
2024年9月24日
000
AI前沿

超越炒作：揭秘生成式人工智能在药物研发中的真正影响

自从Insilico Medicine利用生成式 AI 开发出一种治疗特发性肺纤维化 (IPF) 的药物以来，人们对这项技术如何改变药物研发的兴趣与日俱增。传统方法缓慢而昂贵，因此…

王浩然
2024年9月24日
000
AI前沿

Halliday获2000万美元A轮融资，致力于开发可在区块链上安全运行的AI代理

融资概况‌ Halliday公司近日宣布成功获得2000万美元的A轮融资，本轮融资由Andreessen Horowitz的加密部门（a16z crypto）领投，使得公司的总融资…

王浩然
2025年3月20日
000
AI前沿

伊隆马斯克的 X 正在改变其隐私政策，允许第三方在你的帖子上训练人工智能

周三，社交网络 X（前身为 Twitter）更新了其隐私政策，表明它将允许第三方“合作者”使用 X 数据训练他们的 AI 模型，除非用户选择退出。虽然 X 所有者埃隆·马斯克使用 …

点点
2024年10月18日
000
AI前沿

据报道，TikTok 的研究承认其对青少年产生了负面影响

据美国国家公共广播电台和肯塔基公共广播电台报道，法庭文件表明，TikTok 高管意识到该应用对青少年的潜在危害。本周早些时候， 14 名美国总检察长起诉 TikTok ，声称该应…

点点
2024年10月13日
000
AI前沿

Genies发布用户生成内容工具，让任何人都能创建自定义AI头像

Genies，这家专注于文化元素的头像技术公司，最近揭示了其用户生成内容（UGC）工具，该工具允许任何人创建自定义的AI头像。这一举措标志着Genies在构建其所谓的“Partie…

王浩然
5天前
000
AI前沿

Axis Security 如何使用 Xpander.AI 的代理平台来增强客户支持票务管理

自去年年底以来，“Agentic AI”或 AI 代理一直是企业界热议的话题。但这个想法——使用大型语言模型 (LLM) 来支持离散操作和集中工作流——在实际部署到生产中时究竟是什…

王浩然
2025年1月22日
000
AI前沿

Claude：你需要了解的有关 Anthropic 人工智能的一切

Anthropic 是规模仅次于 OpenAI 的第二大 AI 供应商，它拥有一个名为 Claude 的强大生成式 AI 模型系列。这些模型可以执行一系列任务，从为图片添加字幕、撰…

王浩然
2024年10月20日
000
AI前沿

Crogl携3000万美元资金，推出面向安全分析师的AI版“钢铁侠”战衣‌

近日，Crogl公司凭借其获得的3000万美元资金支持，正式揭晓了一款专为安全分析师打造的全新AI辅助系统，形象地被称为“AI版钢铁侠战衣”。这款创新产品的推出，标志着Crogl在…

王浩然
2025年3月7日
000
AI前沿

人工智能深度伪造如何威胁选举公正性——以及如何应对

竞选广告已经变得有点混乱和有争议。现在想象一下，你被一则竞选广告所吸引，其中一位候选人表达了强有力的立场，影响了你的投票——而这则广告甚至不是真的。这是一个深度伪造的广告。这不…

点点
2024年10月21日
000
AI前沿

【2024 CX报告】AI成客户体验王牌，成本却让人意外！

一份新报告显示，尽管企业将生成式人工智能(GenAI) 视为改变客户体验 (CX) 的关键因素，但许多企业仍为实施成本而苦恼。该研究结果来自 CallMiner 的《2024 年客…

点点
2024年9月11日
000
AI前沿

Jony Ive 正在与 OpenAI 合作创办一家 AI 设备初创公司

五年前离开苹果全职职位的传奇设计师乔纳森·艾维 (Jony Ive)正在与 OpenAI 及其首席执行官萨姆·奥特曼 (Sam Altman) 合作创办一家新的创业公司。此次合作…

点点
2024年9月23日
000
AI前沿

人工智能先驱李飞飞表示，人工智能政策必须以“科学而非科幻小说”为基础

斯坦福大学计算机科学家兼初创公司创始人李飞飞，有时被称为“人工智能教母”，她在下周于巴黎举行的人工智能行动峰会之前概述了“未来人工智能政策制定的三大基本原则”。首先，李飞飞表示，…

王浩然
2025年2月10日
000
AI前沿

Gartner：2025 年十大战略技术趋势

本周，在奥兰多举行的年度 IT 研讨会/Xpo 上，Gartner 公布了 2025 年十大战略技术趋势，人工智能、物联网技术和量子计算的进步均榜上有名。该活动在天鹅…

点点
2024年10月22日
000