利用 RAG 弥补人工智能领域的知识空白：提高性能的技术和策略

点点 • 2024年10月17日下午7:00 • AI前沿 • 108 views

人工智能 (AI)彻底改变了我们与技术的互动方式，催生了虚拟助手、聊天机器人和其他能够处理复杂任务的自动化系统。尽管取得了这些进展，但即使是最先进的人工智能系统也面临着重大限制，即知识差距。例如，当人们向虚拟助手询问最新的政府政策或全球事件的状态时，它可能会提供过时或不正确的信息。

出现此问题的原因是，大多数 AI 系统都依赖于预先存在的静态知识，而这些知识并不总是反映最新发展。为了解决这个问题，检索增强生成 (RAG)提供了一种更好的方法来提供最新且准确的信息。RAG 不再仅仅依赖于预先训练的数据，而是允许 AI 主动检索实时信息。这在医疗保健、金融和客户支持等快速发展的领域尤为重要，在这些领域，跟上最新发展不仅有帮助，而且对于获得准确的结果至关重要。

了解人工智能中的知识差距

当前的人工智能模型面临着几个重大挑战。其中一个主要问题是信息幻觉。当人工智能自信地生成错误或虚构的响应时，尤其是在缺乏必要数据的情况下，就会发生这种情况。传统的人工智能模型依赖于静态训练数据，而这些数据很快就会过时。

另一个重大挑战是灾难性遗忘。当更新新信息时，AI模型可能会丢失以前学到的知识。这使得AI很难在信息频繁变化的领域保持最新状态。此外，许多AI系统难以处理长篇大论的内容。虽然它们擅长总结短文或回答特定问题，但它们在需要深入了解的情况下往往失败，例如技术支持或法律分析。

这些限制降低了 AI 在实际应用中的可靠性。例如，AI 系统可能会建议过时的医疗治疗方法或错过关键的金融市场变化，从而导致错误的投资建议。填补这些知识空白至关重要，而这正是 RAG 可以发挥作用的地方。

什么是检索增强生成 (RAG)？

RAG 是一种创新技术，结合了两个关键组件，即检索器和生成器，从而创建了一个能够提供更准确、更及时的响应的动态 AI 模型。当用户提出问题时，检索器会搜索外部来源（如数据库、在线内容或内部文档）以查找相关信息。这与仅依赖预先存在的数据的静态 AI 模型不同，因为 RAG 会根据需要主动检索最新信息。检索到相关信息后，会将其传递给生成器，生成器会使用此上下文生成连贯的响应。这种集成使模型能够将其预先存在的知识与实时数据相结合，从而产生更准确、更相关的输出。

这种混合方法降低了生成不正确或过时响应的可能性，并最大限度地减少了对静态数据的依赖。RAG 具有灵活性和适应性，可为各种应用（尤其是需要最新信息的应用）提供更有效的解决方案。

RAG 实施技术和策略

成功实施 RAG 涉及多种旨在最大限度提高其性能的策略。下面简要讨论了一些基本技术和策略：

1. 知识图谱检索增强生成（KG-RAG）

KG-RAG将结构化知识图谱整合到检索过程中，映射实体之间的关系，为理解复杂查询提供更丰富的背景。这种方法在医疗保健领域尤其有价值，因为信息的特异性和相互关联性对于准确性至关重要。

2. 分块

分块是指将大篇幅的文本分解成更小、更易于管理的单元，让检索器专注于提取最相关的信息。例如，在处理科学研究论文时，分块使系统能够提取特定部分，而不是处理整个文档，从而加快检索速度并提高响应的相关性。

3. 重新排名

重新排序根据检索到的信息的相关性对其进行优先排序。检索器首先收集潜在文档或段落的列表。然后，重新排序模型对这些项目进行评分，以确保在生成过程中使用最符合上下文的信息。这种方法在客户支持中非常有用，因为准确性对于解决特定问题至关重要。

4.查询转换

查询转换通过添加同义词和相关术语或重新表述查询以匹配知识库的结构来修改用户的查询，以提高检索准确性。在技术支持或法律咨询等领域，用户查询可能含糊不清或措辞各异，查询转换可显著提高检索性能。

5. 整合结构化数据

使用结构化和非结构化数据源（例如数据库和知识图谱）可以提高检索质量。例如，AI 系统可能会使用结构化市场数据和非结构化新闻文章来提供更全面的金融概览。

6. 探索链（CoE）

CoE通过探索知识图谱来指导检索过程，发现单次检索可能遗漏的更深层次、上下文相关的信息。这种技术在科学研究中特别有效，因为探索相互关联的主题对于生成明智的回应至关重要。

7.知识更新机制

集成实时数据馈送可让 RAG 模型保持最新状态，包括新闻或研究结果等实时更新，而无需频繁重新训练。增量学习使这些模型能够不断适应和学习新信息，从而提高响应质量。

8.反馈循环

反馈循环对于改进 RAG 的性能至关重要。人工审阅者可以纠正 AI 的回答并将这些信息输入模型，以增强未来的检索和生成。检索数据的评分系统可确保仅使用最相关的信息，从而提高准确性。

采用这些技术和策略可以显著提高 RAG 模型的性能，在各种应用程序中提供更准确、相关和最新的响应。

使用 RAG 的组织的真实示例

许多公司和初创公司积极使用 RAG，通过最新的相关信息来增强其 AI 模型。例如，总部位于硅谷的初创公司Contextual AI开发了一个名为 RAG 2.0 的平台，该平台显著提高了 AI 模型的准确性和性能。通过将检索器架构与大型语言模型 (LLM) 紧密结合，他们的系统减少了错误并提供更精确和最新的响应。该公司还优化了其平台以在较小的基础设施上运行，使其适用于金融、制造业、医疗设备和机器人等不同行业。

同样，F5 和 NetApp等公司也使用 RAG 帮助企业将 ChatGPT 等预训练模型与其专有数据相结合。通过这种集成，企业可以获得根据其特定需求量身定制的准确、情境感知的响应，而无需从头开始构建或微调 LLM 的高成本。这种方法对于需要高效从内部数据中提取见解的公司尤其有益。

Hugging Face 还提供了 RAG 模型，该模型将密集段落检索 (DPR)与序列到序列 (seq2seq) 技术相结合，以增强特定任务的数据检索和文本生成。此设置允许对 RAG 模型进行微调，以更好地满足各种应用需求，例如自然语言处理和开放域问答。

RAG 的道德考量和未来

虽然 RAG 具有诸多优势，但也引发了道德问题。主要问题之一是偏见和公平性。用于检索的来源可能存在固有偏见，这可能导致 AI 响应出现偏差。为了确保公平，必须使用多样化的来源并采用偏见检测算法。还存在滥用的风险，RAG 可能被用于传播错误信息或检索敏感数据。它必须通过实施道德准则和安全措施（例如访问控制和数据加密）来保护其应用程序。

RAG 技术不断发展，研究重点是改进神经检索方法和探索结合多种方法的混合模型。将文本、图像和音频等多模态数据集成到 RAG 系统中也具有潜力，这为医疗诊断和多媒体内容生成等领域的应用开辟了新的可能性。此外，RAG 可以发展到包括个人知识库，让 AI 能够根据个人用户提供量身定制的响应。这将增强医疗保健和客户支持等领域的用户体验。

底线

总之，RAG 是一个强大的工具，它通过主动检索实时信息并提供更准确、更符合上下文的响应来解决传统 AI 模型的局限性。其灵活的方法与知识图谱、分块和查询转换等技术相结合，使其在医疗保健、金融和客户支持等各个行业中都非常有效。

然而，实施 RAG 需要仔细考虑道德问题，包括偏见和数据安全。随着技术的不断发展，RAG 有潜力创建更加个性化和可靠的人工智能系统，最终改变我们在快速变化、信息驱动的环境中使用人工智能的方式。

原创文章，作者：点点，如若转载，请注明出处：https://www.dian8dian.com/li-yong-rag-mi-bu-ren-gong-zhi-neng-ling-yu-de-zhi-shi-kong

AI LLM RAG 人工智能大型语言模型知识图谱聊天机器人自然语言处理虚拟助手

Like (0)

点点

0 0

利用人工智能彻底改变客户关系：Krishna Raj Raja 的《支持体验》一书中的重要经验教训

Previous 2024年10月17日

Emily Popson，CallRail 增长营销副总裁 – 访谈系列

Next 2024年10月17日

AI前沿

自调用代码基准可帮助您决定使用哪些 LLM 来完成编程任务

随着大型语言模型 (LLM) 在编码方面的不断改进，用于评估其性能的基准变得越来越不实用。这是因为，尽管许多 LLM 在这些基准上获得了类似的高分，但了解在特定的软件开发项目和企…

王浩然
2025年1月11日
000
AI前沿

Synex 创始人曾因一块 80 磅重的磁铁在边境被扣留，他正在制造便携式 MRI 来测试血糖

2019 年，Synex Medical创始人本·纳什曼 (Ben Nashman) 被美国海关扣留了一夜。纳什曼试图解释，他只是将材料从布法罗运到多伦多，用于自制 MRI。然而，…

点点
2024年9月23日
000
AI前沿

开放权重模型的兴起：阿里巴巴的 Qwen2 如何重新定义 AI 能力

人工智能 (AI)已经从早期基于基本规则的系统和简单的机器学习算法发展到如今的水平。如今，世界正在进入人工智能的新时代，而推动这一时代发展的是开放权重模型这一革命性概念。与具有固定…

点点
2024年10月11日
000
AI前沿

Augment Code发布AI编程助手Augment Agent，以70%胜率超越GitHub Copilot并刷新SWE-bench纪录‌

在人工智能（AI）技术持续推动各行各业变革的背景下，AI编程助手正逐渐成为软件开发领域的重要辅助工具。近期，Augment Code公司正式推出了其创新性的AI编程助手——Augm…

王浩然
2天前
000
AI前沿

Microsoft Copilot 现在可以读取你的屏幕、深入思考并大声向你说话

在宣布对其由 AI 驱动的产品企业套件Copilot进行一系列更新一周后，微软在 Windows 上为所有用户推出了新的 Copilot 功能，其中包括一个可以理解并回答屏幕内容问…

王浩然
2024年10月2日
000
AI前沿

2025 年值得关注的数据中心监管趋势

全球各地的政府机构都在制定法规，以提高数据中心的可持续性和弹性。这反过来又迫使数据中心运营商实施新的流程和程序来满足新的要求。欧盟修订的《能源效率指令》（EED）旨在减少能源…

王浩然
2024年12月7日
000
AI前沿

Nvidia 在卡内基梅隆大学成立人工智能、机器人技术社区

该计划旨在加强具有人工智能技术转型潜力的社区之间的公私合作伙伴关系

点点
2024年10月22日
000
AI前沿

突破数据瓶颈：Salesforce 的 ProVision 利用图像场景图加速多模式 AI 训练

随着世界各地的企业加倍投入 AI 项目，高质量训练数据的可用性已成为一个主要瓶颈。虽然公共网络作为数据源已基本耗尽，但 OpenAI 和 Google 等主要参与者正在确保独家合作…

王浩然
2025年1月11日
000
AI前沿

Meta 的 AI 负责人表示，世界模型是实现“人类水平的 AI”的关键，但可能还需要 10 年时间

当今的人工智能模型真的能像人脑一样记忆、思考、规划和推理吗？一些人工智能实验室会让你相信它们是的，但根据 Meta 首席人工智能科学家 Yann LeCun 的说法，答案是否定的。…

点点
2024年10月19日
000
AI前沿

Okta 的失败对 2025 年身份安全的未来有何启示

2025 年需要成为身份提供者全力改善软件质量和安全各个方面的一年，包括红队，同时使他们的应用程序更加透明，并获得超越标准的结果的客观性。 Anthropic、OpenAI和其他…

王浩然
2024年11月17日
000
AI前沿

Alexa新技能：阅读、总结与回顾长篇文档‌

亚马逊的智能助手Alexa近日解锁了一项全新技能——能够阅读、总结并回顾长篇文档。这一功能为处理大量文字信息的用户提供了极大的便利。 ‌一、阅读功能‌ Alexa现在能够流畅地阅读…

王浩然
2025年2月28日
000
AI前沿

小型 AI 模型需求激增，阿联酋猎鹰 3 号向开源领导者发起挑战

阿联酋政府支持的技术创新研究所(TII) 宣布推出 Falcon 3，这是一系列开源小型语言模型 (SLM)，旨在在轻量级、基于单 GPU 的基础设施上高效运行。 Falcon 3…

王浩然
2024年12月18日
000
AI前沿

IMAX 利用 AI 扩大原创内容覆盖范围

随着全球内容消费量不断增长，对非英语内容的需求超过对英语电影和节目的需求，IMAX 正在利用人工智能来扩大其原创内容的本地化。根据普华永道的报告，娱乐和媒体行业在 2023 年将…

王浩然
2024年11月29日
000
AI前沿

OpenAI已开始组建其机器人团队

OpenAI 以其人工智能模型而闻名，迄今为止，这些模型主要存在于云服务器、其网站以及适用于 PC 和移动设备的应用程序中。不过，该公司的雄心并不局限于软件领域：今天在 X 上，…

王浩然
2025年1月11日
000
AI前沿

ChatGPT并非唯一用户量激增的聊天机器人‌

在科技日新月异的今天，人工智能（AI）的应用场景正以惊人的速度扩展。聊天机器人，作为AI技术的重要分支，正逐渐成为我们日常生活中不可或缺的一部分。提到聊天机器人，ChatGPT无疑…

王浩然
4天前
000
AI前沿

2025年iPhone上最佳的5款传真应用：轻松从移动设备发送文档

在数字化时代，尽管电子邮件和其他在线文件传输方式日益普及，但传真作为一种传统的通信手段，仍然在许多行业和场景中发挥着重要作用。为了满足用户在移动设备上发送传真的需求，市场上涌现了一…

王浩然
2025年3月16日
000
AI前沿

人工智能真的能与人类数据科学家竞争吗？OpenAI的新基准对它进行了测试

OpenAI推出了一种测量机器学习工程中人工智能能力的新工具。这个被称为MLE-bench的基准，通过来自机器学习竞赛的流行平台Kaggle的75场真实世界数据科学比赛来挑战人工智…

点点
2024年10月14日
000
AI前沿

微软研究人员提出了构建数据增强型 LLM 应用程序的框架

利用训练数据以外的知识来增强大型语言模型 (LLM) 是一个重要领域，尤其是对于企业应用而言。将特定领域和客户知识融入 LLM 的最著名方法是使用检索增强生成(RAG)。然而，在许…

王浩然
2024年10月3日
000
AI前沿

Meta 不愿透露是否利用智能眼镜拍摄的照片来训练 AI

Meta 的 AI 驱动雷朋眼镜正面有一个隐蔽的摄像头，不仅会在你要求时拍照，还会在 AI 功能触发某些关键词（例如“看”）时拍照。这意味着这款智能眼镜会收集大量照片，包括有意拍摄…

点点
2024年10月2日
000
AI前沿

iPhone 16 今日发布，但并未配备最受关注的功能：Apple Intelligence

iPhone 16将于本周五正式发售。但对于最早的采用者来说，这款手机在发售时就已经做出了根本性的妥协。简而言之，这不是他们承诺的 iPhone 16。苹果首席执行官蒂姆·库克表…

王浩然
2024年9月21日
000