Meta 提出新的可扩展记忆层，可提高知识水平并减少幻觉

王浩然 • 2025年1月8日上午11:00 • AI前沿 • 75 views

随着企业继续在各种应用中采用大型语言模型 (LLM)，他们面临的关键挑战之一是提高模型的事实知识并减少幻觉。在一篇新论文中，Meta AI的研究人员提出了“可扩展的内存层”，这可能是解决此问题的几种可能解决方案之一。

可扩展内存层为 LLM 添加更多参数，以增加其学习能力，而无需额外的计算资源。该架构适用于可以为事实知识留出额外内存但又希望获得更灵活模型的推理速度的应用程序。

密集层和记忆层

传统语言模型使用“密集层”将大量信息编码到其参数中。在密集层中，所有参数都得到充分利用，并且在推理过程中大部分同时激活。密集层可以学习复杂的函数，而增加这些函数需要额外的计算和能源资源。

相比之下，对于简单的事实知识，具有联想记忆架构的更简单的层将更高效且更易于解释。这就是记忆层的作用。它们使用简单的稀疏激活和键值查找机制来编码和检索知识。稀疏层比密集层占用更多内存，但一次只使用一小部分参数，这使得它们的计算效率更高。

内存层已存在多年，但在现代深度学习架构中很少使用。它们并未针对当前的硬件加速器进行优化。

当前前沿的 LLM 通常使用某种形式的“专家混合”（MoE）架构，该架构使用一种与记忆层略微相似的机制。MoE 模型由许多专门从事特定任务的较小专家组件组成。在推理时，路由机制根据输入序列确定哪个专家被激活。PEER是Google DeepMind 最近开发的一种架构，它将 MoE 扩展到数百万位专家，从而对推理过程中被激活的参数提供更精细的控制。

升级内存层

内存层计算量小但内存量大，这对当前的硬件和软件框架提出了特定挑战。Meta 研究人员在论文中提出了几项修改方案，以解决这些挑战并使其能够大规模使用。

首先，研究人员将内存层配置为并行化，将它们分布在多个 GPU 上，以存储数百万个键值对，而无需更改模型中的其他层。他们还实现了一个特殊的 CUDA 内核来处理高内存带宽操作。此外，他们开发了一种参数共享机制，支持模型中多个内存层之间的一组内存参数。这意味着用于查找的键和值是跨层共享的。

这些修改使得在 LLM 中实现内存层成为可能，而不会减慢模型速度。

研究人员写道：“具有稀疏激活的记忆层很好地补充了密集网络，在计算量较少的情况下提高了知识获取能力。它们可以高效扩展，并为从业者提供了一个有吸引力的新方向，即在内存和计算之间进行权衡。”

Meta 的内存层实际作用

为了测试记忆层，研究人员修改了Llama 模型，用共享记忆层替换了一个或多个密集层。他们在多项任务上比较了记忆增强模型与密集 LLM 以及 MoE 和 PEER 模型，包括事实问题回答、科学和常识世界知识以及编码。

他们的发现表明，记忆模型在密集基线上有显著改进，可以与使用 2 至 4 倍计算量的模型相媲美。它们的性能也与具有相同计算预算和参数数量的 MoE 模型相当。该模型的性能在需要事实知识的任务上尤其突出。例如，在事实问答方面，具有 13 亿个参数的记忆模型的性能接近 Llama-2-7B，后者的训练令牌数量是 Llama-2-7B 的两倍，计算量是 Llama-2-7B 的 10 倍。

此外，研究人员发现，当实验从 1.34 亿个参数扩大到 80 亿个参数时，记忆模型的优势与模型大小保持一致。

“鉴于这些发现，我们强烈主张将记忆层集成到所有下一代人工智能架构中，”研究人员写道，同时补充说还有很大的改进空间。“特别是，我们希望能够开发新的学习方法，进一步提高这些层的有效性，减少遗忘、减少幻觉，并实现持续学习。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/meta-ti-chu-xin-de-ke-kuo-zhan-ji-yi-ceng-ke-ti-gao-zhi-shi

Like (0)

王浩然作者

0 0

高通推出用于个人电脑、汽车、智能家居和企业的人工智能芯片

Previous 2025年1月7日

Nvidia 的 AI 代理游戏现已推出新模型和编排蓝图

Next 2025年1月8日

AI前沿

OpenAI 的红队创新为 AI 时代的安全领导者定义了新的要素

OpenAI 在红队演练方面采取了比其 AI 竞争对手更积极的态度，展示了其安全团队在两个领域的先进能力：多步强化和外部红队演练。OpenAI 最近发布了两篇论文，为在这两种技术及…

王浩然
2025年1月7日
000
AI前沿

人工智能公司将实现工业车辆自动化

一个新名字——SteerAI——通过中东出现在自动驾驶汽车领域。该项目由阿联酋阿布扎比政府下属先进技术研究委员会的商业化部门 VentureOne 推出。据 VentureOn…

王浩然
2024年11月9日
000
AI前沿

人工智能人形机器人原型推出，供家庭使用

Neo Beta 助力该公司的人形机器人从概念化走向开发

点点
2024年9月5日
000
AI前沿

Salesforce豪掷10亿美元投资新加坡，力推AI技术普及‌

在科技日新月异的今天，人工智能（AI）已经成为推动各行各业发展的重要力量。近日，全球领先的客户关系管理软件提供商Salesforce宣布了一项重大投资决策——将在新加坡投入高达10…

王浩然
2025年3月13日
000
AI前沿

模型太多，混乱不堪：OpenAI 承诺简化其产品线

OpenAI 计划“简化”其模型产品，即使它准备发布其最后一个非推理模型 GPT-4.5。对于一家科技公司来说，这是罕见的承认，其产品发布对客户来说没有足够的差异化。 OpenAI…

王浩然
2025年2月13日
000
AI前沿

随着行业升温，Perplexity AI 估值逼近 80 亿美元

据报道， Perplexity AI正在商讨获得约 5 亿美元的新融资，这是人工智能技术爆炸式增长的重要进展。这轮潜在投资可能会使这家人工智能搜索公司的估值飙升至 80 亿美元，较…

点点
2024年10月22日
000
AI前沿

微软的新 AI 代理支持 1,800 种模型（并且还在不断增加）

人工智能代理是目前企业热议的话题。但是，企业领导者希望了解切实的成果和相关用例（而不是未来主义的、尚未实现的场景），并且需要易于部署和使用的工具，此外，还要支持他们首选的模型。 …

王浩然
2024年11月21日
000
AI前沿

在索尼的PlayStation State of Play中宣布的一切

在今晚的PlayStation State of Play中，我们得到了一些关于PS5在不久的将来等待我们的见解。这包括查看即将发布的标题和已发布标题的更新。这是惊喜的混合体——比…

点点
2024年9月26日
000
AI前沿

次二次系统：加速人工智能的效率和可持续性

人工智能 (AI)正在以惊人的速度改变着我们的世界，影响着医疗、金融和零售等行业。从在线推荐产品到诊断医疗状况，AI 无处不在。然而，效率问题日益严重，研究人员和开发人员正在努力解…

点点
2024年10月23日
000
AI前沿

谷歌为Colab升级AI代理工具，提升用户研究与开发效率‌

近日，谷歌宣布对其广受欢迎的Colab平台进行了重要升级，引入了一款创新的AI代理工具。这一举措旨在进一步提升用户在Colab上进行机器学习研究与开发的效率与体验。 Colab，作…

王浩然
2025年3月4日
000
AI前沿

AI图像生成新纪元：迎接Reve Image 1.0的到来

在人工智能领域，图像生成技术一直是一个令人兴奋且充满挑战的研究方向。随着技术的不断进步，我们见证了从模糊到清晰、从简单到复杂的图像生成过程的演变。如今，一款名为Reve Image…

王浩然
2025年3月28日
000
AI前沿

引导人工智能投资：平衡创新与可持续性的 5 种策略

随着人工智能领域的快速发展，企业和技术领导者在平衡当前人工智能投资与长期可持续发展目标方面面临着越来越大的挑战。在急于采用人工智能的过程中，许多企业忽视了这种平衡，优先考虑短期收益…

点点
2024年10月5日
000
AI前沿

美国版权局称，人工智能生成的内容可受版权保护——只要人类参与或编辑

美国版权局负责管理政府对电影、电视节目、小说、艺术、音乐甚至软件等人类创作的作品的版权保护，该局在今天发布的重要且有用的更新中澄清说，某些形式的人工智能生成内容实际上可以获得版权保…

王浩然
2025年2月4日
000
AI前沿

Cohere 让企业能够更轻松地创建自己的 AI 语言模型

人工智能公司Cohere周四公布了其微调服务的重大更新，旨在加速企业采用大型语言模型。这些增强功能支持 Cohere 最新的Command R 08-2024 模型，并为企业提供更…

王浩然
2024年10月6日
000
AI前沿

Runware 使用定制硬件和高级编排实现快速 AI 推理

有时，演示就是您了解产品所需的全部内容。Runware 就是这种情况。如果您访问Runware 的网站，输入提示并按 Enter 生成图像，您会惊讶于 Runware 为您生成图像…

王浩然
2024年10月2日
000
AI前沿

亚马逊首席执行官安迪·贾西暗示将推出“代理” Alexa

亚马逊首席执行官安迪·贾西 (Andy Jassy) 周四暗示，该公司的 Alexa 助手将推出改进的“代理”版本，可以代表用户采取行动。 “我认为下一代的这些助手和生成式人工智能…

王浩然
2024年11月2日
000
AI前沿

【划重点】数字人类对话，让员工培训逼真又高效！

员工培训对于适应职位和吸收公司文化至关重要；同样，它还能让人们学习新技能并在专业上成长。然而，当“员工培训”电子邮件出现在收件箱中时，为新公司工作或晋升到新职位的兴奋感就会消失殆尽…

点点
2024年9月11日
000
AI前沿

增强开源 AI 并改善数据治理

在欧洲人工智能与大数据博览会召开之前，AI News 采访了Databricks高级解决方案架构师 Ivo Everts ，讨论了影响开源人工智能和数据治理未来的几个关键发展。 D…

点点
2024年9月28日
000
AI前沿

Claude：你需要了解的有关 Anthropic 人工智能的一切

Anthropic 是规模仅次于 OpenAI 的第二大 AI 供应商，它拥有一个名为 Claude 的强大生成式 AI 模型系列。这些模型可以执行一系列任务，从为图片添加字幕、撰…

王浩然
2024年10月20日
000
AI前沿

Qodo 的完全自主代理解决了回归测试的复杂性

在软件开发过程中，代码不断演变，需要不断测试其质量和可维护性。这是回归测试的根源，在回归测试中，现有测试会重新运行，以确保修改后的代码继续按预期运行。然而，回归测试可能非常耗时且…

王浩然
2024年12月5日
000