Meta 的最新研究如何证明可以使用生成式人工智能来理解用户意图

王浩然 • 2025年1月4日下午2:00 • AI前沿 • 71 views

Meta ——Facebook、Instagram、WhatsApp、Threads 等的母公司——运行着世界上最大的推荐系统之一。

在最近发布的两篇论文中，研究人员揭示了如何使用生成模型来更好地理解和响应用户意图。

通过将推荐视为生成性问题，您可以采用新方法来解决它，这些方法比传统方法内容更丰富、效率更高。对于任何需要检索文档、产品或其他类型对象的应用程序来说，这种方法都具有重要用途。

密集检索与生成检索

创建推荐系统的标准方法是计算、存储和检索文档的密集表示。例如，为了向用户推荐商品，应用程序必须训练一个模型，该模型可以计算用户请求的嵌入和大量商品的嵌入。

在推理时，推荐系统会尝试通过查找一个或多个嵌入与用户相似的商品来了解用户的意图。随着商品数量的增加，这种方法需要的存储量和计算能力也会随之增加，因为必须存储每个商品嵌入，并且每个推荐操作都需要将用户嵌入与整个商品库进行比较。

生成检索是一种较新的方法，它试图理解用户意图并提出建议，不是通过搜索数据库，而是通过简单地预测它所知道的用户交互序列中的下一个项目。

工作原理如下：

生成检索的关键在于计算包含每个项目的上下文信息的“语义 ID”(SID)。像TIGER这样的生成检索系统分为两个阶段。首先，训练编码器模型，根据每个项目的描述和属性为其创建唯一的嵌入值。这些嵌入值将成为 SID，并与项目一起存储。

在第二阶段，训练一个转换器模型来预测输入序列中的下一个 SID。输入 SID 列表表示用户与过去项目的交互，而模型的预测则是要推荐的项目的 SID。生成式检索减少了跨单个项目嵌入存储和搜索的需求。因此，随着项目列表的增长，其推理和存储成本保持不变。它还增强了捕获数据中更深层次语义关系的能力，并提供了生成式模型的其他好处，例如修改温度以调整推荐的多样性。

高级生成检索

尽管生成式检索的存储和推理成本较低，但它也存在一些局限性。例如，它倾向于对训练期间见过的商品进行过度拟合，这意味着它很难处理在模型训练后添加到目录中的商品。在推荐系统中，这通常被称为“冷启动问题”，它涉及新用户和没有交互历史的商品。

为了解决这些缺点，Meta 开发了一种名为LIGER的混合推荐系统，它将生成检索的计算和存储效率与密集检索的强大嵌入质量和排名功能相结合。

在训练过程中，LIGER 使用相似度得分和下一个标记目标来改进模型的推荐。在推理过程中，LIGER 根据生成机制选择几个候选词，并为其补充一些冷启动项，然后根据生成的候选词的嵌入对其进行排序。

研究人员指出，“密集检索方法和生成检索方法的融合对于推进推荐系统具有巨大的潜力”，并且随着模型的发展，“它们将在现实世界的应用中变得越来越实用，从而实现更加个性化和响应迅速的用户体验”。

在另一篇论文中，研究人员介绍了一种名为“多模态偏好辨别器”（Mender）的新型多模态生成检索方法，该技术可使生成模型从用户与不同项目的交互中获取隐含偏好。Mender 建立在基于 SID 的生成检索方法之上，并添加了一些可以根据用户偏好丰富推荐的组件。

Mender 使用大型语言模型 (LLM) 将用户交互转化为具体的偏好。例如，如果用户在评论中赞扬或抱怨了某个特定商品，该模型会将其总结为对该产品类别的偏好。

主推荐模型经过训练，在预测输入序列中的下一个语义 ID 时，既要考虑用户交互序列，又要考虑用户偏好。这使推荐模型能够泛化和执行情境学习，并适应用户偏好，而无需对其进行明确训练。

研究人员写道：“我们的贡献为新一类生成检索模型铺平了道路，该模型能够利用有机数据通过文本用户偏好进行指导推荐。”

对企业应用程序的影响

生成检索系统提供的效率对企业应用具有重要意义。这些进步可以转化为直接的实际利益，包括降低基础设施成本和加快推理速度。无论目录大小如何，该技术都能保持恒定的存储和推理成本，这对于成长型企业来说尤其有价值。

其优势遍及各个行业，从电子商务到企业搜索。生成检索仍处于早期阶段，我们可以期待随着其成熟，应用程序和框架将会出现。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/meta-de-zui-xin-yan-jiu-ru-he-zheng-ming-ke-yi-shi-yong

Like (0)

王浩然作者

0 0

如何将 OpenAI 的 ChatGPT 高级语音模式映射到 iPhone 操作按钮

Previous 2025年1月4日

CES 2025：机器人、人工智能、自动驾驶和智能物联的展望

Next 2025年1月4日

AI前沿

为什么生成视频系统不能制作完整的电影？

生成式人工智能视频的出现和进步促使许多普通观察者预测，机器学习将导致我们所知的电影业的消亡——相反，单个创作者将能够在家里通过本地或基于云端的 GPU 系统创作好莱坞风格的大片。 …

王浩然
2024年9月24日
000
AI前沿

2025 年的身份管理：安全团队可通过 4 种方式解决漏洞和风险

虽然99%的企业计划在安全方面投入更多，但只有52% 的企业完全实施了多因素身份验证 (MFA)，只有41% 的企业在访问管理中遵守最小特权原则。包括民族国家、国家资助的攻击者和…

王浩然
2024年11月11日
000
AI前沿

Turnitin 首席产品官 Annie Chechitelli – 访谈系列

Annie Chechitelli是 Turnitin 的首席产品官，负责监督 Turnitin 应用程序套件，包括学术诚信、评分和反馈以及评估功能。 Turnitin是一家全球性…

点点
2024年9月17日
000
AI前沿

今年 Station F 上排名前 40 的初创企业几乎都使用了人工智能

每年，超过 1,000 家初创公司加入巴黎标志性创业园区Station F。由于筛选 1,000 家初创公司的描述可能很困难，Station F 会选出 40 家最有前途的初创公司…

王浩然
2024年11月14日
000
AI前沿

Cybord 获得 870 万美元 A 轮融资，通过可追溯性革新电子制造业

Cybord是一家在电子制造领域处于领先地位的视觉 AI 技术公司，该公司在 A 轮融资中筹集了 870 万美元。此次融资由 Capri Ventures 领投，Ocean Azu…

点点
2024年9月18日
000
AI前沿

ChatGPT 集成如何与 Apple Intelligence 协同工作

周三，借助新发布的 iOS 18.2、iPadOS 18.2 和 macOS Sequoia 15.2 更新，开发人员首次体验了 Apple Intelligence 的 Chat…

王浩然
2024年10月25日
000
AI前沿

人工智能视觉搜索登陆 iPhone

该公司在周一的 Apple Event 2024 上宣布，视觉搜索即将登陆 iPhone，由苹果的 AI 功能套件 Apple Intelligence 提供支持。相机控制是iP…

王浩然
2024年9月10日
000
AI前沿

ElevenLabs 聘请了阅读应用 Omnivore 背后的团队

生成式人工智能公司ElevenLabs聘请了开源稍后阅读应用程序Omnivore背后的团队。 Omnivore 联合创始人杰克逊·哈珀 (Jackson Harper) 和吴洪波 …

王浩然
2024年10月30日
000
AI前沿

Connectly 现已获得阿里巴巴的支持，利用人工智能向客户提供个性化短信

Stefanos Loukakos 曾担任 Meta 的商业 Messenger 部门主管，并曾短暂担任该科技巨头区块链组织的主管。几年前，他注意到在线零售商很难与潜在购物者建立…

王浩然
2024年9月13日
000
AI前沿

数学法学硕士的失败及其解决方法

数学一直是人工智能模型面临的重大挑战。掌握数学需要复杂的推理能力，而对于人工智能来说，这项任务绝非易事。鉴于数学能力对于职业、个人和学术成功的重要性，这带来了巨大的问题。尽管大型…

王浩然
2024年12月8日
000
AI前沿

黑眼豆豆将在拉斯维加斯驻地首次推出人工智能会员

Vida 将作为乐队的正式成员与其他成员一起演唱，包括二重唱

点点
2024年9月12日
000
AI前沿

OpenAI最新估值达到1500亿美元？

据媒体报道，美国人工智能（AI）研究公司OpenAI的最新估值达到了惊人的1500亿美元，但这有一个重要前提，那就是OpenAI需要改变自身复杂的公司结构，取消其对投资者设置的利润…

点点
2024年9月16日
000
AI前沿

Meta 将发布重大 WhatsApp AI 更新

想象一下这样一个世界：消息应用不仅仅是通讯工具，更是改善日常生活的强大助手。消息平台不再只是简单的文本交流。它们已经发展成为使用人工智能 (AI) 来提高生产力和沟通能力的强大工具…

王浩然
2024年8月26日
000
AI前沿

Cohere 刚刚推出了“North”，这是该公司迄今为止针对注重隐私的企业的最大 AI 赌注

Cohere今天发布了North，这是一个安全的 AI 工作区平台，在企业市场直接挑战 Microsoft Copilot和 Google Vertex AI。该公司声称其新平台在…

王浩然
2025年1月10日
000
AI前沿

挪威1X公司正在研发家用仿人机器人

挪威的创新科技公司1X近日宣布，他们正在致力于开发一款专为家庭环境设计的仿人机器人。这一项目旨在通过先进的人工智能和机器人技术，为日常生活带来便利和新的互动体验。据1X公司介绍，…

王浩然
2025年2月26日
000
AI前沿

谷歌发布全新推理模型Gemini 2.0 Flash Thinking 与OpenAI o1竞争

谷歌在重新定义人工智能领域的最新举措中，宣布推出 Gemini 2.0 Flash Thinking，这是一种多模式推理模型，能够快速、透明地解决复杂问题。谷歌首席执行官 Sun…

王浩然
2024年12月20日
000
AI前沿

Crunchbase 的 AI 可以 95% 的准确率预测初创企业的成功——它会改变投资吗？

Crunchbase将放弃其作为历史数据提供商的本质，成为一个人工智能预测引擎，用于预测初创公司的融资轮次、收购和公司增长轨迹。这家总部位于旧金山的公司今天宣布，将重新推出其平台…

王浩然
2025年2月20日
000
AI前沿

大地测量局：探索人工智能在地理空间技术中的作用和道德考量

随着我们即将迎来充满潜力的新年，技术领域，尤其是人工智能 (AI) 和机器学习 (ML)，即将迎来重大变革。英国国家测绘机构 Ordnance Survey (OS) 的首席技术官…

王浩然
2024年12月24日
000
AI前沿

为你点击的人工智能：微软的研究指出了 GUI 自动化的未来

微软研究人员和学术合作伙伴进行的一项全面的新调查显示，由大型语言模型 (LLM) 驱动的人工智能代理越来越能够控制图形用户界面 (GUI)，从而有可能改变人类与软件的交互方式。这…

王浩然
2024年12月1日
000
AI前沿

AI编程助手并非万能解决方案

近期的一份报告显示，人工智能（AI）编程助手虽然在一定程度上提高了编程效率，但并非所有编程问题的万能解决方案。这一结论基于对当前市场上主流AI编程助手功能的深入分析，以及对开发者实…

王浩然
2025年2月25日
000