DeepMind 的 Talker-Reasoner 框架为 AI 代理带来了系统 2 思维

王浩然 • 2024年10月27日上午9:00 • AI前沿 • 287 views

人工智能代理必须解决一系列需要不同速度和不同水平的推理和规划能力的任务。理想情况下，代理应该知道何时使用其直接记忆，何时使用更复杂的推理能力。然而，设计能够根据需求正确处理任务的代理系统仍然是一个挑战。

在一篇新论文中，谷歌 DeepMind的研究人员介绍了 Talker-Reasoner，这是一个受人类认知“双系统”模型启发的代理框架。该框架使 AI 代理能够在不同类型的推理之间找到适当的平衡，并提供更流畅的用户体验。

人类和人工智能中的系统 1、系统 2 思维

双系统理论由诺贝尔奖获得者丹尼尔·卡尼曼首次提出，认为人类思维由两个不同的系统驱动。系统 1 快速、直观、自动。它控制着我们的快速判断，例如对突发事件作出反应或识别熟悉的模式。相比之下，系统 2 缓慢、深思熟虑、善于分析。它使复杂的问题解决、规划和推理成为可能。

虽然这两个系统通常被视为独立的，但它们却不断相互作用。系统 1 会产生印象、直觉和意图。系统 2 会评估这些建议，如果得到认可，则会将它们整合到明确的信念和深思熟虑的选择中。这种相互作用使我们能够无缝地应对各种情况，从日常生活到具有挑战性的问题。

当前的人工智能代理大多以系统 1 模式运行。它们擅长模式识别、快速反应和重复性任务。然而，它们在需要多步骤规划、复杂推理和战略决策（系统 2 思维的标志）的场景中往往表现不佳。

Talker-Reasoner 框架

DeepMind 提出的 Talker-Reasoner 框架旨在让 AI Agent 同时具备系统 1 和系统 2 的能力，将 Agent 划分为两个不同的模块：Talker 和 Reasoner。

Talker 是类似于系统 1 的快速、直观的组件。它处理与用户和环境的实时交互。它感知观察、解释语言、从记忆中检索信息并生成对话响应。Talker 代理通常使用大型语言模型 (LLM) 的上下文学习(ICL) 能力来执行这些功能。

推理者体现了系统 2 的缓慢、深思熟虑的本质。它执行复杂的推理和规划。它准备好执行特定任务，并与工具和外部数据源交互以增强其知识并做出明智的决策。它还会在收集新信息时更新代理的信念。这些信念推动未来的决策，并充当谈话者在对话中使用的记忆。

研究人员写道：“Talker 代理专注于与用户进行自然、连贯的对话并与环境互动，而 Reasoner 代理则专注于根据 Talker 提供的环境信息执行多步骤规划、推理和形成信念。”

这两个模块主要通过共享内存系统进行交互。推理器用其最新的信念和推理结果更新内存，而发话器则检索这些信息来指导其交互。这种异步通信使发话器能够保持连续的对话流，即使推理器在后台执行更耗时的计算。

“这类似于行为科学双系统方法，系统 1 始终处于开启状态，而系统 2 只以一小部分容量运行，”研究人员写道。“同样，说话者始终处于开启状态并与环境交互，而推理者仅在说话者等待或可以从记忆中读取时才更新信念以通知说话者。”

Talker-Reasoner 为人工智能教练提供指导

研究人员在一款睡眠辅导应用中测试了他们的框架。AI 教练通过自然语言与用户互动，为改善睡眠习惯提供个性化指导和支持。这款应用需要结合快速、富有同理心的对话和深思熟虑的基于知识的推理。

睡眠教练的 Talker 组件负责对话方面，提供富有同理心的回应并指导用户完成指导过程的不同阶段。Reasoner 保持对用户睡眠问题、目标、习惯和环境的信念状态。它使用这些信息来生成个性化建议和多步骤计划。相同的框架可以应用于其他应用程序，例如客户服务和个性化教育。

DeepMind 研究人员概述了未来研究的几个方向。其中一个重点领域是优化 Talker 和 Reasoner 之间的交互。理想情况下，Talker 应该自动确定查询何时需要 Reasoner 的干预以及何时可以独立处理这种情况。这将最大限度地减少不必要的计算并提高整体效率。

另一个方向是扩展框架以纳入多个推理器，每个推理器专注于不同类型的推理或知识领域。这将使代理能够处理更复杂的任务并提供更全面的帮助。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/deepmind-de-talkerreasoner-kuang-jia-wei-ai-dai-li-dai-lai

AI 代理 DeepMind LLM Talker-Reasoner 谷歌

Like (0)

王浩然作者

0 0

Anthropic 的代理计算机使用正在赋予人们“超能力”

Previous 2024年10月27日

Meta 在手机 AI 竞赛中击败谷歌和苹果

Next 2024年10月27日

AI前沿

Salesforce 发现，93% 的 IT 领导者看到了 AI 代理的价值，但难以实现

每个人都在谈论人工智能代理。但到目前为止，很多都还只是说说而已。 Salesforce 表示，这种情况将在 2025 年发生改变——人工智能代理终于成为现实。根据其集成…

王浩然
2025年2月4日
000
AI前沿

OpenAI 向第三方开发者开放其最强大的模型 o1

在以假期为主题的产品发布会“OpenAI 12 天”的第九天， OpenAI 正在通过其应用程序编程接口 (API)向第三方开发人员推出其最先进的模型 o1 。对于希望构建新的高…

王浩然
2024年12月18日
000
AI前沿

Pinecone 通过级联检索扩展矢量数据库，将企业 AI 准确率提高高达 48%

近年来，Pinecone 已成为领先的原生矢量数据库平台之一。Pinecone 凭借新功能继续在竞争日益激烈的市场中脱颖而出，帮助解决企业 AI 挑战今天，Pinecone 宣布…

王浩然
2024年12月3日
000
AI前沿

OpenAI 首席技术官和其他两人离职，Altman 否认与重组计划有关

OpenAI 首席技术官 Mira Murati在社交网络 X 上分享了她令人意外的辞职信，宣布她将离开公司。Murati 于 2018 年加入 OpenAI，在六年半的时间里担任…

点点
2024年10月1日
000
AI前沿

加州禁止政治广告中使用 AI Deepfat

就在 11 月大选前几周，加州州长加文·纽瑟姆 (Gavin Newsom) 签署了三项法案，禁止在竞选广告中使用深度伪造和其他误导性的数字创建或修改内容。纽森说：“…

点点
2024年9月21日
000
AI前沿

Augmented Intelligence 声称其 AI 可以让聊天机器人更有用

OpenAI 的 o1 等 AI 模型的核心是神经网络架构，而这种架构的替代方案正大行其道。这种方案被称为符号 AI，它使用与特定任务（如重写文本行）相关的规则来解决更大的问题。 …

wang, jinchang
2024年10月2日
000
AI前沿

OpenAI 资助杜克大学 100 万美元研究人工智能与道德

OpenAI 向杜克大学的一个研究团队提供 100 万美元的资助，用于研究人工智能如何预测人类的道德判断。该倡议强调了人们对技术与道德交叉问题的日益关注，并提出了关键问题：人工智…

王浩然
2024年12月24日
000
AI前沿

OpenAI 售价 200 美元的 ChatGPT Pro：思考更深入的人工智能（但你需要它吗？）

OpenAI 刚刚推出了他们所谓的“世界上最智能的模型”。它的月费为 200 美元，并承诺比我们以前见过的任何东西都更努力地思考、工作更长时间并解决更复杂的问题。但在这个似乎每周都…

王浩然
2024年12月9日
000
AI前沿

自动驾驶送货机器人获得 AI 升级；Uber Eats 将于 2025 年部署 2,000 个

Serve Robotics 推出其先进的新型送货机器人

点点
2024年10月22日
000
AI前沿

从 o1 到 o3：OpenAI 如何重新定义人工智能中的复杂推理

生成式人工智能重新定义了我们对人工智能能力的认知。它最初只是一种用于完成简单重复性任务的工具，现在正在解决我们面临的一些最具挑战性的问题。OpenAI 在这一转变中发挥了重要作用，…

王浩然
2024年12月27日
000
AI前沿

苹果收购照片编辑应用程序 Pixelmator

Pixelmator周五宣布将被苹果收购。这家图像编辑平台并未透露被苹果收购后公司的发展前景，但表示其 Pixelmator Pro、Pixelmator for iOS 和 Ph…

王浩然
2024年11月2日
000
AI前沿

Apple Intelligence 功能还可以为你总结分手短信

当Nick Spreen安装 iOS 18.1 测试版以试用即将推出的 Apple Intelligence 功能时，他可能没想到会收到当时的女友发来的由 AI 生成的分手短信摘要…

王浩然
2024年10月12日
000
AI前沿

Sakana AI 的 CycleQD 优于多技能语言模型的传统微调方法

Sakana AI的研究人员开发了一种资源高效的框架，可以创建数百种专门用于不同任务的语言模型。该技术称为CycleQD，它使用进化算法来结合不同模型的技能，而无需昂贵且缓慢的训练…

王浩然
2024年12月7日
000
AI前沿

Midjourney结束了必须使用Discord来生成AI图片的时代

Midjourney是否因竞争对手数量激增而感到压力？随着越来越多的公司进入AI图像生成领域，竞争自然会加剧，用户也会有更多选择。因此，Midjourney可能会感到一些压力，并…

王浩然
2024年8月23日
000
AI前沿

ChatGPT 的资源需求正在失控

众所周知，生成式人工智能的发展需要越来越多的水和电，但《华盛顿邮报》和加州大学河滨分校研究人员的一项新研究表明，OpenAI 的聊天机器人需要多少资源才能执行其最基本的功能。在…

王浩然
2024年9月24日
000
AI前沿

ApertureData 获得 825 万美元种子资金并推出 ApertureDB Cloud 以彻底改变多模式 AI

ApertureData是一家处于多模态 AI 数据管理前沿的公司，该公司在超额认购的种子轮融资中筹集了 825 万美元，以推动其开创性平台 ApertureDB 的开发和扩展。此…

点点
2024年10月11日
000
AI前沿

谷歌推出人工智能编码助手“Jules”，承诺自动修复错误并加快开发周期

谷歌周三发布了人工智能编码助手“ Jules ”，它可以在开发人员睡觉时自主修复软件错误并准备代码更改，这标志着该公司在核心编程任务自动化方面取得了重大进展。该实验性的人工智能代…

王浩然
2024年12月12日
000
AI前沿

Ai2 发布 Tülu 3，这是一个完全开源的模型，以新颖的后训练方法超越了 DeepSeek v3 和 GPT-4o

开源模型竞赛变得越来越有趣。今天，艾伦人工智能研究所 (Ai2)推出了其最新参赛作品，即开源 Tülu 3 4050 亿参数大型语言模型 (LLM)。新模型不仅与 O…

王浩然
2025年2月3日
000
AI前沿

Hugging Face 的 SmolVLM 可以大幅降低企业的 AI 成本

Hugging Face 刚刚发布了SmolVLM，这是一种紧凑型视觉语言 AI 模型，可能会改变企业在运营过程中使用人工智能的方式。新模型以惊人的效率处理图像和文本，而所需的…

王浩然
2024年11月28日
000
AI前沿

谷歌正在印度测试基于 Gemini 的视频搜索

谷歌周四表示，目前正在印度测试基于人工智能的生成式视频搜索。该功能允许用户使用 Google Lens 拍摄视频，并向该公司的 Gemini AI 模型询问有关视频内容的问题。该…

王浩然
2024年10月5日
000