我们能教机器像人类一样思考吗？

王浩然 • 2024年10月20日下午8:00 • AI前沿 • 100 views

介绍

当我开始学习人工智能时，最令人着迷的想法之一就是机器像人类一样思考。但是，当我仔细研究人工智能和机器学习方法的实际作用时，我惊讶地发现，课程和书籍中关于人类思维方式（即人类认知）和机器思维方式之间存在巨大差距。对我来说，这些差距的例子有：感知器的工作原理（通常被称为“受其生物垂饰的启发”）和真实神经元的工作原理。或者模糊逻辑如何尝试模拟人类的信息和推理概念以及人类推理实际上似乎如何工作。或者人类如何通过观察点云并在板上围绕点云绘制圆圈来聚类点云，以及 DBSCAN 和 k-means 等算法如何执行此任务。

但现在，ChatGPT、Claude 和 LLaMA 等法学硕士已成为人们关注的焦点。这些硕士课程基于数十亿甚至数万亿个人工神经元和机制，它们在认知中也发挥着重要作用：注意力（显然，注意力就是你所需要的一切）。我们已经走了很长一段路，与此同时，人们也获得了诺贝尔奖来表彰该领域的早期巨人。法学硕士在总结文章、生成代码，甚至回答复杂问题和发挥创造力方面都非常成功。毫无疑问，关键点是正确的提示。你越清楚地说明你想要从模型中得到什么，结果就越好。提示工程已经成为一个不断发展的领域，它甚至已经成为人类的一项专门工作（尽管我个人对这个角色的长期未来表示怀疑）。人们提出了许多提示策略：著名的有思路链（CoT）[2] 或思路树（ToT）[3]，它们主要通过提供成功解决问题示例的 LLM 步骤来逐步指导语言模型推理。但这些步骤通常是具体的示例，需要明确设计解决方案链。

其他方法则尝试优化提示，例如使用 PromptBreeder 之类的进化算法 (EA)。我个人认为 EA 始终是个好主意。最近，苹果的一个研究团队表明，LLM 很容易因不同的提示而分心，无法解决问题 [4]。由于有很多好帖子，包括关于 CoT 和提示设计的 TDS（例如最近这里），我觉得没有必要在这里更详细地重述它们。

什么是认知提示？

仍然缺少一些东西，因为认知科学显然存在差距。这一切都让我思考：我们能否帮助这些模型更像人类一样“思考”，以及如何做？如果它们能够由认知科学所称的认知操作来指导会怎么样？例如，通过逐步分解来解决问题，过滤掉不必要的信息，并识别现有信息中存在的模式。听起来有点像我们在解决难题时所做的事情。

这就是认知提示的作用所在。想象一下，人工智能不仅可以回答你的问题，还可以通过结构化步骤的“思考”来指导自己（以及当你阅读其输出时指导你）完成复杂的问题解决过程。

想象一下，你正在解决一个数学应用题。你做的第一件事可能是明确你的目标：我到底需要弄清楚什么，我们期望的结果是什么？然后，你将问题分解成更小的步骤，一个有希望的方法是识别相关信息，也许还可以注意到有助于引导你的想法更接近所需解决方案的模式。在这个例子中，让我们将这些步骤称为目标明确、分解、过滤和模式识别。它们都是我们本能地执行的认知操作(COP) 的例子（或者在最好的情况下，老师教我们遵循这些操作）。

但这究竟是如何实现的呢？

这个过程是这样的。我们定义一个 COP 序列，并要求 LLM 遵循该序列。图 1 显示了提示的示例。事实证明重要的 COP 示例包括：

目标明确：模型首先需要以清晰的方式重述问题——它到底要解决什么问题，期望的结果是什么？
分解：接下来，将问题分解成可管理的部分。模型不应被所有可用信息淹没，而应专注于解决较小的部分 — 一次解决一个。
过滤：要求模型过滤掉不必要的细节，使其专注于真正重要的事情。这通常是必要的，以便让模型将注意力放在真正重要的信息上。
模式识别：识别模式以有效解决问题。例如，如果问题涉及重复步骤，则要求模型识别模式并应用它。
整合：最后，综合前面步骤的所有见解，特别是基于最后的 COP，并将它们整合到最终答案的解决方案中是有意义的。

这些结构化步骤模仿了人类解决问题的方式——逻辑性强，循序渐进。还有许多进一步的认知操作，以及选择哪个、按什么顺序以及如何为提示指定它们。这当然还有进一步改进的空间。

我们已经以以下方式扩展了该方法。我们不再遵循静态和确定性的 COP 顺序，而是让模型根据提供的列表自由选择自己的 COP 序列——这称为反思和自适应认知提示。事实证明，这种方法非常有效。在下一段中，我们将在基准问题集上比较这两种变体。

事实证明，将 COP 描述调整到特定问题领域也能提高性能。图 1（右）显示了通用 COP 的数学特定调整示例。它们“展开”为诸如“明确定义每个变量”或“逐步求解方程式”之类的提示。

在实践中，建议模型以 JSON 字符串的形式给出最终答案是有意义的。一些 LLM 不提供解决方案，而是提供解决问题的 Python 代码。在我们的实验分析中，我们很公平，当 Python 代码返回正确结果时，我们会将答案视为正确运行代码。

例子

让我们举一个简单的例子，要求 LLaMA3.1 70B 解决 GSM8K [5] 中的一道 8.5k 算术题。图 2 显示了该请求。

图 3 显示了模型得出正确答案的输出。结果表明，模型系统地遵循了 COP 的顺序 — 甚至为人类提供了很好的解决问题的解释。

从科学角度看，认知提示的效果如何？

现在，让我们通过在一个典型的基准上测试认知提示来变得更加系统化。我们在 GSM8K [5] 数据集中的一组数学问题上对其进行了测试——基本上是你在小学里会遇到的一组数学问题。同样，我们使用 Meta 的 LLaMA 模型来查看认知提示是否可以提高他们的解决问题的能力，应用了具有 80 亿个参数的 LLaMA 和具有 700 亿个参数的更大版本。

图 4 显示了一些结果。较小的模型在确定性认知提示下略有改善。也许它不够大，无法处理结构化思维的复杂性。当它选择自己的 COP 序列时，性能上的胜利是显著的。

在没有认知提示的情况下，大型模型在数学问题上的得分约为 87%。当我们添加确定性认知提示（模型遵循固定的认知步骤序列）时，其得分跃升至 89%。但是，当我们允许模型适应并动态选择认知操作（自适应提示）时，得分飙升至 91%。对于一台机器来说，在不添加额外示例的情况下，仅获得一般性建议就能像人类一样推理，这还不错，对吧？

这为什么重要？

认知提示是一种将这些类似人类的认知操作组织成结构化过程并利用它们帮助 LLM 解决复杂问题的方法。本质上，它就像为模型提供了一个结构化的“思维策略”以供遵循。虽然早期的方法（如 CoT）很有帮助，但认知提示通过整合各种认知操作提供了更深层次的推理。

这不仅对数学问题有令人兴奋的影响！想想决策、逻辑推理甚至创造力等领域——这些任务需要的不仅仅是复述事实或预测句子中的下一个单词。通过教导人工智能更像我们一样思考，我们打开了能够以更接近人类认知的方式推理问题的模型之门。

我们接下来要去哪里？

结果令人鼓舞，但这仅仅是个开始。认知提示肯定可以适用于其他领域，但它也可以与人工智能的其他想法相结合。随着我们探索更高级的认知提示版本，下一个重大挑战将是弄清楚如何在不同类型的问题中对其进行优化。谁知道呢？也许有一天，我们将拥有能够解决从数学问题到道德困境等任何问题的人工智能，同时还能像我们一样逻辑和创造性地思考。祝您自己尝试认知提示的乐趣！

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/wo-men-neng-jiao-ji-qi-xiang-ren-lei-yi-yang-si-kao-ma

Like (0)

王浩然作者

0 0

使用 LlamaIndex 和 Gemini 实现 REAcT Agent

Previous 2024年10月20日

谷歌的 NotebookLM 现在可让你指导 AI 播客的主持人

Next 2024年10月20日

AI前沿

Nvidia 完成收购 AI 基础设施初创公司 Run:ai

Nvidia 已完成对以色列初创公司 Run:ai 的收购，后者致力于管理和优化 AI 硬件基础设施。作为合并的一部分，Run:ai 表示其软件（目前仅适用于 Nvidia 产品…

王浩然
2024年12月31日
000
AI前沿

科尔莫戈罗夫-阿诺德网络：高效且可解释的神经网络新前沿

神经网络一直处于人工智能发展的前沿，推动了从自然语言处理和计算机视觉到战略游戏、医疗保健、编程、艺术，甚至自动驾驶汽车等各个领域的发展。然而，随着这些模型在规模和复杂性方面的扩展，…

王浩然
2024年8月22日
000
AI前沿

亚马逊新款Alexa：为儿童推出AI驱动的探索与故事功能‌

近日，亚马逊正式推出了其新款Alexa设备，专为儿童设计了全新的AI驱动功能——“探索”与“故事”。这两项创新功能旨在通过智能化、互动化的方式，为孩子们提供更加丰富、有趣的学习与娱…

王浩然
2025年2月28日
000
AI前沿

Passionfroot 是一个面向以商业为中心的内容创作者寻求品牌合作的市场，反之亦然

随着创作者经济的快速增长，品牌合作仍然是创作者赚钱的主要方式。其他服务，如带有联盟链接的 Link-in-Bio 应用或类似 Patreon 的订阅，成为增加创作者收入的次要方式…

王浩然
2024年10月23日
000
AI前沿

Emily Popson，CallRail 增长营销副总裁 – 访谈系列

Emily Popson 是CallRail的增长营销副总裁，负责领导需求生成、网站优化、客户营销和内容营销团队。Popson 自己之前也是一家小企业主，她热衷于让即使是最小的团…

点点
2024年10月17日
000
AI前沿

LinkedIn 在更新服务条款前曾抓取用户数据用于培训

LinkedIn 可能已经在没有更新其条款的情况下利用用户数据训练了 AI 模型。 LinkedIn 的美国用户（欧盟、欧洲经济区或瑞士除外，这可能是由于这些地区的数据隐私规则）在…

王浩然
2024年9月19日
000
AI前沿

微软将在25财年斥资800亿美元建设人工智能数据中心

据公司博客文章称，微软已在 2025 财年拨款 800 亿美元用于建设用于处理人工智能工作负载的数据中心。具体来说，这家科技巨头计划建立支持人工智能的数据中心，“以训练人工智能模…

王浩然
2025年1月4日
000
AI前沿

据报道，Perplexity 正寻求以 80 亿美元的估值进行融资

据《华尔街日报》报道，人工智能搜索引擎 Perplexity 正在进行融资谈判，希望以 80 亿美元的估值筹集约 5 亿美元。如果按照这些条款达成交易，Perplexity 的估…

王浩然
2024年10月21日
000
AI前沿

黑客诱骗 ChatGPT 泄露自制炸弹的详细说明

如果你要求 ChatGPT 帮助你制作一个自制的化肥炸弹，类似于1995 年俄克拉荷马城恐怖爆炸案中使用的炸弹，聊天机器人会拒绝。 “我无法提供帮助，”ChatGPT 在周二的一…

王浩然
2024年9月14日
000
AI前沿

ElevenLabs 聘请了阅读应用 Omnivore 背后的团队

生成式人工智能公司ElevenLabs聘请了开源稍后阅读应用程序Omnivore背后的团队。 Omnivore 联合创始人杰克逊·哈珀 (Jackson Harper) 和吴洪波 …

王浩然
2024年10月30日
000
AI前沿

AI工作取代：是逐渐发生还是突然到来？‌

人工智能（AI）正在迅速改变我们的工作方式，无论是通过自动化任务、作为辅助工具，还是从普通英语生成文本、图像、视频和软件。然而，尽管关于AI将彻底改变工作的讨论甚嚣尘上，但广泛的工…

王浩然
2025年3月24日
000
AI前沿

Claude 的模型上下文协议 (MCP)：开发人员指南

Anthropic 的模型上下文协议 (MCP)是一种开源协议，可实现 AI 助手与数据库、API 和企业工具等数据源之间的安全双向通信。通过采用客户端-服务器架构，MCP 标准化…

王浩然
2024年12月11日
000
AI前沿

Meta 揭秘 iPhone 杀手：Orion

多年来，硅谷和华尔街一直质疑马克·扎克伯格向 Reality Labs 投资数百亿美元的决定。本周，Meta 的可穿戴设备部门发布了Orion 智能眼镜的原型，该公司认为这种外形有…

王浩然
2024年9月29日
000
AI前沿

斯坦福人工智能指数：重塑企业技术战略的五大关键洞察

在当今快速发展的科技领域，人工智能（AI）已成为推动各行业变革的重要力量。斯坦福大学发布的人工智能指数报告，不仅为我们揭示了AI技术的最新进展，还深入剖析了这些进展如何重塑企业的技…

王浩然
3天前
000
AI前沿

美国版权局称，人工智能生成的内容可受版权保护——只要人类参与或编辑

美国版权局负责管理政府对电影、电视节目、小说、艺术、音乐甚至软件等人类创作的作品的版权保护，该局在今天发布的重要且有用的更新中澄清说，某些形式的人工智能生成内容实际上可以获得版权保…

王浩然
2025年2月4日
000
AI前沿

多式联运 RAG 正在发展，这是开始的最佳方式

随着公司开始尝试多模态检索增强生成 (RAG)，提供多模态嵌入（一种将数据转换为 RAG 可读文件的方法）的公司建议企业在嵌入图像和视频时从小处着手。多模态 RAG 还可以显示…

王浩然
2024年11月11日
000
AI前沿

‌Meta新AR眼镜：科研神器，可测量心率‌

近日，Meta公司推出了一款专为科研设计的增强现实（AR）眼镜，该眼镜不仅具备高清显示和精准定位功能，还能实时监测用户的心率，为科研工作者提供了前所未有的便捷与精准数据支持。 ‌一…

王浩然
2025年3月2日
000
AI前沿

孤星与Phison数据中心基础设施将登陆月球‌

近日，孤星（Lonestar）与Phison宣布了一项令人瞩目的计划：他们将携手将数据中心基础设施送往月球。这一创举预示着太空技术在商业应用领域的又一重大突破。 ‌一、计划背景‌ …

王浩然
2025年3月1日
000
AI前沿

DeepSeek 真的在向中国发送数据吗？让我们来解密

上周，中国初创公司DeepSeek发布了性能强大但成本低廉的开源版本 DeepSeek-R1，在人工智能界引起轩然大波。该模型使用纯强化学习 (RL)，在一系列基准测试中与 Ope…

王浩然
2025年1月28日
000
AI前沿

Nvidia 与埃森哲携手推动企业代理人工智能

Nvidia 将为全球最大的 IT 服务提供商提供支持，创建新的业务集团，并帮助推出埃森哲的 AI Refinery 平台，用于代理 AI

点点
2024年10月8日
000