“strawberry”问题：如何克服人工智能的局限性

王浩然 • 2024年10月15日上午11:00 • AI前沿 • 593 views

到目前为止，ChatGPT 和 Claude 等大型语言模型 ( LLM ) 已成为全球的日常用语。许多人开始担心人工智能会抢走他们的工作，因此，几乎所有基于 LLM 的系统都无法完成一个简单的任务，这很讽刺：计算单词“strawberry”中“r”的数量。它们不仅无法计算字母“r”，其他例子包括计算“mammal”中的“m”和“hippopotamus”中的“p”。在本文中，我将分析这些失败的原因并提供一个简单的解决方法。

LLM 是功能强大的 AI 系统，经过大量文本训练，能够理解和生成类似人类的语言。它们擅长回答问题、翻译语言、总结内容，甚至根据收到的输入预测和构建连贯的响应，从而生成创意写作。LLM 旨在识别文本中的模式，这使它们能够以惊人的准确性处理各种与语言相关的任务。

尽管法学硕士能力超群，但他们却无法数出“ strawberry ”这个词中“r”的数量，这说明他们无法像人类一样“思考”。他们无法像人类一样处理我们提供给他们的信息。

目前几乎所有的高性能 LLM 都是基于transformers构建的。这种深度学习架构并不直接将文本作为输入。它们使用一种称为标记化的过程，将文本转换为数字表示或标记。一些标记可能是完整的单词（如“monkey”），而另一些标记可能是单词的一部分（如“mon”和“key”）。每个标记都像是模型理解的代码。通过将所有内容分解为标记，模型可以更好地预测句子中的下一个标记。

LLM 不会记住单词；它们会尝试理解这些标记如何以不同的方式组合在一起，从而善于猜测接下来会发生什么。以单词“hippopotamus”为例，模型可能会看到字母“hip”、“pop”、“o”和“tamus”的标记，但不知道单词“hippopotamus”是由字母“h”、“i”、“p”、“p”、“o”、“p”、“o”、“t”、“a”、“m”、“u”、“s”组成的。

可以直接查看单个字母而不对其进行标记的模型架构可能不会出现此问题，但对于当今的变压器架构而言，这在计算上是不可行的。

此外，看看 LLM 如何生成输出文本：它们根据先前的输入和输出标记预测下一个单词是什么。虽然这适用于生成具有上下文感知的类似人类的文本，但它不适合计数字母等简单任务。当被要求回答单词“strawberry”中“r”的数量时，LLM 纯粹是根据输入句子的结构来预测答案。

这是一个解决方法

虽然法学硕士可能无法“思考”或逻辑推理，但他们擅长理解结构化文本。结构化文本的一个典型例子是计算机代码，包括许多编程语言。如果我们要求 ChatGPT 使用 Python 计算“strawberry”中“r”的数量，它很可能会得到正确的答案。当法学硕士需要进行计数或任何其他可能需要逻辑推理或算术计算的任务时，可以设计更广泛的软件，使提示包括要求法学硕士使用编程语言来处理输入查询。

结论

一个简单的字母计数实验揭示了 ChatGPT 和 Claude 等 LLM 的根本局限性。尽管这些人工智能模型在生成类似人类的文本、编写代码和回答任何问题方面具有令人印象深刻的能力，但它们还不能像人类一样“思考”。实验表明，这些模型是模式匹配预测算法，而不是能够理解或推理的“智能”。然而，事先了解哪种类型的提示效果良好可以在一定程度上缓解这个问题。随着人工智能在我们生活中的融入度不断提高，认识到它的局限性对于负责任地使用这些模型和对这些模型抱有现实的期望至关重要。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/strawberry-wen-ti-ru-he-ke-fu-ren-gong-zhi-neng-de-ju-xian

Like (0)

王浩然作者

0 0

OpenAI 推出实验性“Swarm”框架，引发人工智能驱动自动化的争论

Previous 2024年10月15日

DeepMind 的 Michelangelo 基准测试揭示了长上下文 LLM 的局限性

Next 2024年10月15日

AI前沿

Persado 联合创始人兼总裁 Assaf Baciu – 访谈系列

Assaf Baciu 拥有近二十年为市场领先的 SaaS 组织制定企业战略和产品方向的经验。作为Persado的联合创始人兼总裁，他推动了 Persado 不断增长的产品组合的发…

点点
2024年10月24日
000
AI前沿

OpenAI的ChatGPT用户激增至4亿，GPT-5即将面世‌

OpenAI的ChatGPT用户量已突破4亿周活跃用户大关，这一里程碑彰显了公司在消费者和企业市场的快速扩张。根据首席运营官Brad Lightcap周四在X平台上的帖子，Chat…

王浩然
2025年2月22日
000
AI前沿

Nvidia 的“Eagle”人工智能以超高清视角看世界，它将取代你的工作

Nvidia 的研究人员推出了“ Eagle ”，这是一组新的人工智能模型，可以显著提高机器理解和与视觉信息交互的能力。该项研究发表在 arXiv 上，展示了从视觉问答到文档理解…

王浩然
2024年9月3日
000
AI前沿

为 AI 模型评分：Endor Labs 推出评估工具

Endor Labs已开始根据 AI 模型的安全性、受欢迎程度、质量和活跃度对其进行评分。这一独特功能被称为“AI 模型的 Endor 分数”，旨在通过提供直接的分数来简化识别 …

点点
2024年10月17日
000
AI前沿

新的 NFL 投注应用程序利用人工智能来平衡比赛

随着劳动节的过去和职业橄榄球赛季的正式开始，体育分析公司 Field Vision Sports 推出了所谓的首款移动应用程序，提供基于人工智能和机器学习的 NFL 比赛预测，让投…

点点
2024年9月11日
000
AI前沿

为什么 DeepSeek 的新 AI 模型认为它是 ChatGPT

本周早些时候，资金雄厚的中国人工智能实验室 DeepSeek 发布了一款“开放”人工智能模型，该模型在热门基准测试中击败了许多竞争对手。该模型DeepSeek V3规模庞大但效率高…

王浩然
2024年12月29日
000
AI前沿

AWS 失去了一位顶级人工智能高管

上周，AWS 失去了一位顶级 AI 高管。人工智能副总裁 Matt Wood宣布，他将在 AWS 任职 15 年后离职。Wood 长期参与亚马逊部门的人工智能计划；他于 2022…

点点
2024年10月19日
000
AI前沿

抵御人工智能攻击——正确的防御策略

随着人工智能威胁的激增，组织必须掌握如何预防和防御此类攻击。一种流行的方法是使用人工智能来防御其他恶意人工智能。然而，这只是部分有效。人工智能可以用作防御盾牌，但前提是员工具备正确…

点点
2024年11月5日
000
AI前沿

Zeekr 将使用 Nvidia 超级芯片；向 Waymo 交付自动驾驶出租车：CES 2025

中国高端品牌 Zeekr在CES 上发布了几项重要公告，表明其将成为自动驾驶汽车(AV) 市场中一股不容忽视的力量。首先，该公司确认将推出一款采用 Nvidia Drive…

王浩然
2025年1月12日
000
AI前沿

微软通过新数据工具增强 Fabric 功能，以加速企业 AI 工作流程

今天，微软启动了Ignite 大会，讨论人工智能的各个方面，包括如何组建最大的人工智能代理生态系统，并允许企业使用其提供的 1,800 种大型语言模型中的任何一种来构建更多此类应用…

王浩然
2024年11月21日
000
AI前沿

从 AI 代理到企业预算，20 家风险投资公司分享了他们对 2025 年企业技术的预测

尽管人工智能被一些人誉为工业革命以来最大的技术突破，但企业——可以说是该技术最大的潜在客户群——采用人工智能的速度却很慢。尽管一些投资者预测 2024 年将是企业开始采用更多 A…

王浩然
2024年12月31日
000
AI前沿

Claude：你需要了解的有关 Anthropic 人工智能的一切

Anthropic 是规模仅次于 OpenAI 的第二大 AI 供应商，它拥有一个名为 Claude 的强大生成式 AI 模型系列。这些模型可以执行一系列任务，从为图片添加字幕、撰…

王浩然
2024年10月20日
000
AI前沿

OpenAI获英伟达B200最强超算，GPT-5训练无底洞，微软算力却严重不足

就在刚刚，OpenAI收到了来自英伟达的首批工程版DGX B200！此情此景，不得不让人联想到，刚刚成立的OpenAI在接收英伟达初代DGX时的画面。如今，早已物是人非。依然…

点点
2024年10月9日
000
AI前沿

2025年及以后AI的三大预测‌

近年来，人工智能（AI）的飞速发展令人叹为观止。从协助发现可能拯救生命的药物疗法，到推动自动驾驶汽车技术的革新，AI正深刻影响着我们的日常生活。作为AI的乐观拥趸，我坚信AI将继续…

王浩然
2025年3月14日
000
AI前沿

新的AI产品创建平台Arcade设计了这款项链

化妆品零售商 Eve 和设计市场 Minted 的创始人 Mariam Naficy 长期以来一直致力于支持独立艺术家并帮助他们销售产品。她的最新创业项目Arcade AI是一个新…

王浩然
2024年10月28日
000
AI前沿

2024 年无法实现的人工智能智能手机

过去一年，我报道了美国每款主要手机的发布，每款手机都在大声宣告同一件事：人工智能已经到来，我们的手机就是你们期待已久的人工智能手机。每款手机都赢得了热烈掌声和利好消息。但当我拿到这…

王浩然
2024年12月28日
000
AI前沿

解锁医疗保健的未来：探索 AI 环境临床语音和 AI 医疗文书员

医疗保健行业正在迅速进入技术驱动的新时代，而人工智能 (AI) 是其主要加速器。数据显示，75% 的医疗保健提供商和专业人士认为，未来三年内，人工智能相关技术将“普及”。虽然行业领…

点点
2024年9月10日
000
AI前沿

通过模块化人工智能打造数字化劳动力

工作平台Monday.com的AI发展历程、战略及技术特点，展现其如何借助AI提升竞争力并推动企业软件开发模式的演进，具体内容如下： 1. **发展背景**：Monday.com致…

王浩然
2025年2月11日
000
AI前沿

加密货币骗子入侵 OpenAI 在 X 上的新闻账号

OpenAI 在 X 上的官方新闻账号似乎也遭到了加密货币骗子的攻击，前几个月攻击该公司领导层的账号的也是同样的情况。周一下午晚些时候，OpenAI Newsroom（OpenA…

王浩然
2024年9月25日
000
AI前沿

AWS SageMaker 正在转型为数据和 AI 的综合中心

今天，亚马逊网络服务 (AWS) 在其年度大型会议re:Invent 2024上宣布了其下一代基于云的机器学习 (ML) 开发平台 SageMaker，将其转变为一个统一的中心，使…

王浩然
2024年12月4日
000

发表回复

Please Login to Comment

“strawberry”问题：如何克服人工智能的局限性

这是一个解决方法

结论

相关推荐

发表回复

Share To :