为什么人工智能无法拼写“草莓”

王浩然 • 2024年8月28日下午6:43 • AI前沿 • 174 views

在“strawberry”这个词中，字母“r”出现了多少次？根据GPT-4o和Claude等强大的 AI 产品的说法，答案是两次。

大型语言模型 (LLM) 可以在几秒钟内写出论文和解方程式。它们合成数 TB 数据的速度比人类翻阅书籍的速度还快。然而，这些看似无所不知的人工智能有时会失败得如此惊人，以至于事故变成了病毒式传播的模因，我们都庆幸自己还有时间屈服于我们的新人工智能霸主。

大型语言模型无法理解字母和音节的概念，这反映出了一个我们经常忘记的更大事实：这些东西没有大脑。它们不像我们一样思考。它们不是人类，甚至不是特别像人类。

大多数 LLM 都基于 Transformer（一种深度学习架构）构建。Transformer 模型将文本分解为标记，根据模型的不同，标记可以是完整的单词、音节或字母。

“法学硕士基于这种转换器架构，值得注意的是，它实际上并不是在阅读文本。当你输入提示时，它会被翻译成编码，”阿尔伯塔大学人工智能研究员兼助理教授 Matthew Guzdial告诉 TechCrunch。“当它看到‘the’这个词时，它会对‘the’的意思有一个编码，但它不知道‘T’、‘H’、‘E’。”

这是因为转换器无法有效地接收或输出实际文本。相反，文本被转换成其自身的数字表示，然后将其置于语境中以帮助人工智能得出合乎逻辑的响应。换句话说，人工智能可能知道“straw”和“berry”这两个词组成了“strawberry”，但它可能不理解“strawberry”是由字母“s”、“t”、“r”、“a”、“w”、“b”、“e”、“r”、“r”和“y”按特定顺序组成的。因此，它无法告诉你“strawberry”这个词中有多少个字母，更不用说有多少个“r”了。

这不是一个容易解决的问题，因为它嵌入在使这些 LLM 运行的架构中。

TechCrunch 的 Kyle Wiggers上个月深入研究了这个问题，并与东北大学研究法学硕士可解释性的博士生 Sheridan Feucht 进行了交谈。

“对于语言模型来说，‘单词’到底应该是什么这个问题很难回答，即使我们让人类专家就完美的标记词汇达成一致，模型可能仍然会发现进一步‘分块’很有用，”Feucht 告诉 TechCrunch。“我猜，由于这种模糊性，不存在完美的标记器。”

随着法学硕士学习更多语言，这个问题变得更加复杂。例如，一些标记化方法可能假设句子中的空格总是会位于新单词之前，但许多语言（如中文、日语、泰语、老挝语、韩语、高棉语等）并不使用空格来分隔单词。谷歌 DeepMind AI 研究员 Yennie Jun 在 2023 年的一项研究中发现，有些语言需要比英语多 10 倍的标记才能传达相同的含义。

“最好的办法可能是让模型直接查看字符而不进行标记化，但现在这对于 Transformer 来说在计算上是不可行的，”Feucht 说。

Midjourney和DALL-E等图像生成器不使用 ChatGPT 等文本生成器所采用的转换器架构。相反，图像生成器通常使用扩散模型，该模型可以根据噪声重建图像。扩散模型在大型图像数据库上进行训练，并且会激励它们尝试重建类似于从训练数据中学到的东西。

Lesan联合创始人兼 DAIR 研究所研究员 Asmelash Teka Hadgu告诉 TechCrunch，“图像生成器在汽车和人物面部等物体上的表现往往更出色，而在手指和笔迹等较小的物体上表现较差。”

这可能是因为这些较小的细节在训练集中并不像树木通常有绿叶这样的概念那样突出。不过，扩散模型的问题可能比困扰 transformer 的问题更容易解决。例如，一些图像生成器通过对更多真实的人手图像进行训练，在表示手方面有所改进。

“就在去年，所有这些模型在手指识别方面都表现得很糟糕，这与文本识别的问题完全一样，”Guzdial 解释道。“它们在局部识别方面表现得非常好，所以如果你看到一只手上有六七根手指，你可能会说，‘哇，这看起来像一根手指。’同样，对于生成的文本，你可能会说，这看起来像一个‘H’，这看起来像一个‘P’，但它们在将这些整体结构化在一起方面表现得非常糟糕。”

这就是为什么，如果你要求 AI 图像生成器为墨西哥餐厅创建菜单，你可能会得到“Tacos”这样的普通菜品，但你更有可能找到“Tamilos”、“Enchidaa”和“Burhiltos”这样的菜品。

随着这些关于拼写“strawberry”的表情包在互联网上流传，OpenAI 正在开发一款代号为 Strawberry 的新 AI 产品，该产品应该更擅长推理。法学硕士的发展受到这样一个事实的限制：世界上根本没有足够的训练数据来提高 ChatGPT 等产品的准确性。但据报道，Strawberry 可以生成准确的合成数据，使 OpenAI 的法学硕士更加出色。据The Information报道，Strawberry 可以解决《纽约时报》的Connections字谜游戏，这需要创造性思维和模式识别才能解决，并且可以解决以前从未见过的数学方程式。

与此同时，谷歌 DeepMind 最近推出了AlphaProof 和 AlphaGeometry 2，这两款人工智能系统专为形式数学推理而设计。谷歌表示，这两个系统解决了国际数学奥林匹克竞赛六道题中的四道，这样的成绩足以让他在这项享有盛誉的比赛中获得银牌。

在有关OpenAI 草莓的报道的同时，关于人工智能无法拼写“草莓”的表情包也在流传，这有点像恶搞。但 OpenAI 首席执行官 Sam Altman 抓住机会向我们展示了他的花园中浆果的产量相当可观。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/wei-shen-me-ren-gong-zhi-neng-wu-fa-pin-xie-cao-mei

Like (0)

王浩然作者

0 0

Perplexity AI 评论：彻底抛弃 Google 和 ChatGPT 吗？

Previous 2024年8月28日下午4:20

日历工具 Clockwise 增加了名为 Prism 的全新 AI 界面

Next 2024年8月28日下午7:48

AI前沿

DeepSeek宣称其理论利润率可高达545%‌

DeepSeek，一家专注于数据分析和人工智能技术的创新企业，近日公布了一项重大技术进展。该公司声称，其最新的解决方案能够实现高达545%的理论利润率，这一惊人数字在行业内引起了广…

王浩然
2025年3月3日
000
AI前沿

亚马逊推出用于生成文本、图像和视频的 Nova AI 模型系列

作为世界上最大的科技公司之一，亚马逊在正在进行的生成式人工智能竞赛中的地位主要集中在构建其开发工具和平台上，以及为初创公司 Anthropic 提供大量资金。但现在情况已不再如此…

王浩然
2024年12月4日
000
AI前沿

Numeric 获 2800 万美元 A 轮融资，利用人工智能实现会计自动化

会计师通常害怕月末和季末结账。这是因为确定特定时期的财务记录通常需要手动操作，容易出错，而且耗时。 2020 年，帕克·吉尔伯特（上图中间）厌倦了在一家早期创业公司管理…

点点
2024年10月13日
000
AI前沿

我们终于对开源人工智能有了“官方”定义

开源人工智能终于有了“官方”定义。开放源代码促进会 (OSI) 是一家长期存在的机构，旨在定义和“管理”所有开源事物，今天发布了其开放源代码 AI 定义 (OSAID) 1.0 …

王浩然
2024年10月29日
000
AI前沿

推理框架 Archon 有望加快 LLM 进程，且无需额外成本

斯坦福大学扩展智能实验室的研究人员介绍了一种新的推理框架，可以帮助大型语言模型 (LLM) 更快地处理潜在的响应。该框架 Archon 使用推理时间架构搜索 (ITAS) 算法…

王浩然
2024年10月3日
000
AI前沿

Meta 提出新的可扩展记忆层，可提高知识水平并减少幻觉

随着企业继续在各种应用中采用大型语言模型 (LLM)，他们面临的关键挑战之一是提高模型的事实知识并减少幻觉。在一篇新论文中，Meta AI的研究人员提出了“可扩展的内存层”，这可能…

王浩然
2025年1月8日
000
AI前沿

苹果 16 英寸 MacBook Pro（M4 Pro）评测：强大的台式机替代品

周一，彭博社报道了苹果公司全面改革其笔记本电脑产品线的计划。这正是那种在新款 MacBook Pro 发布和上市之间的一周内你不想听到的谣言。深入研究后发现，计划中的改革将在 20…

王浩然
2024年11月8日
000
AI前沿

这款“AI Granny”黑客利用无聊的闲聊浪费电话诈骗者的时间

电话诈骗并不是什么新鲜事，但随着人工智能的出现，人们比以往任何时候都更难知道他们正在通话的人是否是他们所说的那个人。但英国移动网络 O2 正在扭转局面，创造了所谓的“人工智能奶奶”…

王浩然
2024年11月17日
000
AI前沿

Automattic 为员工提供了另一次辞职机会——这次的遣散费为 9 个月

Automattic 首席执行官马特·穆伦维格 (Matt Mullenweg) 向有意离职的员工提供为期六个月的遣散费，几天后， 159 人接受了这一提议。10 月 16 日晚，…

王浩然
2024年10月24日
000
AI前沿

Anthropic 首席执行官发表 15,000 字赞颂人工智能，充满技术乐观主义

Anthropic 首席执行官 Dario Amodei 希望你知道，他并不是人工智能“末日论者”。至少，这是我对 Amodei 上周五晚间在其博客上发表的一篇约 15,000 …

点点
2024年10月13日
000
AI前沿

YouTube 将使用人工智能生成创意、标题甚至完整视频

人工智能在谷歌的整个产品组合中都大行其道，YouTube 也采用了该公司的一些最新技术来帮助创作者进行创作。周三，在纽约市举行的 Made on YouTube 活动上，该公司宣布…

王浩然
2024年9月20日
000
AI前沿

Meta 发布了谷歌播客生成器的“开放”版本

Meta 发布了Google NotebookLM 中病毒式生成播客功能的“开放”实现。该项目名为NotebookLlama，不出所料，它使用 Meta 自己的Llama模型进行…

王浩然
2024年10月28日
000
AI前沿

IBM 研究：大多数 CEO 担心人工智能的准确性和偏见

根据 IBM 商业价值研究院关于人工智能治理的最新调查，近一半的首席执行官担心人工智能的准确性和偏见。 IBM 商业价值研究院针对人工智能治理的最新调查还发现，21% 的高管表示其…

王浩然
2024年11月8日
000
AI前沿

大模型拉新大战，Kimi竟然不是赢家？揭秘背后真相

2024年以来，大模型厂商在各大平台开启了烧钱大战，大模型广告铺天盖地，从线上甚至烧到了地铁、机场广告牌，动辄上亿的成本背后，留存依旧是各大大模型厂商的一道难关。今年以来，大模型…

点点
2024年9月9日
000
AI前沿

OpenAI 推出具有图像上传和分析功能的完整 o1 模型，并首次推出 ChatGPT Pro

OpenAI 已正式推出其o1 模型，该模型已从预览版过渡到 ChatGPT 平台的核心功能。现在，它还可以分析图像——这是一项非常有用的功能升级，因为它使用户能够上传照片并让 A…

王浩然
2024年12月6日
000
AI前沿

Lapsi 正在重新启动听诊器作为健康跟踪数据平台

医疗技术消费化正在继续：总部位于阿姆斯特丹的初创公司Lapsi Health刚刚获得 FDA 对其首款临床支持工具——数字听诊器的批准。美国医疗器械监管机构食品药品管理局已将其列为…

王浩然
2024年10月1日
000
AI前沿

保卫陷入困境的 SOC：抵御对抗性 AI 攻击

77%的企业已成为对抗性 AI 攻击的受害者，而电子犯罪分子的突破时间仅用了2 分 7 秒，创下了历史记录。问题不在于您的安全运营中心 (SOC) 是否会成为攻击目标，而是何时成为…

王浩然
2024年12月10日
000
AI前沿

AI 女友就是一个陷阱

作为对 GPT-4o 的回应，谷歌在 8 月发布了 Gemini Live，试图让 AI 助手可以像真人一样对话。这个新助手的对话效果是如此之好，以至于让外媒记者 Joanna S…

点点
2024年9月3日
000
AI前沿

Lightmatter 获得 4 亿美元融资，AI 超大规模企业对光子数据中心充满期待

光子计算初创公司Lightmatter已筹集 4 亿美元，旨在突破现代数据中心的一个瓶颈。该公司的光学互连层可让数百个 GPU 同步工作，从而简化了昂贵而复杂的 AI 模型训练和运…

王浩然
2024年10月17日
000
AI前沿

Han Heloir，MongoDB：可扩展数据库在人工智能应用中的作用

随着数据管理变得越来越复杂，现代应用程序扩展了传统方法的功能，人工智能正在彻底改变应用程序的扩展。除了将操作员从需要仔细监督和额外资源的过时、低效方法中解放出来之外，AI 还可以…

点点
2024年10月1日
000

发表回复

Please Login to Comment

为什么人工智能无法拼写“草莓”

相关推荐

发表回复

Share To :