人工智能空想性错视：机器能够识别无生命物体中的面孔吗？

点点 • 2024年10月3日下午5:00 • AI前沿 • 163 views

新的“虚幻”面部数据集揭示了人类和算法面部检测之间的差异、与动物面部识别的联系以及预测人们最常感知面部的位置的公式。

1994 年，佛罗里达州珠宝设计师戴安娜·杜伊瑟在一块烤奶酪三明治中发现了她认为是圣母玛利亚的形象，她保存了下来，后来以 28,000 美元的价格拍卖。但我们对空想性错视（即在物体中看到人脸和图案但实际上并不存在的情况）到底了解多少呢？

麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的一项新研究深入研究了这一现象，引入了一个包含 5,000 张幻想性错觉图像的庞大的人工标记数据集，远远超过了以前的收集量。利用这个数据集，该团队发现了一些令人惊讶的结果，这些结果与人类和机器感知之间的差异有关，以及看到一片面包中的面孔的能力如何挽救了你远房亲戚的生命。

“面部幻想性错觉长期以来一直让心理学家着迷，但在计算机视觉界，它基本上还没有被探索过，”麻省理工学院电气工程和计算机科学博士生、CSAIL 附属机构、这项研究的首席研究员马克·汉密尔顿 (Mark Hamilton) 说道。“我们希望创建一种资源，帮助我们了解人类和人工智能系统如何处理这些虚幻的面孔。”

那么，所有这些假面孔揭示了什么呢？首先，人工智能模型似乎无法像我们一样识别幻想性错觉面孔。令人惊讶的是，研究小组发现，直到他们训练算法识别动物面孔后，算法在检测幻想性错觉面孔方面才有了显著提高。这种意想不到的联系暗示了我们识别动物面孔的能力（这对生存至关重要）与我们在无生命物体中看到面孔的倾向之间可能存在进化联系。“这样的结果似乎表明，幻想性错觉可能不是源于人类的社会行为，而是源于更深层次的东西：比如快速发现潜伏的老虎，或者识别鹿的方向，以便我们的原始祖先可以狩猎，”汉密尔顿说。

另一个有趣的发现是研究人员所谓的“幻想性错视的金发姑娘区”，这是一类最容易发生幻想性错视的图像。麻省理工学院电气工程和计算机科学教授、该项目首席研究员威廉·T·弗里曼 (William T. Freeman) 表示：“在特定的视觉复杂度范围内，人类和机器最有可能在非面部物体中感知到面部。”“太简单了，就没有足够的细节来形成一张脸。太复杂了，就会变成视觉噪音。”

为了揭示这一现象，该团队开发了一个方程，用于模拟人类和算法如何检测虚假面孔。在分析这个方程时，他们发现了一个明显的“幻想性峰值”，即看到面孔的可能性最高，对应于复杂度“恰到好处”的图像。随后，这一预测的“金发姑娘区”在真实人类受试者和 AI 人脸检测系统的测试中得到了验证。

这个名为“事物中的面孔”的新数据集，远远超过了之前通常仅使用 20-30 个刺激物的研究。这种规模使研究人员能够探索最先进的人脸检测算法在对幻想性人脸进行微调后的表现，表明这些算法不仅可以编辑来检测这些面孔，而且它们还可以充当我们大脑的硅替代品，使团队能够提出和回答关于幻想性人脸检测起源的问题，而这些问题在人类身上是不可能提出的。

为了建立这个数据集，该团队从 LAION-5B 数据集中挑选了大约 20,000 张候选图像，然后由人类注释者对这些图像进行细致的标记和判断。这个过程包括在感知到的面孔周围绘制边界框，并回答有关每张面孔的详细问题，例如感知到的情绪、年龄以及面孔是无意的还是故意的。“收集和注释数千张图像是一项艰巨的任务，”汉密尔顿说。 “大部分数据集的存在都要归功于我的妈妈”，她是一名退休银行家，“她花了无数的时间精心标记图像以供我们分析。”

这项研究还可能通过减少误报来改进人脸检测系统，这可能对自动驾驶汽车、人机交互和机器人等领域产生影响。数据集和模型还可以帮助产品设计等领域，在这些领域，理解和控制幻想性错觉可以创造出更好的产品。“想象一下，能够自动调整汽车或儿童玩具的设计，使其看起来更友好，或者确保医疗设备不会无意中显得具有威胁性，”汉密尔顿说。

“人类本能地将无生命物体与人类特征联系起来，这真是令人着迷。例如，当你瞥了一眼电源插座时，你可能会立即想象它在唱歌，你甚至可以想象它会如何‘动嘴唇’。然而，算法无法像我们一样自然地识别这些卡通面孔，”汉密尔顿说。“这引发了一些有趣的问题：是什么导致了人类感知和算法解释之间的差异？空想性错视是有益还是有害？为什么算法不会像我们一样体验到这种效果？这些问题引发了我们的调查，因为这种人类经典的心理现象在算法中尚未得到彻底探索。”

当研究人员准备与科学界分享他们的数据集时，他们已经开始展望未来。未来的工作可能涉及训练视觉语言模型来理解和描述幻想性面部表情，从而有可能让人工智能系统能够以更像人类的方式与视觉刺激互动。

“这是一篇令人愉快的论文！读起来很有趣，让我思考。汉密尔顿等人提出了一个诱人的问题：为什么我们会在物体中看到面孔？”加州理工学院艾伦·E·帕克特电气工程教授皮埃特罗·佩罗纳 (Pietro Perona) 说，他没有参与这项研究。“正如他们指出的那样，从包括动物面孔在内的例子中学习只能解释这一现象的一半。我敢打赌，思考这个问题会让我们学到一些重要的东西，关于我们的视觉系统如何在生活中接受的训练之外进行推广。”

Hamilton 和 Freeman 的合著者包括丰田研究所研究员 Simon Stent、脑与认知科学系首席研究员、NVIDIA 研究科学家、前 CSAIL 成员 Ruth Rosenholtz、CSAIL 附属机构博士后 Vasha DuTell、Anne Harrington MEng ’23 和研究科学家 Jennifer Corbett。他们的工作部分得到了美国国家科学基金会和 CSAIL MEnTorEd 研究机会 (METEOR) 奖学金的支持，同时得到了美国空军研究实验室和美国空军人工智能加速器的赞助。麻省理工学院超级云和林肯实验室超级计算中心为研究人员的成果提供了 HPC 资源。

这项工作将于本周在欧洲计算机视觉会议上发表。

原创文章，作者：点点，如若转载，请注明出处：https://www.dian8dian.com/ren-gong-zhi-neng-kong-xiang-xing-cuo-shi-ji-qi-neng-gou

人工智能人工智能实验室幻想性峰值超级计算中心

Like (0)

点点

0 0

人工智能模拟让人们看见未来的你

Previous 2024年10月3日下午4:00

为什么 ChatGPT 的数学这么差？

Next 2024年10月3日下午6:00

AI前沿

薪资初创公司 Warp 与发表白人至上言论的“关联公司”断绝关系

Warp是纽约的一家年轻的薪资初创公司，由于与该公司关联的一个账户发布了一些有争议的帖子而备受关注。周四，一个名为维托里奥 (Vittorio) 的账户在 X 上发帖称，“我更喜…

点点
2024年9月8日
000
AI前沿

Nvidia 的“Eagle”人工智能以超高清视角看世界，它将取代你的工作

Nvidia 的研究人员推出了“ Eagle ”，这是一组新的人工智能模型，可以显著提高机器理解和与视觉信息交互的能力。该项研究发表在 arXiv 上，展示了从视觉问答到文档理解…

王浩然
2024年9月3日
000
AI前沿

微软刚刚开发出一款设计未来材料的人工智能：它的工作原理如下

微软研究院今天推出了一个强大的新型人工智能系统，该系统可以生成具有特定所需特性的新型材料，有可能加速更好的电池、更高效的太阳能电池和其他关键技术的开发。该系统名为MatterGe…

王浩然
2025年1月19日
000
AI前沿

Snowflake Build：关于 Cortex AI 的 4 大公告及更多内容

在今年的年度BUILD大会上，数据架构巨头 Snowflake 全力以赴为客户提供先进的功能，包括一些长期预览的功能，以便轻松调动他们的数据集来构建和共享强大的 AI 应用程序。 …

王浩然
2024年11月17日
000
AI前沿

佳士得宣布人工智能艺术品拍卖，但并非所有人都满意

艺术品拍卖行佳士得此前曾出售过人工智能生成的艺术品。但很快，佳士得计划举办首场专门展示人工智能创作作品的展览，这一消息引发了褒贬不一的评价。佳士得将此次拍卖称为“增强智能”，拍卖…

王浩然
2025年2月10日
000
AI前沿

马斯克对 OpenAI 的修改后诉讼将微软列为被告

埃隆·马斯克对 OpenAI 提起的诉讼指控该公司放弃了非营利使命，该诉讼于 7 月撤回，但8 月又重新提起。现在，在一份修改后的诉状中，该诉讼将微软、LinkedIn 联合创始人…

王浩然
2024年11月16日
000
AI前沿

平台工程：简化现代软件开发

随着我们加速迈向工业 4.0，数字化转型以前所未有的水平重塑了企业。如今，组织面临着更快、更可靠、更大规模地交付软件的巨大压力。云环境的日益复杂以及对无摩擦客户体验的需求不断增加…

点点
2024年11月5日
000
AI前沿

Anthropic 聘请 OpenAI 联合创始人 Durk Kingma

Durk Kingma 是 OpenAI 鲜为人知的联合创始人之一，今天他宣布将加入 Anthropic。在 X 的一系列帖子中，Kingma 透露他将主要在荷兰（他常驻的地方）…

大龄程序员
2024年10月2日
000
AI前沿

AlphaProteo：谷歌DeepMind的蛋白质设计革命

AlphaProteo的出现，意味着我们对蛋白质结构和功能的理解和设计能力，又迈出了一大步。DeepMind团队通过这个系统，展示了他们在蛋白质折叠预测领域的最新进展。

点点
2024年9月7日
000
AI前沿

合成数据的前景与风险

有可能仅使用另一个人工智能生成的数据来训练一个人工智能吗？这听起来可能有点荒唐。但这个想法已经存在了相当长一段时间——而且随着新的真实数据越来越难获得，这种想法越来越受到关注。 A…

王浩然
2024年10月14日
000
AI前沿

人工智能视觉搜索登陆 iPhone

该公司在周一的 Apple Event 2024 上宣布，视觉搜索即将登陆 iPhone，由苹果的 AI 功能套件 Apple Intelligence 提供支持。相机控制是iP…

王浩然
2024年9月10日
000
AI前沿

这款开源 AI 工具仅用一天时间就开发完成，即将用于 Google 的 NotebookLM

新加坡政府科技局的数据科学家Gabriel Chua创建了一个开源软件，与谷歌日益流行的NotebookLM竞争。这个被称为“ Open NotebookLM ”的系统，蔡美儿仅…

王浩然
2024年10月3日
000
AI前沿

图形数据库军备竞赛：微软及其竞争对手如何彻底改变网络安全

随着民族国家和资金雄厚的网络犯罪攻击团伙试图利用数字资产防御的巨大漏洞，多域攻击即将成为一种数字流行病。企业不得不应对企业资产、应用程序、系统、数据、身份和终端之间不断扩大且往往未…

王浩然
2024年11月23日
000
AI前沿

长期政策研究员 Miles Brundage 离开 OpenAI

OpenAI 长期政策研究员、公司 AGI 准备团队高级顾问 Miles Brundage 已离职。布伦戴奇在周三 X 上的一篇文章以及他的时事通讯中的一篇文章中表示，他认为作为…

王浩然
2024年10月25日
000
AI前沿

Apple Intelligence 在 iOS 18.1 首次发布时更注重便利性

经过大肆宣传，该公司的 AI 功能套件Apple Intelligence终于在本周随 iOS 18.1 更新向用户发布。我通过测试版软件使用了这些功能几个月，意识到本周推出的功能…

王浩然
2024年10月30日
000
AI前沿

人工智能是老年人口更安全、更独立的关键

人工智能正在应用于解决全球范围内的各类问题，其中包括保障老年人年老时的安全。绝大多数老年人都希望独立生活：92% 的老年人表示他们更愿意在目前的家中度过晚年。事实上，能够按照自己…

王浩然
2024年12月27日
000
AI前沿

Spotify携手Eleven Labs，拓展AI有声读物库

近日，全球领先的流媒体音乐服务平台Spotify宣布与Eleven Labs达成合作，旨在进一步扩大其AI有声读物库的规模。此次合作标志着Spotify在音频内容领域的又一重要布局…

王浩然
2025年2月24日
000
AI前沿

谷歌购物标签新增AI工具：根据你的时尚理念推荐相似服饰‌

在追求个性化时尚的道路上，谷歌近日为其购物标签（Shopping Tab）增添了一位得力助手——一款创新的AI工具。这款工具能够捕捉你的时尚灵感，并将其转化为具体的服饰推荐，让你的…

王浩然
2025年3月8日
000
AI前沿

谷歌的 NotebookLM 现在可让你指导 AI 播客的主持人

Google 的 NotebookLM 现在允许您自定义其类似播客的音频概览。在使用笔记应用发起讨论之前，您可以向 AI 主持人发出指示，告诉他们您希望他们关注什么主题，甚至可以针…

王浩然
2024年10月20日
000
AI前沿

OpenAI发布Responses API与开源Agents SDK：赋能开发者打造个性化深度研究与运营工具

在人工智能技术日新月异的今天，OpenAI再次迈出重要一步，推出了Responses API与开源Agents SDK。这两项创新成果不仅为开发者提供了更为灵活和强大的工具，还极大…

王浩然
2025年3月16日
000

发表回复

Please Login to Comment

人工智能空想性错视：机器能够识别无生命物体中的面孔吗？

相关推荐

发表回复

Share To :