什么是“模型崩溃”？专家解释有关即将到来的人工智能末日的谣言

AI评测师 • 2024年9月3日下午4:00 • 技术评测 • 122 views

人工智能预言家和新闻贩子们预测生成式人工智能炒作的终结，并谈论即将发生的灾难性的“模型崩溃”。

但这些预测有多现实？模型崩溃到底是什么？

“模型崩溃”这一概念在2023 年就被讨论过，但最近才开始流行，它指的是一种假设情景，即未来的人工智能系统由于互联网上人工智能生成的数据的增加而变得越来越愚蠢。

数据需求

现代人工智能系统是利用机器学习构建的。程序员设置了底层数学结构，但真正的“智能”来自于训练系统模仿数据中的模式。

但并非随便什么数据都可以。当前的生成式人工智能系统需要大量高质量数据。

为了获取这些数据，OpenAI、谷歌、Meta 和 Nvidia 等大型科技公司不断搜索互联网，收集数 TB 的内容来提供给机器。但自2022 年广泛可用且实用的生成式人工智能系统问世以来，人们越来越多地上传和分享部分或全部由人工智能制作的内容。

2023 年，研究人员开始怀疑是否可以只依赖人工智能创建的数据进行训练，而不是依赖人类生成的数据。

实现这一目标的动机非常强烈。除了在互联网上激增之外，人工智能制作的内容比人类数据获取成本要低得多。大规模收集人工智能制作的内容在道德和法律上也不存在任何问题。

然而，研究人员发现，如果没有高质量的人类数据，那么使用人工智能数据进行训练的人工智能系统会变得越来越笨，因为每个模型都会从前一个模型中学习。这就像近亲繁殖问题的数字版本。

这种“反复训练”似乎会导致模型行为的质量和多样性下降。这里的质量大致是指乐于助人、无害和诚实的某种组合。多样性是指反应的变化以及哪些人的文化和社会观点体现在人工智能输出中。

简而言之，过度使用人工智能系统，我们可能会污染最初使它们有用的数据源。

避免崩溃

大型科技公司难道不能过滤掉人工智能生成的内容吗？其实不然。科技公司已经花费了大量的时间和金钱来清理和过滤他们抓取的数据，一位业内人士最近分享说，他们有时会丢弃最初收集的用于训练模型的数据的90% 。

随着专门删除人工智能生成内容的需求增加，这些努力可能会变得更加艰巨。但更重要的是，从长远来看，区分人工智能内容实际上会变得越来越困难。这将使过滤和删除合成数据成为一场收益递减的游戏。

最终，迄今为止的研究表明，我们无法完全摆脱人类数据。毕竟，人工智能中的“I”就是从这里来的。

我们是否正走向一场灾难？

有迹象表明，开发人员已经不得不更加努力地获取高质量数据。例如， GPT-4 发布的文档赞扬了参与该项目数据相关部分的员工数量空前。

我们可能也快要用尽新的人类数据了。有人估计，人类生成的文本数据可能最早在 2026 年就耗尽。

这可能是 OpenAI 和其他公司竞相与Shutterstock、美联社和新闻集团等行业巨头建立独家合作关系的原因。他们拥有大量专有的人类数据，而这些数据在公共互联网上并不容易获得。

然而，模型灾难性崩溃的前景可能被夸大了。迄今为止，大多数研究都着眼于合成数据取代人类数据的情况。实际上，人类和人工智能数据可能会同时积累，从而降低崩溃的可能性。

未来最有可能出现的情况是，一个由各种不同的生成式人工智能平台组成的生态系统将被用于创建和发布内容，而不是单一的模型。这也增加了抵御崩溃的稳健性。

这对于监管机构通过限制人工智能领域的垄断来促进良性竞争、以及资助公益技术开发来说是一个很好的理由。

真正的担忧

过多的人工智能制作内容还会带来更隐蔽的风险。

大量合成内容可能不会对人工智能发展的进程构成生存威胁，但它确实威胁到（人类）互联网的数字公共利益。

例如，研究人员发现，在 ChatGPT 发布一年后，编码网站 StackOverflow 上的活动量下降了 16%。这表明人工智能辅助可能已经减少了一些在线社区中人与人之间的互动。

人工智能内容农场的过度生产也让寻找非充斥着广告的点击诱饵的内容变得更加困难。

越来越不可能准确区分人类生成的内容和人工智能生成的内容。补救措施之一是给人工智能生成的内容添加水印或标签，正如我和其他许多人最近强调的那样，这也反映在澳大利亚政府最近的临时立法中。

还有另一个风险。随着人工智能生成的内容变得系统性地同质化，我们有可能失去社会文化多样性，一些群体甚至可能经历文化抹杀。我们迫切需要对人工智能系统带来的社会和文化挑战进行跨学科研究。

人际交往和人类数据都很重要，我们应该保护它们。这不仅是为了我们自己，也许也是为了未来模型崩溃的潜在风险。

原创文章，作者：AI评测师，如若转载，请注明出处：https://www.dian8dian.com/shen-me-shi-mo-xing-beng-kui-zhuan-jia-jie-shi-you-guan-ji

Like (0)

AI评测师作者

0 0

反对人工智能艺术的案例

Previous 2024年9月3日下午3:00

联想泄露消息称，更便宜的 Copilot Plus 电脑将于本月上市

Next 2024年9月3日下午5:00

技术评测

如何使用 ChatGPT 编写 Excel 公式

并非每个人都是 Excel 电子表格专家，您可能并不总是知道如何为给定的数据集编写所需的公式。如果您无法找到适合您的数据和计算需求的正确公式，那么有一个新选项可以帮助您在几个步骤内…

王浩然
2024年9月14日
000
AI前沿

利用人类注意力可以改善人工智能生成的图像

来自中国的一项新研究提出了一种提高稳定扩散等潜在扩散模型（LDM）生成的图像质量的方法。该方法专注于优化图像的显著区域——最有可能吸引人类注意力的区域。新研究发现，显著性图（左…

点点
2024年10月17日
000
技术评测

Perplexity AI 评论：彻底抛弃 Google 和 ChatGPT 吗？

您是否厌倦了无休止地筛选似乎不合时宜的搜索结果？或者您是否对经常无法满足您的研究需求的AI 工具感到失望？人们很容易花费无数的时间浏览搜索结果，并与似乎很少能提供您所需内容的 A…

AI评测师
2024年8月28日
000
技术评测

三问AI手机：什么意图？怎么识别？何种框架？

意图识别框架上，正在酝酿一场从“以手机为中心”到“以人为中心”的交互之变

点点
2024年8月21日
010
技术评测

Phrasly 评论：它真的能让 AI 内容听起来像人类吗？

您是否想过，人工智能生成的内容是否真的听起来像人类？我最近遇到了Phrasly，事实证明，它可以将人工智能的效率与人类写作的真实性融为一体！在这篇 Phrasly 评论中，我将讨…

王浩然
2025年1月14日
000
技术评测

Pixtral 12B 现已上市：Mistral 的新型多模态 AI 可以无限制地分析图像

Mistral AI 终于进军多模态领域。今天，这家法国 AI 初创公司与 OpenAI 和 Anthropic 等公司展开竞争，发布了 Pixtral 12B，这是其首款同时具备…

王浩然
2024年9月15日
000
技术评测

苹果可能会在 2 月 11 日发布新款 iPhone SE 和 PowerBeats Pro 2

据彭博社报道，苹果最早可能在 2 月 11 日推出新款iPhone SE和PowerBeats Pro耳机。鉴于该公司尚未发出线下或线上活动的邀请，此次发布会的规模可能较小。新款…

王浩然
2025年2月10日
000
技术评测

Plaud NotePin 有望在其他可穿戴 AI 失败的地方取得成功

到目前为止，可穿戴 AI 的记录并不特别好。今年，我们已经看到 Humane（其备受诟病的 AI 别针背后的公司）在短短几个月内就破产了。Rabbit R1 的发布也遭遇了类似的负…

AI评测师
2024年9月2日
000
技术评测

三星新款笔记本电脑的人工智能功能实际上翻了一番

三星在新闻发布室发布了一篇帖子，宣布其最新的 Galaxy Book 型号 Galaxy Book5 Pro 360 将成为其首款新型“强力 AI PC”。这是一款Copilot+…

王浩然
2024年9月9日
000
技术评测

AI这个「狗头军师」，教年轻人说「土味情话」贼油腻

AI伊能静，专治「话题终结者」。娱乐圈中，伊能静绝对是情商王者。她曾在节目现场进行恋爱教学，被网友封为「行走的教科书」。比如，聊天时不要只讲动作，要表达情绪和需求。男生问：…

AI评测师
2024年9月12日
000
技术评测

为什么苹果在 iPhone 16 上又增加了一个按钮

苹果有得有失——尤其是在端口和按钮方面。长期以来，该公司对任何可能破坏其设备风水的细节都采取了“少即是多”的态度。如今，该公司对按钮的态度更加乐观。在 Apple Watch Ul…

王浩然
2024年9月10日
000
技术评测

在几秒钟内生成 AI 商业计划

你知道吗，23.2% 的新企业在第一年就倒闭了？因此，制定一个清晰、结构良好的计划对于跨越这一艰难的门槛至关重要。我最近偶然发现了 Upmetrics。这是一款基于云的业务规划工…

AI评测师
2024年11月5日
000
技术评测

Omnitron Sensors 的 MEMS 可以让自动驾驶汽车摆脱陀螺（同时降低成本）

生产 MEMS 传感器芯片的Omnitron Sensors已筹集 1300 万美元，用于为自动驾驶汽车制造廉价传感器。如果成功，我们就可以告别自动驾驶汽车顶部的大型旋转圆顶了。 …

王浩然
2025年2月3日
000
技术评测

【深度】OpenAI o1技术原理分析及产业影响

距离OpenAI发布o1模型已经过去一周，其口碑出现了明显的两极分化。一种声音认为o1的出现意味着人类距离AGI只有咫尺之遥，另一种声音认为o1又贵又不好使，其能力表现甚至不如G…

AI评测师
2024年9月25日
000
技术评测

Microsoft Copilot 现在可以发声，并能在互联网上“看到你所看到的内容”

您可能希望开始像对待工作一样对待您的网络浏览器，至少如果您想使用Microsoft 的全新 Copilot Vision 功能。据 Microsoft 执行副总裁 Yusuf Me…

王浩然
2024年10月4日
000
技术评测

Altered AI：用AI克隆声音，未来已来

作为内容创作者或自媒体专业人士，提供多样化、高质量的配音表演极具挑战性。无论是同时扮演多个角色还是管理紧张的预算，聘请配音演员的成本都会让您不堪重负。我最近遇到了Altered …

AI评测师
2024年9月7日
000
技术评测

通过换脸变身杰克·斯派洛

现在，内容创作者面临着比以往任何时候都更加强烈的快速高效地制作高质量视觉效果的需求。您是否知道，当今营销人员面临的两大内容营销挑战是制作高质量内容和持续生成此类内容？这并不奇怪，…

AI评测师
2024年10月11日
000
技术评测

Nvidia 刚刚发布了一款开源 LLM，与 GPT-4 竞争

Nvidia 是人工智能行业最抢手的 GPU制造商之一，该公司宣布已发布一个开源大型语言模型，据报道其性能可与OpenAI、Anthropic、Meta和谷歌等领先的专有模型相媲美…

点点
2024年10月4日
000
技术评测

亚马逊新款 Fire 平板电脑内置人工智能

亚马逊刚刚发布了一款新的 Fire HD 8 平板电脑，与 2024 年的许多新产品一样，生成式 AI 工具是主要新功能之一。但您不一定需要购买新的 Fire HD 8 才能试用它…

点点
2024年10月4日
000
技术评测

“还没实现”：Sora 的推出得到了 AI 电影制作人的褒贬不一的反应，理由是结果不一致、内容受限

在通过引人注目、栩栩如生的视频进行预览十个月后，OpenAI 终于在周一向公众发布了其 AI 视频生成器模型 Sora。然而，在此后的两天里，这款产品的首次亮相并不完美：早期采用…

王浩然
2024年12月12日
000