为什么 DeepSeek 的新 AI 模型认为它是 ChatGPT

王浩然 • 2024年12月29日下午8:00 • AI前沿 • 96 views

本周早些时候，资金雄厚的中国人工智能实验室 DeepSeek 发布了一款“开放”人工智能模型，该模型在热门基准测试中击败了许多竞争对手。该模型DeepSeek V3规模庞大但效率高，可以轻松处理编码和撰写论文等基于文本的任务。

它似乎也认为它是ChatGPT。

X上的帖子测试表明，DeepSeek V3 将自己标识为 ChatGPT，这是 OpenAI 的 AI 聊天机器人平台。当被要求详细说明时，DeepSeek V3 坚称它是 OpenAI于 2023 年发布的GPT-4模型的一个版本。

这种妄想根深蒂固。如果你向 DeepSeek V3 询问有关 DeepSeek API 的问题，它会告诉你如何使用OpenAI 的API。DeepSeek V3 甚至会讲一些与 GPT-4 相同的笑话——甚至包括笑点。

那么到底发生了什么？

ChatGPT 和 DeepSeek V3 等模型是统计系统。经过数十亿个示例的训练，它们会从这些示例中学习模式以进行预测 – 例如电子邮件中的“致谁”通常位于“可能涉及”之前。

DeepSeek 并未透露太多有关 DeepSeek V3 训练数据来源的信息。但包含 GPT-4 通过 ChatGPT 生成的文本的公开数据集并不缺乏。如果 DeepSeek V3 在这些数据集上进行训练，该模型可能已经记住了 GPT-4 的一些输出，现在正在逐字逐句地复述它们。

“显然，该模型在某个时候会看到来自 ChatGPT 的原始响应，但目前尚不清楚它在哪里，”伦敦国王学院专门研究人工智能的研究员迈克·库克 (Mike Cook) 表示。“这可能是‘偶然’……但不幸的是，我们已经看到有人直接用其他模型的输出来训练他们的模型，试图利用他们的知识。”

库克指出，使用竞争对手的人工智能系统的输出来训练模型的做法对模型质量“非常不利”，因为它可能导致幻觉和误导性答案，如上文所述。“就像复印一份复印件一样，我们会丢失越来越多的信息和与现实的联系，”库克说。

这也可能违反这些系统的服务条款。

OpenAI 的条款禁止其产品的用户（包括 ChatGPT 客户）使用输出来开发与 OpenAI 自己的模型竞争的模型。

OpenAI 和 DeepSeek 尚未立即回应置评请求。不过，OpenAI 首席执行官 Sam Altman在 X Friday发布了一篇看似嘲讽DeepSeek 和其他竞争对手的文章。

奥尔特曼写道：“复制你知道行得通的东西（相对）容易。当你不知道它是否会成功时，去做一些新的、有风险的、困难的事情是极其困难的。”

当然，DeepSeek V3 远非第一个自我识别错误的模型。谷歌的 Gemini 和其他模型有时会声称自己是竞争模型。例如，在普通话提示下，Gemini说它是中国公司百度的文心一言聊天机器人。

这是因为互联网（AI 公司获取大量训练数据的地方）正充斥着 AI垃圾。内容农场正在使用 AI 制作点击诱饵。机器人充斥着Reddit和X。据估计，到 2026 年，90% 的互联网内容可能由 AI 生成。

如果你愿意的话，这种“污染”使得从训练数据集中彻底过滤人工智能输出变得相当困难。

DeepSeek 完全有可能直接在 ChatGPT 生成的文本上训练 DeepSeek V3。毕竟，谷歌也曾被指控做过同样的事情。

非营利性机构 AI Now Institute 的首席人工智能科学家 Heidy Khlaaf 表示，无论风险如何，“提炼”现有模型知识所带来的成本节省对开发人员来说都很有吸引力。

“即使现在互联网数据中充斥着人工智能输出，其他意外训练 ChatGPT 或 GPT-4 输出的模型也未必会展示出类似 OpenAI 定制消息的输出，”Khlaaf 说道。“如果 DeepSeek 确实部分使用 OpenAI 模型进行提炼，那也不足为奇。”

然而，更有可能的是，大量 ChatGPT/GPT-4 数据进入了 DeepSeek V3 训练集。这意味着该模型无法被信任进行自我识别。但更令人担忧的是，DeepSeek V3 可能会通过不加批判地吸收和迭代 GPT-4 的输出，加剧该模型的一些偏见和缺陷。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/wei-shen-me-deepseek-de-xin-ai-mo-xing-ren-wei-ta-shi

Like (0)

王浩然作者

0 0

非营利组织加入伊隆·马斯克的行列，阻止 OpenAI 向营利性转型

Previous 2024年12月29日

OpenAI 制定营利转型计划

Next 2024年12月29日

AI前沿

微软的 GRIN-MoE AI 模型采用编码和数学，在关键基准测试中击败竞争对手

微软推出了一种突破性的人工智能模型GRIN-MoE（梯度知情混合专家模型），旨在提高编码和数学等复杂任务的可扩展性和性能。该模型有望通过一次选择性地激活一小部分参数来重塑企业应用程…

王浩然
2024年9月22日
000
AI前沿

Altman 花了 3 个亿巨资，证明「国家发钱」没有用

人工智能的风刮了两年，在 AI 普及之前，工作的「存在主义危机」先一步到来，互联网上关于人工智能何时能取代人的工作，能取代什么工作的讨论层出不穷。在人工智能的道德伦理边界的讨论上，…

点点
2024年10月7日
000
AI前沿

DeepSeek V3 在 Mac Studio 上的惊人表现：每秒 20 个标记，OpenAI 的噩梦？

在人工智能领域，技术的飞速发展正不断推动着边界的拓展。最近，一款名为 DeepSeek V3 的深度学习模型在 Mac Studio 上的表现引发了广泛关注。据悉，DeepSeek…

王浩然
2025年3月25日
000
AI前沿

阿里巴巴发布了一款“公开”挑战 OpenAI o1 推理模型的模型

一种新的所谓“推理”人工智能模型 QwQ-32B-Preview 已经问世。它是少数几个可以与 OpenAI 的o1相媲美的模型之一，也是第一个可以在宽松许可下下载的模型。 QwQ…

王浩然
2024年11月28日
000
AI前沿

Jony Ive 正在与 OpenAI 合作创办一家 AI 设备初创公司

五年前离开苹果全职职位的传奇设计师乔纳森·艾维 (Jony Ive)正在与 OpenAI 及其首席执行官萨姆·奥特曼 (Sam Altman) 合作创办一家新的创业公司。此次合作…

点点
2024年9月23日
000
AI前沿

Pika 2.0 继 Sora 之后推出，将用户自己的角色、物体和场景整合到新的 AI 视频中

Pika是一家总部位于帕洛阿尔托的初创公司，也是创造逼真的 AI 视频生成工具的早期领导者之一，它推出了最新的 AI 视频生成器模型 Pika 2.0，它称这是一次重大更新，承诺为…

王浩然
2024年12月16日
000
AI前沿

LlamaIndex 超越了 RAG，因此代理可以做出复杂的决策

流行的 AI 编排框架LlamaIndex引入了代理文档工作流 (ADW)，这是一种新架构，该公司表示，它超越了检索增强生成 (RAG) 流程并提高了代理的工作效率。随着编排框…

王浩然
2025年1月10日
000
AI前沿

人工智能行业研究：创纪录的增长背后隐藏着严峻挑战

由英国科学、创新和技术部(DSIT) 与Perspective Economics、Ipsos和glass.ai合作开展的一项全面的人工智能行业研究详细概述了该行业的现状及其未来前…

点点
2024年10月26日
000
AI前沿

在 OpenAI 推出 ChatGPT Search 几个小时前，谷歌刚刚授予其 AI 搜索访问权限

谷歌周四为其 Gemini AI 平台推出了实时搜索功能，使其语言模型能够访问来自谷歌搜索的当前信息。这项名为“ Grounding with Google Search ”的新功…

王浩然
2024年11月3日
000
AI前沿

如何利用冷硬数据科学来利用人工智能

有时很难区分技术的现实与每天轰炸我们收件箱的炒作和营销信息。例如，在过去五年里，我们可能听到了太多关于元宇宙、区块链和虚拟现实的信息。目前，我们正处于一场关于被滥用的术语“人工智能…

点点
2024年10月1日
000
AI前沿

Lambda 推出“推理即服务” API，宣称成本为人工智能行业最低

Lambda是一家成立 12 年的旧金山公司，以向机器学习研究人员以及 AI 模型构建者和训练人员按需提供图形处理单元 (GPU) 而闻名。但今天，该公司推出了Lambda In…

王浩然
2024年12月13日
000
AI前沿

人工智能公司与沃尔沃联手开发自动驾驶卡车

人工智能初创公司 Waabi正与沃尔沃合作，共同开发和大规模部署自动驾驶卡车。两家公司正在建立长期战略合作关系，他们表示这将加速自动驾驶卡车在美国各地的推广。根据该协议，…

王浩然
2025年2月8日
000
AI前沿

思科研究：公用事业公司采用人工智能实现更一体化的运营

根据思科的最新报告，近一半的公用事业公司希望人工智能将支持其运营中不可或缺的 IT 和运营技术 (OT) 功能之间的更好协作。该报告采访了 17 个国家的 145 名公用事业行业…

王浩然
2024年12月22日
000
AI前沿

Nvidia 的“Eagle”人工智能以超高清视角看世界，它将取代你的工作

Nvidia 的研究人员推出了“ Eagle ”，这是一组新的人工智能模型，可以显著提高机器理解和与视觉信息交互的能力。该项研究发表在 arXiv 上，展示了从视觉问答到文档理解…

王浩然
2024年9月3日
000
AI前沿

超级碗 LIX 网络安全策略：NFL 的 CISO 如何应对 AI 威胁和数字攻击

保护超级碗 LIX 和所有备受瞩目的国家橄榄球联盟 (NFL) 赛事免受可能包括武器化 AI、端点攻击、深度伪造和精细的社会工程技能在内的对抗性攻击，需要经验丰富、久经考验的能力和…

王浩然
2025年1月30日
000
AI前沿

解释：生成式人工智能对环境的影响

强大的生成式人工智能模型的快速开发和部署带来了环境后果，包括增加电力需求和水消耗。在由两部分组成的系列文章中，麻省理工学院新闻探讨了生成式人工智能对环境的影响。在本文…

王浩然
2025年1月27日
000
AI前沿

【划重点】数字人类对话，让员工培训逼真又高效！

员工培训对于适应职位和吸收公司文化至关重要；同样，它还能让人们学习新技能并在专业上成长。然而，当“员工培训”电子邮件出现在收件箱中时，为新公司工作或晋升到新职位的兴奋感就会消失殆尽…

点点
2024年9月11日
000
AI前沿

借助 Apple Intelligence，iPhone 用户最终将获得更好的 Siri

Siri 最终会变得有用吗？这是苹果今天在“Glowtime”活动上做出的承诺，该公司在活动中推出了iPhone 16 系列——这是首批搭载人工智能功能的新 iPhone，这要归功…

王浩然
2024年9月10日
000
AI前沿

人工智能领域的女性：Rebecca Portnoff 博士正在保护儿童免受有害的深度伪造行为的侵害

Rebecca Portnoff 博士接受采访，她是非营利组织 Thorn 的数据科学副总裁，该组织致力于开发保护儿童免受性虐待的技术。该系列报道旨在让专注于人工智能的女性学者和…

王浩然
2024年10月20日
000
AI前沿

IBM 量子计算机助力人工智能改善抗生素治疗

克利夫兰诊所的研究人员正在将量子计算与机器学习相结合，以预测尿路感染 (UTI) 最有效的抗生素治疗方法。该计划是首批将量子机器学习应用于医学的计划之一，旨在改善患者的治疗效果并…

王浩然
2025年1月12日
000

发表回复

Please Login to Comment

为什么 DeepSeek 的新 AI 模型认为它是 ChatGPT

相关推荐

发表回复

Share To :