Dario Amodei 质疑 DeepSeek 600 万美元的 AI 说法：Anthropic 对中国最新 AI 举措有何看法

王浩然 • 2025年2月3日下午4:00 • AI前沿 • 63 views

上周，中国人工智能初创公司DeepSeek宣布其最新语言模型 DeepSeek-R1 震惊了人工智能界。该模型似乎可以与领先的美国人工智能系统相媲美，但成本却只有后者的一小部分。这一消息引发了市场大规模抛售，导致英伟达市值蒸发近 2000 亿美元，并引发了关于人工智能发展未来的激烈争论。

很快出现的说法表明，DeepSeek 从根本上颠覆了构建先进 AI 系统的经济性，据称仅用 600 万美元就实现了美国公司花费数十亿美元才实现的目标。这种解释在硅谷引起了轩然大波，OpenAI、Anthropic和谷歌等公司都在计算基础设施方面进行了大规模投资，以保持其技术优势。

但在市场动荡和令人窒息的头条新闻中，Anthropic 联合创始人、当今大型语言模型 (LLM) 背后的先驱研究人员之一Dario Amodei发表了一篇详细分析文章，对 DeepSeek 的成就提供了更细致入微的视角。他的博客文章打破了这种歇斯底里的局面，提供了一些关于 DeepSeek 实际成就及其对未来 AI 发展意义的重要见解。

以下是 Amodei 分析的四个关键见解，它们重塑了我们对 DeepSeek 公告的理解。

1. “600 万美元模式”的叙述忽略了关键背景

Amodei 表示， DeepSeek 报告的开发成本需要从更广阔的角度来看待。他直接挑战了流行的解释：

“DeepSeek 不会‘以 600 万美元完成美国 AI 公司花费数十亿美元完成的任务’。我只能代表 Anthropic 发言，但 Claude 3.5 Sonnet 是一个中型模型，训练成本高达数千万美元（我不会给出确切数字）。此外，3.5 Sonnet 的训练方式并未涉及更大或更昂贵的模型（与一些传言相反）。”

这一令人震惊的发现从根本上改变了人们对 DeepSeek 成本效益的看法。考虑到Sonnet是在 9-12 个月前训练的，并且在许多任务上仍然优于 DeepSeek 的模型，这一成就似乎更符合人工智能开发成本的自然发展，而不是革命性的突破。

时机和背景也很重要。根据 AI 开发成本降低的历史趋势（Amodei 估计每年大约降低 4 倍），DeepSeek 的成本结构似乎在很大程度上符合趋势，而不是大幅领先。

2. DeepSeek-V3，而不是 R1，才是真正的技术成就

尽管市场和媒体高度关注DeepSeek 的 R1 型号，但 Amodei 指出，该公司更重要的创新来得更早。

“ DeepSeek-V3实际上是真正的创新，一个月前就应该引起人们的注意（我们确实注意到了）。作为预训练模型，它似乎在一些重要任务上的表现接近美国最先进的模型，而训练成本却大大降低。”

V3 和 R1 之间的区别对于理解 DeepSeek 真正的技术进步至关重要。V3 代表了真正的工程创新，特别是在管理模型的“键值缓存”和突破专家混合(MoE) 方法的界限方面。

这一见解有助于解释为什么市场对 R1 的激烈反应可能是错误的。R1 本质上是在 V3 的基础上添加了强化学习功能——目前多家公司正在对其模型采取这一措施。

3. 企业总投资呈现不同面貌

Amodei 的分析中最能说明问题的方面或许是 DeepSeek 对人工智能开发的整体投资。

“据报道——我们无法确定这是真的——DeepSeek 实际上拥有50,000 块 Hopper 代芯片，我猜这大约是美国主要 AI 公司所拥有芯片数量的 2-3 倍。这 50,000 块 Hopper 芯片的成本约为 10 亿美元。因此，DeepSeek 作为一家公司的总支出（不同于训练单个模型的支出）与美国 AI 实验室并没有太大差别。”

这一发现极大地改变了人们对 DeepSeek 资源效率的看法。虽然该公司可能在单个模型训练方面取得了令人印象深刻的成果，但其在 AI 开发方面的整体投资似乎与美国同行大致相当。

模型训练成本与企业总投资之间的差异凸显了大量资源在人工智能开发中持续的重要性。这表明，虽然工程效率可以提高，但要在人工智能领域保持竞争力仍需要大量的资本投入。

4. 当前的“交叉点”是暂时的

Amodei 将人工智能发展的当前时刻描述为独特而短暂的。

“因此，我们正处于一个有趣的‘交叉点’，暂时有几家公司可以制作出良好的推理模型，”他写道。“随着每个人都进一步提升这些模型的扩展曲线，这种情况将很快不再存在。”

这一观察为理解当前人工智能竞争的现状提供了重要的背景。多家公司在推理能力上取得类似成果的能力只是暂时现象，而不是新的现状。

这对人工智能发展的未来意义重大。随着各家公司不断扩大其模型，特别是在资源密集型的强化学习领域，该领域很可能会再次根据谁能在培训和基础设施上投入最多而出现分化。这表明，虽然 DeepSeek 取得了令人印象深刻的里程碑，但它并没有从根本上改变高级人工智能发展的长期经济状况。

构建人工智能的真正成本：Amodei 的分析揭示了什么

Amodei 对 DeepSeek 成就的详细分析打破了数周来的市场猜测，揭示了构建先进 AI 系统的实际经济效益。他的博客文章系统地消除了 DeepSeek 宣布后引发的恐慌和热情，展示了该公司 600 万美元的模型训练成本如何适应 AI 发展的稳步发展。

市场和媒体倾向于简单的叙述，而一家中国公司大幅削减美国人工智能开发成本的故事令人无法抗拒。然而，Amodei 的细分揭示了一个更复杂的现实：DeepSeek 的总投资，尤其是其在计算硬件方面的 10 亿美元，与美国同行的支出相当。

美国和中国人工智能开发成本持平的时刻标志着 Amodei 所说的“交叉点”——一个多家公司可以取得类似成果的临时窗口。他的分析表明，随着人工智能能力的提高和培训需求的增加，这个窗口将会关闭。该领域很可能会重新青睐拥有最深厚资源的组织。

打造先进的人工智能仍是一项耗资巨大的工程，而 Amodei 的仔细分析表明，衡量其真实成本需要全面考察投资范围。他对 DeepSeek 成就的系统分析最终可能比最初引发市场动荡的声明更为重要。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/dario-amodei-zhi-yi-deepseek-600-wan-mei-yuan-de-ai-shuo-fa

Like (0)

王浩然作者

0 0

DeepSeek 有助于加速威胁检测，但同时也引发了国家安全担忧

Previous 2025年2月3日

Pig API：为您的 AI 代理提供虚拟桌面以自动化 Windows 应用程序

Next 2025年2月4日

AI前沿

大型科技公司产生的核废料将去往何处

缅因州威斯卡西特（人口 3,742）有一块田地，由武装警卫把守。田地上是一道铁丝网围栏，围着一块混凝土垫。垫子上有 60 个水泥和钢罐，里面装有 1,400 根用过的核燃料棒，这些…

王浩然
2024年12月23日
000
AI前沿

从AI代理的热潮到实践：为何企业必须重视适用性而非盲目追求

随着我们全面步入自主转型的时代，AI代理正在重塑企业的运营方式和价值创造途径。然而，在数百家声称提供“AI代理”的供应商中，我们如何穿透炒作迷雾，理解这些系统真正能够实现的成果，以…

王浩然
4天前
000
AI前沿

AI编程助手并非万能解决方案

近期的一份报告显示，人工智能（AI）编程助手虽然在一定程度上提高了编程效率，但并非所有编程问题的万能解决方案。这一结论基于对当前市场上主流AI编程助手功能的深入分析，以及对开发者实…

王浩然
2025年2月25日
000
AI前沿

亚马逊据传成立全新自主智能AI团队‌

近期，有消息称全球电商巨头亚马逊正悄然布局人工智能领域，秘密组建了一个专注于自主智能技术的新团队。这一举动标志着亚马逊在AI赛道上的又一次重要发力，旨在通过技术创新推动公司业务的多…

王浩然
2025年3月6日
000
AI前沿

薪资初创公司 Warp 与发表白人至上言论的“关联公司”断绝关系

Warp是纽约的一家年轻的薪资初创公司，由于与该公司关联的一个账户发布了一些有争议的帖子而备受关注。周四，一个名为维托里奥 (Vittorio) 的账户在 X 上发帖称，“我更喜…

点点
2024年9月8日
000
AI前沿

代理人工智能与空间计算的融合是否会在人工智能革命中增强人类能动性？

随着人工智能竞赛的起起伏伏继续吸引着商界领袖、投资者和媒体的注意力，最令人兴奋的新兴创新之一是代理人工智能和空间计算，它们将重新定义我们与数字系统和物理环境的互动方式。Gartne…

王浩然
2025年1月14日
000
AI前沿

谷歌发布SpeciesNet，一款专为野生动物识别设计的AI模型‌

近日，科技巨头谷歌宣布了一项创新成果——SpeciesNet，这是一款专为野生动物识别任务设计的先进AI模型。SpeciesNet的问世，标志着谷歌在自然保护与生物多样性研究领域迈…

王浩然
2025年3月4日
000
AI前沿

人工智能与人工智能：权威手机数据如何帮助预防人工智能欺诈

人工智能（AI）与任何其他技术一样，本质上没有好坏之分——它仅仅是人们可以用于正当或恶意目的的工具。例如，许多公司在语音和面部识别中使用人工智能生物识别解决方案来简化登录流程，并…

点点
2024年9月28日
000
AI前沿

向分子世界的视频生成模型迈进

新系统从模拟中的单个帧开始，使用生成式人工智能模拟分子的动态，连接静态分子结构并将模糊的图片开发成视频。随着生成式人工智能模型能力的不断增强，您可能已经看到它们如何将简单的文本提…

王浩然
2025年1月27日
000
AI前沿

谷歌日历新增Gemini面板，助力日程管理‌

近日，谷歌在其广受欢迎的日历应用中引入了一项创新功能——Gemini面板。这一新面板旨在为用户提供更为便捷、高效的日程管理方式，从而帮助用户更好地规划日常生活和工作。 Gemini…

王浩然
2025年3月10日
000
AI前沿

AI驱动的更加个性化的Siri被推迟发布‌

近期，苹果公司宣布了一个令人意外的消息：原定于近期推出的AI驱动的更加个性化的Siri版本将延期发布。这一决定引发了广泛关注和讨论。据悉，新款Siri在个性化方面进行了大幅提升。…

王浩然
2025年3月10日
000
AI前沿

人工智能如何塑造民主对话的未来

在当今政治两极分化的世界中，在复杂的社会和政治问题上找到共同点变得越来越困难。随着社会变得越来越多元化，气候变化、移民和经济政策等关键问题上的分歧只会越来越大。让人们聚在一起就复杂…

点点
2024年11月5日
000
AI前沿

谷歌 GenAI 面临欧洲隐私风险评估审查

谷歌在欧盟的主要隐私监管机构已展开调查，以查明该公司在使用个人信息训练生成式人工智能方面是否遵守了欧盟的数据保护法。具体来说，它正在调查这家科技巨头是否需要进行数据保护影响评估（…

王浩然
2024年9月14日
000
AI前沿

【2024 CX报告】AI成客户体验王牌，成本却让人意外！

一份新报告显示，尽管企业将生成式人工智能(GenAI) 视为改变客户体验 (CX) 的关键因素，但许多企业仍为实施成本而苦恼。该研究结果来自 CallMiner 的《2024 年客…

点点
2024年9月11日
000
AI前沿

人形机器人在特斯拉 We Robot 活动上为客人提供饮料和聚会

伊隆·马斯克预测 Optimus 的最终售价将为 2 万至 3 万美元，低于一辆汽车的价格，这样每个家庭都可以买得起一辆

点点
2024年10月14日
011
AI前沿

Hugging Face 将 AI 视觉模型缩小至手机友好尺寸，大幅降低计算成本

Hugging Face在人工智能领域取得了令人瞩目的突破，推出了可以在智能手机等小型设备上运行的视觉语言模型，其性能优于需要庞大数据中心的前代模型。该公司的新款SmolVLM-…

王浩然
2025年1月25日
000
AI前沿

微软的新 Magentic-One 系统指挥多个 AI 代理完成用户任务

希望部署多个 AI 代理的企业通常需要实施一个框架来管理它们。为此，微软研究人员最近推出了一种名为Magentic-One 的新型多智能体基础设施，该基础设施允许单个 AI 模…

王浩然
2024年11月10日
000
AI前沿

CoreWeave创始人：在40亿美元IPO前夕，已入账4.88亿美元‌

随着科技行业的蓬勃发展，云计算领域再次迎来了一个令人瞩目的里程碑。CoreWeave，这家专注于高性能计算的云计算服务提供商，正站在40亿美元IPO（首次公开募股）的门槛上。而在此…

王浩然
2025年3月8日
000
AI前沿

随着数据中心使用率不断上升，Submer 筹集 5550 万美元以降低数据中心温度

人们竞相开发更好的芯片和数据中心容量来处理 AI 工作负载，但所有这些活动都存在一个问题。强大的处理能力意味着会产生大量热量，这对服务器的运行和环境都有重大影响。由于…

王浩然
2024年10月5日
000
AI前沿

利用 RAG 弥补人工智能领域的知识空白：提高性能的技术和策略

人工智能 (AI)彻底改变了我们与技术的互动方式，催生了虚拟助手、聊天机器人和其他能够处理复杂任务的自动化系统。尽管取得了这些进展，但即使是最先进的人工智能系统也面临着重大限制，即…

点点
2024年10月17日
000