
如果你还没听说过,那么现在城里出现了一颗新的人工智能明星:DeepSeek,香港量化分析公司 High-Flyer Capital Management 的子公司,本周早些时候发布了一种新的开源大型推理模型DeepSeek R1 ,在硅谷和世界各地引起了震动。该模型可与 OpenAI 最强大的可用模型 o1相媲美,而且对用户和公司本身(在训练时)而言,成本只是后者的一小部分。
虽然 DeepSeek R1 的出现已经重新洗牌了新 AI 模型市场,这个市场一向混乱不堪、瞬息万变、竞争激烈——前几个月,OpenAI 与 Anthropic 和 Google 争夺最强大的专有模型,而 Meta Platforms 经常与“足够接近”的开源竞争对手竞争——但这一次的不同之处在于,这个热门模型背后的公司位于中国,而中国是美国的地缘政治“亦敌亦友”,到目前为止,人们普遍认为中国的科技行业不如硅谷。
因此,它引起了美国和西方集团技术人员的忧虑和存在主义,他们突然开始怀疑 OpenAI 和大型科技公司的总体战略,即投入更多的资金和更多的计算资源(图形处理单元、GPU,通常用于训练 AI 模型的强大游戏芯片)来发明更强大的模型。
然而,一些西方科技领袖对于 DeepSeek 的快速崛起普遍表现出积极的公众反应。
开创性的 Mosaic 网络浏览器的共同发明人、Netscape 浏览器公司联合创始人、著名风险投资公司Andreessen Horowitz (a16z) 现任普通合伙人 Marc Andreessen今天在 X 上发帖称:“Deepseek R1 是我见过的最令人惊叹、最令人印象深刻的突破之一——作为开源,它是给世界的一份深刻礼物[机器人表情符号、敬礼表情符号]。”
Meta 基础人工智能研究 (FAIR) 部门首席人工智能科学家 Yann LeCun 在他的LinkedIn 帐户上发布了以下内容:
“对于那些看到 DeepSeek 的表现并认为:
‘中国在人工智能领域正在超越美国’的人来说,
你们读错了。
正确的解读是:
‘开源模型正在超越专有模型。’DeepSeek
受益于开放研究和开源(例如 Meta 的 PyTorch 和 Llama)。
他们提出了新的想法,并在其他人的工作基础上构建了这些想法。
因为他们的工作是公开的和开源的,所以每个人都可以从中受益。
这就是开放研究和开源的力量。”
甚至连 Meta AI 创始人兼首席执行官马克·“扎克”·扎克伯格 (Mark “Zuck” Zuckerberg) 似乎也在试图对抗 DeepSeek 的崛起,他在 Facebook 上发帖承诺,Facebook 开源 AI 模型家族 Llama 的新版本在今年某个时候发布时将成为“领先的最先进模型”。正如他所说:
“今年将是 AI 的决定性一年。到 2025 年,我预计 Meta AI 将成为服务超过 10 亿人的领先助手,Llama 4 将成为领先的先进模型,我们将培养一名 AI 工程师,开始为我们的研发工作贡献越来越多的代码。为了实现这一目标,Meta 正在建设一个 2GW+ 的数据中心,这个数据中心非常大,可以覆盖曼哈顿的很大一部分。我们将在 25 年上线约 1GW 的计算能力,到年底我们将拥有超过 130 万个 GPU。我们计划今年投资 600-650 亿美元,同时大幅扩大我们的 AI 团队,我们有资本在未来几年继续投资。这是一项巨大的努力,在未来几年,它将推动我们的核心产品和业务,释放历史性创新,并扩大美国的技术领先地位。让我们开始建设吧! ”
他甚至分享了一张图表,显示了他在帖子中提到的 2 千兆瓦数据中心与曼哈顿相重叠:

显然,尽管扎克伯格宣称致力于开源 AI,但他并不认为 DeepSeek 的效率优化方法(即利用比主要实验室少得多的 GPU)适合 Meta 或 AI 的未来。
但随着美国公司在新的人工智能基础设施上筹集和/或投入创纪录的资金,而许多专家指出,这些基础设施正在迅速贬值(由于硬件/芯片和软件的进步),问题仍然是,哪种未来愿景最终会胜出,成为全球主要的人工智能提供商。或者,也许永远都是多种模式,每种模式的市场份额都较小?敬请期待,因为这场竞争比以往任何时候都更加激烈。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/ke-ji-ling-xiu-dui-deepseek-de-kuai-su-jue-qi-zuo-chu-hui