
DeepSeek R1 推理模型的发布在整个科技行业引起了震动,最明显的迹象就是主要 AI 股票的突然抛售。OpenAI 和 Anthropic 等资金雄厚的 AI 实验室的优势似乎不再十分稳固,据报道 DeepSeek 已经能够以极低的成本开发出他们的竞争对手。
虽然一些人工智能实验室目前处于危机模式,但对于企业部门而言,这大多是好消息。
更便宜的应用程序,更多的应用程序
正如我们之前所说,2025 年值得关注的趋势之一是使用 AI 模型的成本持续下降。无论价格如何,企业都应该使用最新的 AI 模型进行实验和构建原型,因为他们知道持续的价格下降将使他们最终能够大规模部署其应用程序。
这一趋势线刚刚出现了巨大的变化。OpenAI o1每百万输出代币的成本为 60 美元,而DeepSeek R1 每百万代币的成本为 2.19 美元。此外,如果您担心将数据发送到中国服务器,您可以通过美国提供商(如Together.ai和Fireworks AI)访问 R1 ,其价格分别为每百万代币 8 美元和 9 美元——与 o1 相比,这仍然是一笔巨大的便宜。
公平地说,o1 仍然比 R1 有优势,但优势还不足以证明如此巨大的价格差异是合理的。此外,R1 的功能足以满足大多数企业应用程序的需求。而且,我们可以期待未来几个月内发布更先进、更强大的型号。
我们还可以预期对整个 AI 市场产生二阶效应。例如,OpenAI 首席执行官 Sam Altman 宣布,免费 ChatGPT 用户将很快可以使用 o3-mini。虽然他没有明确提到 R1 是原因,但这一声明是在 R1 发布后不久发布的,这一事实说明了一切。
更多创新
R1 仍有许多问题未得到解答——例如,有多份报告称 DeepSeek 使用 OpenAI 大型语言模型 (LLM) 的输出来训练模型。但如果其论文和技术报告正确,DeepSeek 能够创建一个几乎与最先进水平相匹配的模型,同时降低成本并消除一些需要大量人工的技术步骤。
如果其他人能够复制 DeepSeek 的结果,那么对于那些因资金障碍而无法在该领域创新的人工智能实验室和公司来说,这可能是个好消息。企业可以期待更快的创新和更多的人工智能产品来支持他们的应用。
大型科技公司花费数十亿美元购买硬件加速器将会怎样?我们仍未达到人工智能的极限,因此领先的科技公司将能够利用其资源做更多的事情。事实上,更实惠的人工智能将在中长期内增加需求。
但更重要的是,R1 证明了并非所有事物都与更大的计算集群和数据集息息相关。凭借正确的工程技能和优秀的人才,您将能够突破可能的极限。
开源共赢
需要明确的是,R1 并非完全开源,因为 DeepSeek 只发布了权重,但没有发布代码或训练数据的完整细节。尽管如此,这对开源社区来说是一个巨大的胜利。自 DeepSeek R1 发布以来,Hugging Face 上已发布了 500 多个衍生版本,该模型的下载量已达数百万次。
它还将为企业提供更大的灵活性,让他们能够决定在何处运行模型。除了完整的 6710 亿个参数模型外,R1 还提供了精简版本,参数数量从 15 亿到 700 亿不等,使企业能够在各种硬件上运行该模型。此外,与 o1 不同,R1 揭示了其完整的思维链,让开发人员更好地了解模型的行为,并能够将其引导到所需的方向。
随着开源赶上封闭模型,我们可以期待重新致力于分享知识和研究,以便每个人都能从人工智能的进步中受益。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/deepseekr1-dui-qi-ye-lai-shuo-shi-yi-ge-fu-yin-rang-ren