
就在一周前——2025 年 1 月 20 日——中国人工智能初创公司 DeepSeek 发布了一个名为 R1 的新开源人工智能模型,该模型最初可能会被误认为是自OpenAI两年多前推出 ChatGPT(最初由自己的 GPT-3.5 模型提供支持)以来不断涌现的越来越多的几乎可以互换的竞争对手之一。
但这很快就被证明是没有根据的,因为 DeepSeek 的移动应用程序在短时间内飙升至美国 Apple App Store 的排行榜,取代 ChatGPT 成为第一名,并引发了大规模的市场调整,因为投资者抛售了曾经热门的计算机芯片制造商(如 Nvidia)的股票,这些制造商的图形处理单元 (GPU) 在大型超级集群中的需求量很大,用于训练新的 AI 模型并持续向客户提供服务(这种模式称为“推理”)。
风险投资家马克·安德森(Marc Andreessen)昨晚在社交网络 X 上撰文,表达了其他科技工作者的感受:“Deepseek R1 是人工智能的斯普特尼克时刻”,将其与1957 年 10 月苏联发射历史上第一颗人造卫星斯普特尼克 1 号进行了比较,这颗卫星引发了苏联和美国为争夺太空旅行主导地位而展开的“太空竞赛”。
人造卫星的发射促使美国大力投资航天器和火箭的研发。虽然这不是一个完美的比喻——DeepSeek-R1 的开发并不需要大量投资,恰恰相反(下文将对此进行详细介绍)——但这似乎标志着全球人工智能市场的一个重大转折点,因为这是中国首次推出全球最受欢迎的人工智能产品。
但在我们加入 DeepSeek 的炒作行列之前,让我们退一步来看看现实情况。作为一个在网络和移动平台上广泛使用 OpenAI 的 ChatGPT 并密切关注人工智能进步的人,我认为虽然 DeepSeek-R1 的成就值得关注,但现在还不是否定 ChatGPT 或美国人工智能投资的时候。请注意,我没有收受 OpenAI 的钱来这么说——我从未从该公司拿过钱,也不打算这么做。
DeepSeek-R1 的优势
DeepSeek-R1 是新一代大型“推理”模型的一部分,它的作用不仅仅是回答用户查询:它们在生成响应时反思自己的分析,尝试在提供给用户之前捕获错误。
并且,DeepSeek-R1在多个领域匹敌或超越了OpenAI 自己的推理模型 o1(该模型于 2024 年 9 月发布,最初仅面向 ChatGPT Plus 和 Pro 订阅用户)。
例如,在评估高中数学解题能力的 MATH-500 基准测试中,DeepSeek-R1 的准确率达到 97.3%,略高于 OpenAI o1 的 96.4%。在编码能力方面,DeepSeek-R1 在 SWE-bench Verified 基准测试中的得分为 49.2%,略高于 OpenAI o1 的 48.9%。
此外,从财务角度来看,DeepSeek-R1 可大幅节省成本。该模型的开发投资不到 600 万美元,仅为 OpenAI 的 o1 等训练模型的支出(估计数十亿美元)的一小部分。
由于美国对该技术向中国销售的出口限制, DeepSeek 被迫使用稀缺且较旧的 GPU 来提高效率。此外,DeepSeek 以每百万代币 0.14 美元的价格提供 API 访问,大大低于 OpenAI 每百万代币 7.50 美元的价格。
DeepSeek-R1 的巨大效率提升、成本节约以及与美国顶级 AI 模型相当的性能,让硅谷和更广泛的商业界为之震惊,因为这似乎彻底颠覆了 AI 市场、地缘政治以及已知的 AI 模型训练经济学。
尽管 DeepSeek 的进步具有革命性,但目前形势却过于偏向它了
不可否认,DeepSeek-R1 的成本效益是一项重大成就。但我们不要忘记,DeepSeek 本身的成功很大程度上要归功于美国的人工智能创新,这可以追溯到 2017 年谷歌人工智能研究人员开发的最初的 Transformer 架构(这引发了整个 LLM 热潮)。
DeepSeek-R1 是在合成数据问题和答案上进行训练的,具体来说,根据其研究人员发布的论文,是在监督微调的“DeepSeek-V3 数据集”上进行的,这是该公司之前的(非推理)模型,被发现有许多指标表明它是用 OpenAI 的 GPT-4o 模型本身生成的!
可以明确地说,如果没有 GPT-4o 提供这些数据,如果没有 OpenAI 自己在 2024 年 9 月发布创建该类别的第一个商业推理模型 o1,DeepSeek-R1 几乎肯定不会存在。
此外,OpenAI 的成功需要大量的 GPU 资源,为 DeepSeek 的突破铺平了道路,毫无疑问,DeepSeek 也从中受益匪浅。目前投资者对美国芯片和人工智能公司的恐慌似乎为时过早,而且言过其实。
ChatGPT 的视觉和图像生成功能在工作场所和个人环境中仍然非常重要和有价值——DeepSeek-R1 还没有
虽然 DeepSeek-R1 以其可见的“思路链”推理(一种意识流,其中模型在分析用户的提示并寻求回答时显示文本)以及基于文本和数学的工作流程的效率给人留下了深刻的印象,但它缺少几个使 ChatGPT 成为当今更强大和多功能工具的功能。
没有图像生成或视觉功能
DeepSeek-R1 官方网站和移动应用程序确实允许用户上传照片和文件附件。但是,他们只能使用光学字符识别 (OCR) 从中提取文本,这是最早的计算技术之一(可追溯到 1959 年)。
这与 ChatGPT 的视觉功能相比相形见绌。用户可以上传不带任何文字的图片,然后让 ChatGPT 分析图片、描述图片,或根据所见内容和用户的文字提示提供更多信息。
ChatGPT 允许用户上传照片,并可以分析视觉材料并提供详细的见解或可行的建议。例如,当我需要指导修理自行车或维护空调时,ChatGPT 处理图像的能力就显得非常宝贵。DeepSeek-R1 根本无法做到这一点。请参见下面的视觉比较:


无图像生成
缺乏生成图像功能是另一个主要限制。对于经常使用 ChatGPT 生成 AI 图像(例如本文自己的标题)的人来说,ChatGPT 由 OpenAI 的底层 DALL·E 3 模型提供支持,使用 ChatGPT 创建详细且风格化的图像的能力是游戏规则的改变者。
此功能对于许多创意和专业工作流程至关重要,而 DeepSeek 尚未展示类似的功能,尽管今天该公司确实发布了一个开源视觉模型Janus Pro,据称该模型在第三方基准测试中优于 DALL·E 3、Stable Diffusion 3 和其他业界领先的图像生成模型。
无语音模式
DeepSeek-R1 还缺少语音交互模式,而语音交互模式对于可访问性和便利性而言已变得越来越重要。ChatGPT 的语音模式可实现自然的对话式交互,使其成为免提使用或具有不同可访问性需求的用户的绝佳选择。
DeepSeek 的未来潜力令人期待,但也要警惕其面临的挑战
是的,DeepSeek-R1 可以(而且很可能)在未来添加语音和视觉功能。但这样做并非易事。
集成图像生成、视觉分析和语音功能需要大量的开发资源,而且讽刺的是,许多高性能 GPU 都被投资者低估了。以用户友好的方式有效部署这些功能又是另一项挑战。
DeepSeek-R1 的成就令人印象深刻,标志着全球人工智能领域出现了令人鼓舞的转变。然而,我们必须控制住这种兴奋。目前,ChatGPT 仍然是更全面、更强大的产品,它提供了 DeepSeek 无法比拟的一系列功能。让我们在欣赏这些进步的同时,认识到美国人工智能创新和投资的局限性和持续的重要性。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/leng-jing-yi-xia-deepseekr1-hen-bang-dan-chatgpt-de-chan