
中国人工智能实验室 DeepSeek 发布了其所谓的推理模型 DeepSeek-R1 的开放版本,声称该模型在某些人工智能基准上的表现与 OpenAI 的o1一样好。
R1 可从 AI 开发平台 Hugging Face 获得,并采用 MIT 许可,这意味着它可以不受限制地用于商业用途。据 DeepSeek 称,R1 在基准测试 AIME、MATH-500 和 SWE-bench Verified 上均胜过 o1。AIME 使用其他模型来评估模型的性能,而 MATH-500 是一组文字问题。而 SWE-bench Verified 则专注于编程任务。
作为一个推理模型,R1 可以有效地对自身进行事实核查,这 有助于它避免一些通常会使模型陷入困境的陷阱。与典型的非推理模型相比,推理模型需要更长的时间(通常要多几秒到几分钟)才能得出解决方案。好处是它们在物理、科学和数学等领域往往更可靠。
DeepSeek 在一份技术报告中透露,R1 包含 6710 亿个参数。参数大致对应模型解决问题的能力,参数较多的模型通常比参数较少的模型表现更好。
6710 亿个参数非常庞大,但 DeepSeek 还发布了 R1 的“精简”版本,其大小从 15 亿个参数到 700 亿个参数不等。最小的版本可以在笔记本电脑上运行。至于完整的 R1,它需要更强大的硬件,但可以通过DeepSeek 的 API 获得,价格比 OpenAI 的 o1 便宜 90%-95%。
R1 也有缺点。作为中国模式,它必须接受 中国互联网监管机构的评估 ,以确保其回应“体现社会主义核心价值观”。例如,R1 不会回答有关天安门广场或台湾自治的问题。
许多中国人工智能系统,包括其他推理模型, 拒绝回应可能引起中国监管机构愤怒的话题,例如有关习近平政权的猜测。
R1 发布前几天,即将离任的拜登政府提议对中国企业实施更严格的AI 技术出口规则和限制。中国企业已经被禁止购买先进的 AI 芯片,但如果新规则按书面规定生效,企业将面临更严格的半导体技术和模型限制,这些技术是引导复杂 AI 系统所必需的。
OpenAI在上周的一份政策文件中敦促美国政府支持美国人工智能的发展,以免中国模型在能力上赶上或超过它们。在接受采访时,OpenAI 政策副总裁 Chris Lehane 特别指出 DeepSeek 的母公司 High Flyer Capital Management 是一个特别令人担忧的组织。
到目前为止,至少有三家中国实验室——DeepSeek、阿里巴巴和中国独角兽公司Moonshot AI旗下的Kimi——已经制作出他们声称可以与 o1 相媲美的模型。(值得注意的是,DeepSeek 是第一家——它在 11 月下旬宣布了R1 的预览版。)乔治梅森大学人工智能研究员 Dean Ball 在 X 上的一篇文章中表示,这一趋势表明中国人工智能实验室将继续成为“快速跟随者”。
Ball 写道:“DeepSeek 提炼模型的出色表现意味着,非常有能力的推理器将继续广泛扩散,并可在本地硬件上运行,远离任何自上而下的控制机制的监控。”
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/deepseek-sheng-cheng-qi-tui-li-mo-xing-zai-mou-xie-ji-zhun