OpenAI 的 o1 模型没有展现其思维，这让开源获得了优势

王浩然 • 2024年12月11日下午5:00 • AI前沿 • 106 views

OpenAI 凭借其o1 模型开创了大型语言模型 (LLM) 的新推理范式，该模型最近进行了重大升级。然而，尽管 OpenAI 在推理模型方面遥遥领先，但它可能会落后于迅速崛起的开源竞争对手。

o1 之类的模型有时被称为大型推理模型 (LRM)，它们使用额外的推理时间计算周期来“思考”更多，审查其响应并纠正其答案。这使它们能够解决传统 LLM 难以解决的复杂推理问题，并使它们特别适用于编码、数学和数据分析等任务。

然而，最近几天，开发人员对 o1 的反应褒贬不一，尤其是在更新版本发布之后。一些人发布了 o1 完成惊人任务的示例，而另一些人则对该模型令人困惑的响应表示沮丧。开发人员遇到了各种各样的问题，从对代码进行不合逻辑的更改到忽略指令。

o1 细节保密

部分混乱是由于 OpenAI 的保密和拒绝透露 o1 工作原理的细节。LRM 成功的秘诀是模型在达到最终响应时生成的额外标记，称为模型的“想法”或“推理链”。例如，如果您提示经典 LLM 为任务生成代码，它将立即生成代码。相比之下，LRM 将生成推理标记，用于检查问题、规划代码结构并在发出最终答案之前生成多个解决方案。

o1 隐藏了思考过程，只显示最终响应以及一条显示模型思考时间的消息，并可能显示推理过程的概述。这在一定程度上是为了避免响应混乱并提供更流畅的用户体验。但更重要的是，OpenAI 将推理链视为商业机密，并希望让竞争对手难以复制 o1 的能力。

训练新模型的成本不断增长，利润率却没有跟上，这迫使一些人工智能实验室变得更加隐秘，以扩大领先优势。即使是对该模型进行红队测试的阿波罗研究部门也没有获得其推理链的访问权限。

这种缺乏透明度的情况导致用户做出各种猜测，包括指责 OpenAI 降低模型质量以降低推理成本。

开源模型完全透明

另一方面，阿里巴巴的Qwen with Questions和Marco-o1等开源替代方案展示了其模型的完整推理链。另一种替代方案是DeepSeek R1，它不是开源的，但仍然揭示了推理标记。看到推理链使开发人员能够排除提示故障，并通过添加其他指令或上下文示例来找到改进模型响应的方法。

当您想要将模型的响应集成到需要一致结果的应用程序和工具中时，对推理过程的可见性尤其重要。此外，在企业应用程序中，控制底层模型非常重要。私有模型和支持它们的框架（例如测试其输入和输出的保护措施和过滤器）在不断变化。虽然这可能会导致更好的整体性能，但它可能会破坏许多提示和在其之上构建的应用程序。相比之下，开源模型将模型的完全控制权交给开发人员，这对于企业应用程序来说可能是一个更强大的选择，因为在企业应用程序中，特定任务上的表现比一般技能更重要。

QwQ 和 R1 仍处于预览版本，而 o1 在准确性和易用性方面处于领先地位。对于许多用途，例如进行一般的临时提示和一次性请求，o1 仍然是比开源替代方案更好的选择。

但开源社区很快就赶上了私有模型，我们可以期待未来几个月出现更多模型。它们可以成为可视性和控制至关重要的合适替代方案。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/openai-de-o1-mo-xing-mei-you-zhan-xian-qi-si-wei-zhe-rang

Deepseek R1 LLM Marco-o1 o1 模型 OpenAI Qwen with Questions 开源竞争对手

Like (0)

王浩然作者

0 0

Claude 的模型上下文协议 (MCP)：开发人员指南

Previous 2024年12月11日

新加坡初创公司 Sapient 凭借全新模型架构加入全球企业 AI 竞赛

Next 2024年12月11日

AI前沿

Claude：你需要了解的有关 Anthropic 人工智能的一切

Anthropic 是规模仅次于 OpenAI 的第二大 AI 供应商，它拥有一个名为 Claude 的强大生成式 AI 模型系列。这些模型可以执行一系列任务，从为图片添加字幕、撰…

王浩然
2024年10月20日
000
AI前沿

人形机器人为中国汽车制造商制造汽车

一家中国汽车制造商推出了一款新型轮式人形机器人，据称该机器人将于 2026 年开始应用于汽车制造。国有企业广州汽车集团在上海的一场活动上发布了第三代GoMate。 GoMate…

王浩然
2025年1月3日
000
AI前沿

DataStax 首席执行官：2025 年将是我们真正看到人工智能转型的一年

当企业领导者努力应对实施生成式人工智能的复杂性时，DataStax 首席执行官 Chet Kapoor 提出了一个令人放心的观点：当前的挑战是技术革命的正常组成部分，2025 年将…

王浩然
2024年9月22日
000
AI前沿

超越Transformer：NVIDIA的MambaVision旨在为企业解锁更快、更便宜的计算机视觉

引言‌ 在人工智能（AI）的广阔领域中，计算机视觉一直是推动技术进步和应用创新的关键力量。然而，传统的基于Transformer的计算机视觉模型虽然性能卓越，但计算成本高昂，限制了…

王浩然
2025年3月26日
000
AI前沿

Couchbase 推出全新 Capella AI 服务，让企业 AI 更贴近数据

数据库平台开发商Couchbase正在寻求帮助解决企业 AI 部署中日益常见的问题。即如何以尽可能快速和安全的方式让数据更接近 AI。最终目标是使构建和部署企业 AI 变得更简单、…

王浩然
2024年12月3日
000
AI前沿

甚至连“人工智能教母”都不知道 AGI 是什么

您是否对通用人工智能（AGI）感到困惑？OpenAI 一直致力于创造一种“造福全人类”的东西。您可能想认真对待他们，因为他们刚刚筹集了 66 亿美元来更接近这一目标。但如果你仍然…

王浩然
2024年10月7日
000
AI前沿

OpenAI 推出 ChatGPT 桌面集成，与 Copilot 竞争

当OpenAI发布 ChatGPT 的桌面应用版本时，其目标显然是让更多用户将 ChatGPT 纳入日常工作流程。现在，Mac OS 和 Windows PC 版本的新更新鼓励用户…

王浩然
2024年11月18日
000
AI前沿

CrowdStrike推出Charlotte AI Detection Triage平台

CrowdStrike推出Charlotte AI Detection Triage平台 1. **平台概述**：CrowdStrike推出Charlotte AI Detecti…

王浩然
2025年2月14日
000
AI前沿

触觉人工智能如何改变人机关系

几十年来，有意识的机器人一直是科幻小说的主角，它引发了令人着迷的伦理问题，并揭示了创造人工意识的技术障碍。当今科技界在人工智能 (AI) 领域取得的大部分成就都归功于深度学习的最新…

王浩然
2024年12月23日
000
AI前沿

1X 发布生成世界模型来训练机器人

机器人初创公司1X Technologies开发了一种新的生成模型，可以大大提高在模拟中训练机器人系统的效率。该公司在一篇新博客文章中宣布了这一模型，它解决了机器人技术的一个重要挑…

王浩然
2024年9月20日
000
AI前沿

谷歌地图正在获得由 Gemini 提供支持的全新 AI 功能

Google 地图即将推出由Google 的生成式 AI 模型Gemini提供支持的新功能。周四，该公司宣布即将推出更新，让美国的 Google 地图用户能够利用 AI 帮助他们找…

王浩然
2024年11月2日
000
AI前沿

Flora：为创意专业人士打造AI驱动的无限画布‌

在创意产业的数字化浪潮中，Flora正以其创新的技术引领一场变革。这家新兴公司致力于为创意专业人士打造一款基于人工智能的无限画布，旨在重塑设计、绘画及艺术创作的工作流程。 Flor…

王浩然
2025年3月3日
000
AI前沿

超越基准：Gemini 2.5 Pro或成最强推理模型

在人工智能领域，新模型的推出总是伴随着各种期待与争议。近期，谷歌悄然发布了其最新的旗舰语言模型——Gemini 2.5 Pro。与业界其他AI实验室喜欢将新模型冠以“世界最强”不同…

王浩然
2025年3月31日
000
AI前沿

确保人工智能前沿：保护企业系统免受人工智能驱动的威胁

到 2025 年，针对身份的武器化人工智能攻击（看不见且通常恢复成本最高）将对企业网络安全构成最大威胁。大型语言模型 (LLM) 是恶意攻击者、网络犯罪集团和民族国家攻击团队的新…

王浩然
2024年11月18日
000
AI前沿

AI先驱因强化学习研究荣获图灵奖‌

在人工智能领域，一项至高无上的荣誉近日揭晓——几位在强化学习领域取得卓越成就的AI先驱荣获了图灵奖。这一奖项不仅是对他们个人才华和贡献的认可，更是对整个强化学习社区乃至整个AI领域…

王浩然
2025年3月8日
000
AI前沿

人工智能不断从新的经验中学习，不会忘记过去

我们的大脑在不断学习。那家新开的三明治熟食店很棒。那家加油站？以后最好别去那里。此类记忆会重新连接大脑中支持新学习的区域。在睡眠期间，前一天的记忆会被转移到大脑的其他部位进行长期…

点点
2024年9月3日
000
AI前沿

解密诺贝尔物理学奖为啥颁给AI？Hinton和Ilya 12年前对话，竟引发物理诺奖AI风暴

昨天的诺贝尔物理学奖一公布，瞬间炸翻了物理圈和AI圈。 Hinton的第一反应更是有趣：这不会是个诈骗电话吧？如此出乎意料的结果，让各路针对诺奖物理学奖的严肃预测，都仿佛成了笑话…

点点
2024年10月9日
000
AI前沿

开源矢量数据库供应商通过云更新瞄准企业 AI 成本

随着生成式人工智能的应用在过去几年中急剧增长，矢量数据库已经从尖端技术发展成为必不可少的企业基础设施。随着矢量数据库变得越来越重要，企业越来越关注性能和成本。开源Mi…

王浩然
2024年11月21日
000
AI前沿

为什么 DeepSeek 的新 AI 模型认为它是 ChatGPT

本周早些时候，资金雄厚的中国人工智能实验室 DeepSeek 发布了一款“开放”人工智能模型，该模型在热门基准测试中击败了许多竞争对手。该模型DeepSeek V3规模庞大但效率高…

王浩然
2024年12月29日
000
AI前沿

OpenAI的战略之举：Agent SDK及其对企业AI的深远影响

一、引言在AI领域，OpenAI一直是引领创新的先锋。近期，OpenAI发布了一项重大更新——Agent SDK，这一举措不仅巩固了其在企业AI市场的地位，还预示着AI技术应用的…

王浩然
2025年3月15日
000

发表回复

Please Login to Comment

OpenAI 的 o1 模型没有展现其思维，这让开源获得了优势

o1 细节保密

开源模型完全透明

相关推荐

发表回复

Share To :