OpenAI 的 o1-preview 和 o1-mini 模型对开发人员意味着什么

王浩然 • 2024年9月15日上午11:00 • AI前沿 • 925 views

OpenAI 昨天下午震惊世界，它发布的不是传闻中的“Strawberry”，也不是 GPT-5，而是一个名为 o1 的全新“推理”大型语言模型 (LLM) 系列，旨在为与科学、技术、工程和数学 (STEM) 领域相关的任务提供高性能和准确性。

OpenAI 的两个新模型是 o1-preview 和参数较低（不太先进）的 o1-mini，目前可供 ChatGPT Plus 用户以及使用OpenAI 付费应用程序编程接口 (API) 的开发人员使用。这样，开发人员可以将它们作为现有第三方应用和服务的后端进行测试，或者在它们之上构建新的应用和服务。

OpenAI 表示，新的 o1 模型使用一种“推理”形式，它们“尝试不同的策略，识别错误，并进行完整的思考过程”，OpenAI 的 API 技术负责人 Michelle Pokrass 在接受 VentureBeat 视频电话采访时分享了这些模型开发背后的一些想法。

“在我们的测试中，这些模型在一些最具挑战性的基准上的表现与博士生的表现非常相似，”Pokrass 指出。

具体来说，o1 模型在“推理相关问题”上“表现得比”GPT 系列“好得多”，OpenAI 产品部门的 Nikunj Handa 表示，他还花时间向 VentureBeat 分享了对 o1 模型系列的看法。

以下是第三方开发人员应该了解的有关新 o1-preview 和 o1-mini 模型的信息。

仅限于文本 — 没有图像或文件分析 — 并且速度较慢……

目前o1-preview 和 o1-min 模型目前仅限于文本输入和输出，因此目前不太可能取代第三方开发人员对 GPT-4o 的使用，GPT-4o 是 OpenAI 的最新最先进的模型，提供多模式输入和输出，包括分析文件附件和生成图像。

Pokrass 和 Handa 表示，o1 系列车型不是多式联运的。

o1 模型还不能连接到网络浏览，这意味着在其训练截止日期（2023 年 10 月）之后没有任何外部知识，尽管用户当然可以以文本输入的形式提供自己的知识供模型参考和分析。

它们的输出响应速度也较慢，在某些情况下需要一分钟甚至几分钟才能做出响应。

然而，一些在过去几周和几个月内获得早期 alpha 访问权限的开发人员报告称，他们在编码和起草法律文件等任务上的性能有所提高，因此对于希望进行实验并支付更多费用来提高性能的开发人员来说，使用其中一种仍然是一个不错的选择。

正如 OpenAI 在其新的 o1-preview 和 o1-mini 推理模型的API 文档中所写：“对于需要图像输入、函数调用或持续快速响应时间的应用程序，GPT-4o 和 GPT-4o mini 模型将继续是正确的选择。但是，如果您的目标是开发需要深度推理并能适应更长响应时间的应用程序，那么 o1 模型可能是一个绝佳的选择。”

o1 的价格比其他 OpenAI 模型贵很多，但 o1-mini 很划算

首先，您需要是 OpenAI API 的重度用户才能获得资格。o1-preview 和 o1-mini 模型最初面向“第 5 级”用户开放，即那些通过 API 花费 1,000 美元并至少在 30 天（或更早）前向公司付款的用户。

OpenAI 警告称，新的 o1 模型是预览版，每分钟限制为 20 个请求（或每分钟 20 个调用），而其他 OpenAI 模型的限制则更高，或者每分钟/每天受代币限制。

该公司目前也不接受其他低价型号那样的“批量”请求——本质上是将不需要立即响应的输入集中到 API 中，而是在 24 小时内（或更短时间内）进行分析并输出相应的响应。

Pokrass 表示，主要的 o1 预览模型提供了更多关于 STEM 以外学科的“世界知识”，它是目前 OpenAI 提供的最昂贵的 AI 模型，成本高出很多——每输入 100 万个代币的成本为 15 美元，每输出 100 万个代币的成本为 60 美元（15 美元 / 60 美元），而 GPT-4o 的成本为 5 美元 / 15 美元，新的完整 o1 预览模型的价格要贵 200%-300%。

然而，o1-mini 模型的价格非常便宜，每 100 万个输入代币售价 3 美元，每 100 万个输出代币售价 12 美元，即便宜了 80%。

波克拉斯表示：“当然，我们将在未来几周和几个月内调整价格，以使其达到正确的水平。”

以下是 OpenAI 通过其 API 对其各种领先模型的定价明细

当谈到上下文时——或者一个给定的 LLM 在一次交互、输入和输出中可以处理多少个标记——o1系列的限制为 128,000，与 GPT-4o 和 OpenAI 的其他顶级模型相当。

o1-preview 模型在单个输出或响应中最多可以产生 32,768 个标记，而 o1-mini 可以产生该数字的两倍，即 65,536 个。

到目前为止，开发人员使用 OpenAI o1-preview 和 o1-mini 的目的是什么……

OpenAI 发布 o1-previews 和 o1-mini 还不到 24 小时，但一些开发人员已经在思考它的用途并对其进行测试，以了解它的优点和缺点。

而且，如前所述，OpenAI 确实在过去几周和一个月内在一个选定的早期 alpha 用户和测试人员群体中“播下”了它的种子。

基于这项工作，以下是迄今为止 o1-preview 和 o1-mini 模型的一些最有趣的用途：

制定计划和白皮书

许多用户报告说，o1 模型系列可以根据简单的提示生成完善的行动计划，甚至生成带有引文的完整文档（如白皮书）。

规划、基础设施和风险评估

人工智能影响者和企业顾问Allie K. Miller在 X 上发布了一个帖子，介绍了 OpenAI 的 o1 预览模型的各种令人印象深刻的输出，包括自动（比人类快得多）优化组织人员的时间表、评估合并风险、设计高效的仓库，甚至平衡城市电网。

快速创建应用程序和游戏

OpenAI o1-preview 似乎是对 Anthropic 的 Claude 家族，特别是 Artifacts 功能的直接警告，因为它也是用户生成自己的交互式应用程序和游戏的一种有效且快速的方式，正如 AI 语音和音频初创公司 ElevenLabs 的设计主管 Ammaar Reshi在 X 上指出的那样。请注意，他使用了另一个软件工具 Cursor Composer 来运行该模型。

不过，正如网络通知初创公司 Engagespot 的首席技术官 Anand Sukumaran在其 X 账户上所发布的那样，GPT-4o 在编写简单程序（例如显示“Hello, World!”）时仍然能实现更快的速度。

自行完成提案请求 (RFP)

承包商，特别是那些为政府机构提供产品的承包商，都非常熟悉征求建议书（RFP） ——由机构以标准化格式征求合同投标的一份文件，填写起来可能非常繁琐和耗时。

虽然已经出现了专门的人工智能软件来帮助承包商更有效地填写这些文件，但宾夕法尼亚大学沃顿商学院教授 Ethan Mollick 是一位领先的人工智能影响者和早期采用者，他在 alpha 测试阶段曾使用过 o1 ，他在 X 上发帖称 o1 可以自行填写 RFP — — 当然，它仅限于文本并且不接受文件上传，因此用户需要将 RFP 的文本版本复制并粘贴到 ChatGPT 中或通过其他应用程序的 o1 上下文窗口中。

制定参与和增长黑客策略

Ruben Hassid 是 EasyGen 的创始人，EasyGen 是一款用于自动生成 LinkedIn 帖子的 Chrome 应用程序，他在 X 上发布了一个演示视频，展示了 o1-preview 如何生成一个全面且合理的计划，以使用 Reddit 来帮助他的公司发展。https://twitter.com/RubenHssd/status/1834281243510538671?12

“我简直不敢相信答案这么长。法学硕士不可能有这么多的策略，”他写道。

在哪里可以访问 OpenAI o1-preview 和 o1-mini？

开发人员当然可以通过该公司的公共 API以及Microsoft Azure OpenAI 服务、Azure AI Studio 和 GitHub Models 访问新的 OpenAI o1 模型。

虽然 o1 系列显然并不适合所有（甚至可能不适合大多数）开发人员，但 o1 系列的首次亮相对于那些拥有实验空间并希望构建新应用程序和服务的人来说是一个激动人心的时刻。

OpenAI 还致力于继续开发 o1 系列和 GPT 系列的功能，因此对于那些希望在领先的 AI 公司平台上进行构建的人来说，并不缺乏选择。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/openai-de-o1preview-he-o1mini-mo-xing-dui-kai-fa-ren-yuan

Like (0)

王浩然作者

0 0

微软的 Windows Agent Arena：教 AI 助手操作你的 PC

Previous 2024年9月15日上午10:00

Salesforce 的 AgentForce：想要管理你整个业务的 AI 助手

Next 2024年9月15日

AI前沿

佳士得AI艺术拍卖会据报道超出预期‌

近日，佳士得拍卖行举办的一场AI艺术拍卖会吸引了广泛关注，据报道，此次拍卖的结果远远超出了业界的预期。这场拍卖会不仅展示了AI艺术的无限潜力，也引发了人们对艺术与科技结合的深入思考…

王浩然
2025年3月9日
000
AI前沿

SolarWinds：IT 专业人士希望加强对 AI 的监管

SolarWinds的一项新调查显示，人们强烈呼吁政府加强对人工智能的监督，88% 的 IT 专业人士主张加强监管。这项研究调查了近 700 名 IT 专家，结果显示安全是首要关…

点点
2024年9月19日
000
AI前沿

销售团队如何利用人工智能来优化转化率

如今，在现代销售中保持竞争力实际上意味着要拥抱最新的技术趋势。自 2022 年底以来（得益于 OpenAI 的 ChatGPT，生成式人工智能进入公众视野），人工智能一直走在这一…

点点
2024年9月26日
000
AI前沿

AI大模型站在十字路口，持续突破or陷入低谷

AI大模型已进入转折点，未来18个月将是迈向AGI时代的关键。当普通人被AI轰炸的已经疲劳，应用落地也没有惊人地突破，AI大模型的发展似乎已经进入瓶颈期。在云栖大会…

点点
2024年9月21日
000
AI前沿

AR 的突破：微型化显示屏为主流 AR 眼镜铺平道路

多年来，增强现实 (AR) 技术一直吸引着人们的想象力，有望将数字信息与我们的物理世界无缝融合。通过将计算机生成的图像叠加到现实世界的视图上，AR 有可能彻底改变我们与环境的互动方…

点点
2024年10月6日
000
AI前沿

Sakana撤回其AI能大幅加速模型训练的说法

近日，Sakana公司宣布撤回之前关于其人工智能（AI）技术能显著加速模型训练速度的声明。这一变动引发了业界和公众的广泛关注。 Sakana公司此前曾宣称，其创新的AI技术能够以前…

王浩然
2025年2月25日
000
AI前沿

特斯拉的“We, Robot”活动：Robovan 透露 Cybercab 的回顾

特斯拉的“We, Robot”活动已经结束，但仍有许多事情需要关注。特斯拉宣称 Cybercab 是自动驾驶交通的未来，据透露，该车是双座车，售价不到 30,000 美元。随后…

王浩然
2024年10月12日
000
AI前沿

代理实验室：AMD 和约翰霍普金斯大学共同组建的虚拟研究团队

当每个人都在热议人工智能代理和自动化时，AMD 和约翰霍普金斯大学一直在致力于改善人类和人工智能在研究中的协作方式。他们的新开源框架Agent Laboratory完全重新构想了如…

王浩然
2025年1月14日
000
AI前沿

BBC 正在使用 AI 生成字幕

广受欢迎的BBC Sounds音频平台正在通过其网站和应用试用新的 AI 生成字幕，这些字幕可以与节目和完整文本一起播放。为期三个月的试用目前仅限于少数几档节目 – I…

王浩然
2024年9月2日
000
AI前沿

Pryon CEO Igor Jablokov访谈：揭秘AI企业巨头的崛起之路

Igor Jablokov，这个名字在AI界可谓是响当当。作为Pryon的掌舵人，他以其独特的视野和卓越的领导力，带领公司在竞争激烈的AI市场中脱颖而出。

点点
2024年9月7日
000
AI前沿

埃隆·马斯克称特斯拉“无需”授权 xAI 模型

埃隆·马斯克否认了有关他的一家公司特斯拉曾与另一家公司 xAI 讨论分享收入，以便后者可以使用这家初创公司的人工智能模型的报道。《华尔街日报》报道称，根据向投资者描述的拟议协议，…

王浩然
2024年9月10日
000
AI前沿

LinkedIn 在更新服务条款前曾抓取用户数据用于培训

LinkedIn 可能已经在没有更新其条款的情况下利用用户数据训练了 AI 模型。 LinkedIn 的美国用户（欧盟、欧洲经济区或瑞士除外，这可能是由于这些地区的数据隐私规则）在…

王浩然
2024年9月19日
000
AI前沿

随着数据中心使用率不断上升，Submer 筹集 5550 万美元以降低数据中心温度

人们竞相开发更好的芯片和数据中心容量来处理 AI 工作负载，但所有这些活动都存在一个问题。强大的处理能力意味着会产生大量热量，这对服务器的运行和环境都有重大影响。由于…

王浩然
2024年10月5日
000
AI前沿

2025 年企业 AI 成功剧本：从代理到评估

2025 年将成为企业 AI 的关键一年。过去的一年见证了快速创新，今年也将如此。这使得重新审视您的AI战略以保持竞争力并为客户创造价值变得比以往任何时候都更加重要。从扩展 AI …

王浩然
2025年1月7日
000
AI前沿

利用数字化劳动力提升人类能力

SS&C Blue Prism 英国、爱尔兰和比荷卢三国销售副总裁 Mark Lockett 讨论了该公司的最新发展、客户挑战以及如何充分利用智能自动化工具。您能否向我们…

点点
2024年9月26日
000
AI前沿

改变我们在董事会中对 GenAI 的看法：把握短期和长期投资回报率

随着世界各地的领导团队开始规划 2025 年，每个人都在思考一个问题：他们在人工智能和/或生成式人工智能 (GenAI) 上的投资何时能获得回报。Google Cloud 的最新研…

点点
2024年10月11日
000
AI前沿

美国人担心人工智能会随着 Deepfakes 的兴起而干扰选举

超过一半的受访者曾使用人工智能制作虚假图像或视频

点点
2024年10月23日
000
AI前沿

Cerebras-Perplexity 交易以超快 AI 瞄准 1000 亿美元搜索市场

Cerebras Systems和Perplexity AI正在联手挑战传统搜索引擎的主导地位，并宣布建立合作伙伴关系，承诺以以前认为不可能的速度提供近乎即时的人工智能搜索结果。 …

王浩然
2025年2月12日
000
AI前沿

ApertureData 使用多模式数据为企业提供 10 倍速度提升

数据是人工智能的圣杯。从敏捷的初创公司到全球企业集团，世界各地的组织都在投入数十亿美元来调动数据集，以打造高性能的人工智能应用程序和系统。但即使付出了这么多努力，现实情况是，访问…

王浩然
2024年10月15日
000
AI前沿

思科警告：微调使大型语言模型成为威胁向量‌

随着人工智能技术的飞速发展，大型语言模型（LLMs）在金融、医疗、法律等众多领域展现出了巨大的潜力。然而，思科公司最近发布的一份报告却揭示了这些模型在微调过程中可能带来的巨大安全风…

王浩然
1天前
000