忘掉 GPT-5！OpenAI 推出全新 AI 模型系列 o1，声称性能达到博士级

王浩然 • 2024年9月15日下午8:00 • AI前沿 • 93 views

自 2023 年 3 月（18 个月前）OpenAI 推出强大的专有大型语言模型 (LLM) GPT-4以来，用户和开发人员一直在想，这家在硅谷乃至全球掀起生成式人工智能热潮的公司何时会推出下一个版本，据推测名为 GPT-5。

事实证明，GPT系列目前正被一整个新系列的模型所超越。

今天，在经过数月的报道和近几天愈演愈烈的谣言之后，OpenAI 宣布了其“o1”AI模型系列，首先推出两种模型：o1-preview和o1-mini，该公司表示，它们旨在“推理复杂任务并解决比 GPT 系列模型更难的问题”。

这两种模式目前均可供 ChatGPT Plus 用户使用，但最初 o1-preview 每周限制为 30 条消息，o1-mini 每周限制为 50 条消息。

然而，OpenAI 也警告称，“作为早期模型，它还不具备 ChatGPT 的许多实用功能，例如浏览网页获取信息以及上传文件和图像。对于许多常见情况，GPT-4o 在短期内将更加强大。”

事实上，我们最初尝试使用它为本文创建图像时发现它无法实现。在OpenAI 的 API 平台网站上，该公司澄清说，在其测试状态下，该模型系列“仅支持文本，不支持图像”。

o1 比 GPT 做得更好

OpenAI 声称其新款 o1 系列特别适合用户解决科学、医疗保健和技术等领域的复杂问题。

OpenAI 设想这些模型将用于广泛的应用，从帮助物理学家生成量子光学的数学公式到协助医疗研究人员注释细胞测序数据。

开发人员还会发现 o1-mini 模型对于构建和执行多步骤工作流、调试代码以及高效解决编程难题非常有效。

o1-preview 表现达到博士水平

o1-preview 模型旨在通过投入更多时间思考和改进其反应来处理具有挑战性的任务，类似于人类处理复杂问题的方式。

在测试中，这种方法使模型的表现接近物理、化学和生物等领域的博士生水平。

此外，o1-preview 模型在编码方面表现出色，在 Codeforces 竞赛中排名第 89 位，展示了其处理多步骤工作流程、调试复杂代码和生成准确解决方案的能力。

在国际数学奥林匹克 (IMO) 资格考试等基准任务中，o1-preview 解决了 83% 的问题，展现了其实力，比其前身 GPT-4o 的 13% 的成功率有了大幅提升。

Plus 和 Team 用户已可以在 ChatGPT 中使用，Enterprise 和 Edu 用户将于下周开始使用。符合 API 使用等级 5 的开发人员也可以通过 OpenAI API 使用这些模型，但初始速率会受到限制。

o1-mini功能较弱，但价格便宜 80%

与o1-preview相结合，OpenAI还推出了o1-mini模型，这是一个更精简的版本，旨在提供更快、更便宜的推理能力。

虽然 o1-mini 主要针对编码和 STEM 任务进行了优化，但它仍然具有强大的性能，尤其是在数学和编程方面。

在 IMO 数学基准测试中，o1-mini 得分为 70%，几乎与 o1-preview 的 74% 持平，同时推理成本明显较低。它在编码评估中也表现出色，在 Codeforces 上获得了 1650 的 Elo 分数，跻身前 86% 的程序员之列。

o1-mini 的价格比 o1-preview 低 80%，主要面向需要推理能力但不需要更先进的 o1-preview 模型所提供的更广泛知识的开发人员和研究人员。

这种经济高效的解决方案也将提供给 ChatGPT Plus、Team、Enterprise 和 Edu 用户，并计划在未来扩展到 ChatGPT Free 用户。

安全性和安保增强

为了履行 OpenAI 对安全的承诺，这两种模型都采用了一种新的安全训练方法，增强了它们遵守安全和协调准则的能力。

OpenAI 强调，o1-preview 在其最严格的越狱测试之一中获得了令人印象深刻的 84 分，比 GPT-4o 的 22 分有了显着的提高。根据上下文推理安全规则的能力使这些模型能够更好地处理不安全的提示并避免生成不适当的内容。

作为更广泛的安全举措的一部分，OpenAI 已与美国和英国人工智能安全研究所达成协议。

这些合作包括授予 o1 模型研究版本的早期使用权，以帮助评估和测试未来的人工智能系统。

OpenAI 的安全工作还包括全面的内部治理和与联邦政府的合作，并通过定期测试、红队测试和公司安全与安保委员会的董事会级监督来加强。

OpenAI o1 系列的下一步计划

尽管 o1-preview 和 o1-mini 模型是推理和解决问题的强大工具，但 OpenAI 承认这只是一个开始。

该公司计划定期更新和改进这些模型，包括添加浏览、文件和图像上传以及函数调用等功能，这些功能目前在 API 版本中不可用。

展望未来，OpenAI 将继续开发其 GPT 和 o1 系列，进一步扩展 AI 在各个领域的能力。随着公司致力于提高这些模型在不同应用程序中的实用性和可访问性，用户可以期待持续的进步。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/wang-diao-gpt5-openai-tui-chu-quan-xin-ai-mo-xing-xi-lie-o1

AI 模型 API ChatGPT LLM o1 OpenAI

Like (0)

王浩然作者

0 0

Agentic AI：深入探究自动化的未来

Previous 2024年9月15日

构建一个对话式人工智能需要花费多少钱？

Next 2024年9月15日

AI前沿

开放深度搜索：挑战Perplexity与ChatGPT搜索的新势力‌

在人工智能（AI）搜索领域，一场新的变革正在悄然发生。Sentient基金会的研究人员近期发布了开放深度搜索（Open Deep Search，简称ODS），这一开源框架旨在与诸如…

王浩然
4天前
000
AI前沿

OpenAI 在多国部署 AI 代理 Operator

OpenAI 近期宣布，其先进的 AI 代理 Operator 已在多个国家正式上线。这款 AI 代理旨在简化用户在不同平台间的交互操作，通过智能技术提升用户体验。 Operato…

王浩然
2025年2月25日
000
AI前沿

GenAI 游戏开发平台 Series 已悄然从 Netflix、戴尔、a16z 等公司筹集了 2800 万美元

对于游戏行业高管 Pany Haritatos 来说，这是相当不平凡的一年。根据美国证券交易委员会的文件和该公司的确认，上个月，他悄悄地为他的新游戏工作室初创公司Se…

王浩然
2024年10月1日
000
AI前沿

Shutterstock 与 Lightricks 合作率先推出“研究许可”模式，降低 AI 训练数据的门槛

Shutterstock正在通过一种新颖的“研究许可”方法重塑 AI 公司访问训练数据的方式，并率先与 AI 创意技术公司Lightricks合作。今天宣布的合作允许 Lightr…

王浩然
2024年12月16日
000
AI前沿

麻省理工学院衍生公司 Liquid 首次推出非变压器 AI 模型，它们已经是最先进的

Liquid AI是一家由麻省理工学院 (MIT) 计算机科学与人工智能实验室 (CSAIL) 前研究人员共同创立的初创公司，该公司宣布推出其首批多模式 AI 模型：“液体基础模型…

wang, jinchang
2024年10月3日
000
AI前沿

利用云加速您的 AI 创新

专为人工智能打造的综合云平台可以提供强大的计算资源、先进的人工智能工具和内置的安全性概览 AI 不仅仅是未来——它现在就在这里，推动着各个行业的转型。然而，许多企业在实施 AI …

王浩然
2025年2月21日
000
AI前沿

德勤调查：企业对生成式人工智能持谨慎乐观态度

一项新调查发现，一年前，企业对生成式人工智能的前景充满热情，但随着它们面临将人工智能的可能性转化为成果的复杂性，这种热情已逐渐消退，转而变得乐观起来。德勤第四份《企业生成人工智能…

王浩然
2025年1月26日
000
AI前沿

波士顿动力人形机器人将获得新功能

机器人与人工智能研究所合作旨在在过去研究的基础上推进包括 Atlas 在内的人形机器人的发展波士顿动力公司与机器人与人工智能研究所（前身为人工智能研究所）合作，通过强化学习推…

王浩然
2025年2月19日
000
AI前沿

iPhone 16 今日发布，但并未配备最受关注的功能：Apple Intelligence

iPhone 16将于本周五正式发售。但对于最早的采用者来说，这款手机在发售时就已经做出了根本性的妥协。简而言之，这不是他们承诺的 iPhone 16。苹果首席执行官蒂姆·库克表…

王浩然
2024年9月21日
000
AI前沿

Arcee AI 推出 SuperNova：一种可定制、符合指令的企业模型

Arcee AI今天推出了SuperNova，这是一个专为企业部署而设计的 700 亿参数语言模型，具有先进的指令跟踪功能和完整的自定义选项。该模型旨在为 OpenAI 和 Ant…

王浩然
2024年9月17日
000
AI前沿

成熟的AI要学会自己搞研究！MIT推出「科研特工

自己读论文、自己找方向、自己做实验，当代科研小吗喽。 ——别误会，我说的是AI。近日，MIT团队推出了用于科学自动化发现的多智能体系统——SciAgents。论文地址：http…

点点
2024年10月9日
000
AI前沿

AI-Santa 展示全新对话视频

人工智能视频研究公司 Tavus 推出了世界上第一个完全由人工智能驱动的圣诞老人复制品，它可以与数百万人进行面对面互动。该公司利用 8 月份发布的对话式视频接口 (CVI) 技…

王浩然
2024年12月22日
000
AI前沿

DeepSeek 的新 AI 模型似乎是迄今为止最好的“公开”挑战者之一

中国的一个实验室创建了迄今为止最强大的“开放式”人工智能模型之一。该模型DeepSeek V3由人工智能公司 DeepSeek 开发，并于周三根据宽松的许可证发布，允许开发人员下…

王浩然
2024年12月28日
000
AI前沿

五角大楼称人工智能正在加速其“杀伤链”

OpenAI 和 Anthropic 等领先的人工智能开发商正在努力向美国军方出售软件：让五角大楼更有效率，但又不让他们的人工智能杀人。五角大楼首席数字和人工智能官拉达·普拉姆博…

王浩然
2025年1月20日
000
AI前沿

联想泄露消息称，更便宜的 Copilot Plus 电脑将于本月上市

联想似乎已准备好推出价格更实惠的新款 Copilot Plus 电脑。可靠泄密者 Evan Blass发布了联想的一份新闻稿，详细介绍了将于本周晚些时候在 IFA 贸易展上发布的多…

王浩然
2024年9月3日
000
AI前沿

杰夫·辛顿和约翰·霍普菲尔德因其在基础人工智能领域的工作获得诺贝尔物理学奖

瑞典皇家科学院宣布了2024 年诺贝尔物理学奖。杰夫·辛顿和约翰·霍普菲尔德因他们从 20 世纪 70 年代末和 80 年代初开始在人工神经网络方面所做的工作而共同分享了这一享有盛…

王浩然
2024年10月10日
000
AI前沿

Puppygraph 加快了 LLM 获取图形数据洞察的速度

随着企业继续在高级分析和大型语言模型(LLM)方面投入大量资金，图形技术已成为设置数据堆栈最受欢迎的方法之一。它允许用户了解数据集中的复杂关系，而这些关系在传统关系数据库中通常并不…

王浩然
2024年11月9日
000
AI前沿

推理框架 Archon 有望加快 LLM 进程，且无需额外成本

斯坦福大学扩展智能实验室的研究人员介绍了一种新的推理框架，可以帮助大型语言模型 (LLM) 更快地处理潜在的响应。该框架 Archon 使用推理时间架构搜索 (ITAS) 算法…

王浩然
2024年10月3日
000
AI前沿

Hugging Face首席科学官担忧：AI正沦为服务器上的“应声虫”‌

在人工智能（AI）技术日新月异的今天，Hugging Face的首席科学官表达了对AI发展方向的一种深切忧虑。他警告称，当前的AI系统正逐渐演变成仅执行预设任务、缺乏独立思考和批判…

王浩然
2025年3月9日
000
AI前沿

应对虚假信息：人工智能聊天机器人如何帮助揭穿阴谋论

虚假信息和阴谋论是数字时代面临的重大挑战。互联网是信息交流的强大工具，但也成为虚假信息的温床。阴谋论曾经只限于小团体，现在却有能力影响全球事件并威胁公共安全。这些理论通常通过社交媒…

点点
2024年11月6日
000