忘掉 GPT-5!OpenAI 推出全新 AI 模型系列 o1,声称性能达到博士级

忘掉 GPT-5!OpenAI 推出全新 AI 模型系列 o1,声称性能达到博士级

自 2023 年 3 月(18 个月前)OpenAI 推出强大的专有大型语言模型 (LLM) GPT-4以来,用户和开发人员一直在想,这家在硅谷乃至全球掀起生成式人工智能热潮的公司何时会推出下一个版本,据推测名为 GPT-5。

事实证明,GPT系列目前正被一整个新系列的模型所超越。

今天,在经过数月的报道和近几天愈演愈烈的谣言之后,OpenAI 宣布了其“o1”AI模型系列,首先推出两种模型:o1-preview和o1-mini,该公司表示,它们旨在“推理复杂任务并解决比 GPT 系列模型更难的问题”。

这两种模式目前均可供 ChatGPT Plus 用户使用,但最初 o1-preview 每周限制为 30 条消息,o1-mini 每周限制为 50 条消息。 

然而,OpenAI 也警告称,“作为早期模型,它还不具备 ChatGPT 的许多实用功能,例如浏览网页获取信息以及上传文件和图像。对于许多常见情况,GPT-4o 在短期内将更加强大。”

事实上,我们最初尝试使用它为本文创建图像时发现它无法实现。在OpenAI 的 API 平台网站上,该公司澄清说,在其测试状态下,该模型系列“仅支持文本,不支持图像”。

o1 比 GPT 做得更好

OpenAI 声称其新款 o1 系列特别适合用户解决科学、医疗保健和技术等领域的复杂问题。

OpenAI 设想这些模型将用于广泛的应用,从帮助物理学家生成量子光学的数学公式到协助医疗研究人员注释细胞测序数据。

开发人员还会发现 o1-mini 模型对于构建和执行多步骤工作流、调试代码以及​​高效解决编程难题非常有效。

o1-preview 表现达到博士水平

o1-preview 模型旨在通过投入更多时间思考和改进其反应来处理具有挑战性的任务,类似于人类处理复杂问题的方式。

在测试中,这种方法使模型的表现接近物理、化学和生物等领域的博士生水平。

此外,o1-preview 模型在编码方面表现出色,在 Codeforces 竞赛中排名第 89 位,展示了其处理多步骤工作流程、调试复杂代码和生成准确解决方案的能力。

在国际数学奥林匹克 (IMO) 资格考试等基准任务中,o1-preview 解决了 83% 的问题,展现了其实力,比其前身 GPT-4o 的 13% 的成功率有了大幅提升。

Plus 和 Team 用户已可以在 ChatGPT 中使用,Enterprise 和 Edu 用户将于下周开始使用。符合 API 使用等级 5 的开发人员也可以通过 OpenAI API 使用这些模型,但初始速率会受到限制。

o1-mini功能较弱,但价格便宜 80%

与o1-preview相结合,OpenAI还推出了o1-mini模型,这是一个更精简的版本,旨在提供更快、更便宜的推理能力。

虽然 o1-mini 主要针对编码和 STEM 任务进行了优化,但它仍然具有强大的性能,尤其是在数学和编程方面。

在 IMO 数学基准测试中,o1-mini 得分为 70%,几乎与 o1-preview 的 74% 持平,同时推理成本明显较低。它在编码评估中也表现出色,在 Codeforces 上获得了 1650 的 Elo 分数,跻身前 86% 的程序员之列。

o1-mini 的价格比 o1-preview 低 80%,主要面向需要推理能力但不需要更先进的 o1-preview 模型所提供的更广泛知识的开发人员和研究人员。

这种经济高效的解决方案也将提供给 ChatGPT Plus、Team、Enterprise 和 Edu 用户,并计划在未来扩展到 ChatGPT Free 用户。

安全性和安保增强

为了履行 OpenAI 对安全的承诺,这两种模型都采用了一种新的安全训练方法,增强了它们遵守安全和协调准则的能力。

OpenAI 强调,o1-preview 在其最严格的越狱测试之一中获得了令人印象深刻的 84 分,比 GPT-4o 的 22 分有了显着的提高。根据上下文推理安全规则的能力使这些模型能够更好地处理不安全的提示并避免生成不适当的内容。

作为更广泛的安全举措的一部分,OpenAI 已与美国和英国人工智能安全研究所达成协议。

这些合作包括授予 o1 模型研究版本的早期使用权,以帮助评估和测试未来的人工智能系统。

OpenAI 的安全工作还包括全面的内部治理和与联邦政府的合作,并通过定期测试、红队测试和公司安全与安保委员会的董事会级监督来加强。

OpenAI o1 系列的下一步计划

尽管 o1-preview 和 o1-mini 模型是推理和解决问题的强大工具,但 OpenAI 承认这只是一个开始。

该公司计划定期更新和改进这些模型,包括添加浏览、文件和图像上传以及函数调用等功能,这些功能目前在 API 版本中不可用。

展望未来,OpenAI 将继续开发其 GPT 和 o1 系列,进一步扩展 AI 在各个领域的能力。随着公司致力于提高这些模型在不同应用程序中的实用性和可访问性,用户可以期待持续的进步。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/wang-diao-gpt5-openai-tui-chu-quan-xin-ai-mo-xing-xi-lie-o1

Like (0)
王 浩然的头像王 浩然作者
Previous 2024年9月15日
Next 2024年9月15日

相关推荐

发表回复

Please Login to Comment