OpenAI 的先进“草莓计划”模型终于问世

王浩然 • 2024年9月15日上午8:00 • AI前沿 • 127 views

经过数月的猜测和期待，OpenAI 发布了其高级推理模型Project Strawberry的生产版本，并将其更名为“o1”。它还附带一个“迷你”版本（就像 GPT-4o 一样），它将以利用更大的知识库为代价提供更快、响应更快的交互。

o1 似乎提供了多种技术进步。它是 OpenAI 推理模型系列中的第一个，旨在使用类似人类的推理来回答有关科学、编码和数学等主题的复杂问题，速度比人类更快。

例如，在测试期间，o1 被输入了国际数学奥林匹克的资格考试。虽然它的前身
GPT-4o只能正确解决 13% 的问题，但 o1 答对了 83%。在一场在线 Codeforces 比赛中，o1 得分在第 89 个百分位。更重要的是，o1 可以回答难倒以前模型的问题（例如，“9.11 和 9.9 哪个更大？”）。然而，该公司明确表示，此版本只是新手模型全部功能的预览。

OpenAI 研究主管 Jerry Tworek 表示，新款 o1“已使用全新的优化算法和专门为其量身定制的新训练数据集进行训练”。据报道，通过结合强化学习和“思维链”推理，o1 的推理结果比其前身更准确。“我们注意到这个模型的幻觉更少了，”Tworek 表示，但“我们不能说我们解决了幻觉问题。”

从今天开始，ChatGPT-Plus 和 Teams 订阅者都可以试用 o1 和 o1-mini。Enterprise 和 Edu 订阅者应该可以在下周前试用。

该公司表示，o1-mini 最终将向免费用户开放，但并未指定时间表。与 GPT-4o 相比，开发人员会注意到 o1 的 API 定价大幅上涨。访问 o1 的费用为每百万输入代币 15 美元（而 GPT-4o 的费用为每百万 5 美元），每百万输出代币 60 美元，是 4o 每百万 5 美元费用的四倍。真正的问题是新模型是否认为单词“strawberry”包含两个 R 或三个R。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/openai-de-xian-jin-cao-mei-ji-hua-mo-xing-zhong-yu-wen-shi

o1 o1-mini OpenAI Strawberry 推理模型

Like (0)

王浩然作者

0 0

PromeAI 评测：将简单的草图变成令人惊叹的图像

Previous 2024年9月14日下午10:00

Google 的 Gemini Live 现已在 Android 上免费提供

Next 2024年9月15日上午9:00

AI前沿

Augment Code 推出人工智能平台，彻底改变团队软件开发

Augment Code的重大举措旨在重新定义软件开发的未来，它从隐身模式中脱颖而出，推出了第一个专为开发团队设计的人工智能编码平台。凭借其专有的人工智能技术，该平台提供了前所未有…

点点
2024年10月27日
000
AI前沿

使用 MoME 减少 AI 幻觉：记忆专家如何提高 LLM 准确性

人工智能 (AI)正在改变行业并重塑我们的日常生活。但即使是最智能的 AI 系统也会犯错。一个大问题是AI 幻觉，即系统产生虚假或编造的信息。这是医疗保健、法律和金融领域的一个严重…

王浩然
2024年12月27日
000
AI前沿

Cassette Group 首席执行官兼联合创始人 Ben Taylor – 访谈系列

Ben Taylor是Cassette Group的联合创始人兼首席执行官，该集团是一家沉浸式技术公司，专门为企业提供培训、教育和通信解决方案。该公司利用 3D 实时技术通过动画…

点点
2024年9月28日
000
AI前沿

超越炒作：揭秘生成式人工智能在药物研发中的真正影响

自从Insilico Medicine利用生成式 AI 开发出一种治疗特发性肺纤维化 (IPF) 的药物以来，人们对这项技术如何改变药物研发的兴趣与日俱增。传统方法缓慢而昂贵，因此…

王浩然
2024年9月24日
000
AI前沿

Uber 与 AI 公司联手开发自动驾驶汽车

Uber正在与英国人工智能公司Wayve合作开发自动驾驶汽车。这家叫车公司表示，将与汽车制造商合作，使用这家位于伦敦的初创公司的人工智能解决方案。这将为车辆提供 4 级自动驾驶…

点点
2024年9月5日
000
AI前沿

Nvidia AI Blueprint 让任何开发人员都可以轻松构建分析视频的自动代理

Nvidia宣布，其 Nvidia AI Blueprint 将使任何行业的开发人员能够轻松构建 AI 代理来分析视频和图像内容。Nvidi表示，借助这项技术，任何行业现在都可以搜…

王浩然
2024年11月6日
000
AI前沿

中国电信利用国产芯片训练具有1万亿参数的AI模型

中国电信是中国国有电信巨头之一，它已设立了两门仅针对国产芯片进行培训的法学硕士课程。这一突破代表着中国在人工智能技术自主化方面不断努力迈出的重要一步，特别是在美国对其竞争对手获取…

点点
2024年10月11日
000
AI前沿

苹果称 AirPods Pro 2 可用作“临床级”助听器

苹果表示，其最新旗舰无线耳机 AirPods Pro 2 可用作“临床级”助听器。不过，该功能尚未获得 FDA 批准，尽管该公司表示预计“很快”就会获得批准。新款 AirPods …

王浩然
2024年9月10日
000
AI前沿

借助 Apple Intelligence，iPhone 用户最终将获得更好的 Siri

Siri 最终会变得有用吗？这是苹果今天在“Glowtime”活动上做出的承诺，该公司在活动中推出了iPhone 16 系列——这是首批搭载人工智能功能的新 iPhone，这要归功…

王浩然
2024年9月10日
000
AI前沿

先进的基础模型将如何扩展人工智能的功能

为什么要阅读非 Sam-Altman 和非 AI 博士对AI 的预测？因为早期风险投资家每天都在与比我们聪明得多的人一起工作，这些人将 AI 运用到最前沿。这让我们看到了未来可能发…

王浩然
2024年12月29日
000
AI前沿

D-ID推出AI视频翻译工具

D-ID 的工具与 YouTube 和 Vimeo 等平台竞争，面向个人创作者和企业，通过先进的 AI 技术提供无缝的多语言观看体验。 D-ID 最近推出了一款创新的AI 视频翻译…

王浩然
2024年8月23日
010
AI前沿

Google Cloud 将搜索和 YouTube 背后的技术引入企业 AI 应用

随着生成式人工智能的不断进步，对于许多企业来说，一个简单的聊天机器人可能已不再足够。云计算超大规模提供商正在竞相建立自己的数据库和工具，以帮助企业快速高效地部署运营数据，从而构建…

点点
2024年10月4日
000
AI前沿

人工智能规模扩张的终结可能尚未到来：接下来会发生什么？

随着人工智能系统在日益复杂的任务中实现超越人类的表现，业界正在努力解决是否有可能建立更大的模型，或者创新是否必须走不同的道路。大型语言模型 (LLM) 开发的一般方法是规模越大越…

王浩然
2024年12月2日
000
AI前沿

为什么“亲社会人工智能”必须成为设计、部署和管理人工智能的框架

随着人工智能渗透到现代生活的各个领域，企业领导者、政策制定者和创新者面临的核心挑战不再是是否采用智能系统，而是如何采用。在一个两极分化加剧、资源枯竭、机构信任度下降和信息环境动荡的…

王浩然
2025年1月26日
000
AI前沿

成熟的AI要学会自己搞研究！MIT推出「科研特工

自己读论文、自己找方向、自己做实验，当代科研小吗喽。 ——别误会，我说的是AI。近日，MIT团队推出了用于科学自动化发现的多智能体系统——SciAgents。论文地址：http…

点点
2024年10月9日
000
AI前沿

什么是 AI 代理？计算机科学家解释下一波 AI 工具

与 ChatGPT 等 AI 聊天机器人互动可能很有趣，有时也很有用，但日常 AI 的下一个级别不仅仅是回答问题：AI 代理可以为您执行任务。包括OpenAI、微软、谷歌和Sal…

王浩然
2025年1月6日
000
AI前沿

小众人工智能助手如何帮助释放真正的能力

随着人工智能继续渗透到越来越多的行业，未来十年左右这个市场的价值尚不可知。在这一扩张中，人工智能助手经历了巨大的增长，无论是其运作范围还是其产生的货币价值。具体来说，…

AI News
2024年9月6日
000
AI前沿

JetBrains AI 部门负责人 Vladislav Tankov – 访谈系列

Vladislav Tankov 是 AI 总监，领导 JetBrains AI 和 Grazie 产品的开发，负责 JetBrains IDE 中的 AI 助手。 JetBrai…

点点
2024年9月25日
000
AI前沿

训练数据提供商发布事后报告，Reflection 70B 事件仍在继续

2024 年 9 月 5 日，初创公司Hyperwrite AI（也称为 OthersideAI）的联合创始人兼首席执行官马特·舒默 (Matt Shumer) 在社交网络 X上发…

王浩然
2024年10月6日
000
AI前沿

AWS 关闭了用于 AI 音乐的 MIDI 键盘 DeepComposer

AWS 奇怪的人工智能键盘实验DeepComposer不复存在。该公司在今天的一篇博客文章中宣布关闭已有 5 年历史的 DeepComposer，这是一款物理 MIDI 钢琴和 …

王浩然
2024年9月19日
000

发表回复

Please Login to Comment

OpenAI 的先进“草莓计划”模型终于问世

相关推荐

发表回复

Share To :