OpenAI 的先进“草莓计划”模型终于问世

OpenAI 的先进“草莓计划”模型终于问世

经过数月的猜测和期待,OpenAI 发布了其高级推理模型Project Strawberry的生产版本,并将其更名为“o1”。它还附带一个“迷你”版本(就像 GPT-4o 一样),它将以利用更大的知识库为代价提供更快、响应更快的交互。

o1 似乎提供了多种技术进步。它是 OpenAI 推理模型系列中的第一个,旨在使用类似人类的推理来回答有关科学、编码和数学等主题的复杂问题,速度比人类更快。

例如,在测试期间,o1 被输入了国际数学奥林匹克的资格考试。虽然它的前身
GPT-4o只能正确解决 13% 的问题,但 o1 答对了 83%。在一场在线 Codeforces 比赛中,o1 得分在第 89 个百分位。更重要的是,o1 可以回答难倒以前模型的问题(例如,“9.11 和 9.9 哪个更大?”)。然而,该公司明确表示,此版本只是新手模型全部功能的预览。

OpenAI 研究主管 Jerry Tworek 表示,新款 o1“已使用全新的优化算法和专门为其量身定制的新训练数据集进行训练”。据报道,通过结合强化学习和“思维链”推理,o1 的推理结果比其前身更准确。“我们注意到这个模型的幻觉更少了,”Tworek 表示,但“我们不能说我们解决了幻觉问题。”

从今天开始,ChatGPT-Plus 和 Teams 订阅者都可以试用 o1 和 o1-mini。Enterprise 和 Edu 订阅者应该可以在下周前试用。

该公司表示,o1-mini 最终将向免费用户开放,但并未指定时间表。与 GPT-4o 相比,开发人员会注意到 o1 的 API 定价大幅上涨。访问 o1 的费用为每百万输入代币 15 美元(而 GPT-4o 的费用为每百万 5 美元),每百万输出代币 60 美元,是 4o 每百万 5 美元费用的四倍。真正的问题是新模型是否认为单词“strawberry”包含两个 R 或三个R。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/openai-de-xian-jin-cao-mei-ji-hua-mo-xing-zhong-yu-wen-shi

Like (0)
王 浩然的头像王 浩然作者
Previous 2024年9月14日 下午10:00
Next 2024年9月15日 上午9:00

相关推荐

发表回复

Please Login to Comment