OpenAI 向第三方开发者开放其最强大的模型 o1

王浩然 • 4天前 • AI前沿 • 8 views

在以假期为主题的产品发布会“OpenAI 12 天”的第九天， OpenAI 正在通过其应用程序编程接口 (API)向第三方开发人员推出其最先进的模型 o1 。

对于希望构建新的高级 AI 应用程序或将最先进的 OpenAI 技术集成到现有应用程序和工作流程（无论是面向企业还是面向消费者）的开发人员来说，这标志着向前迈出了重要一步。

如果您还不熟悉 OpenAI 的 o1 系列，这里是概要：它于 2024 年 9 月发布，是 ChatGPT 公司新“系列”模型中的第一个，超越了GPT 系列的大型语言模型 (LLM)，并提供“推理”功能。

基本上，o1 系列模型（o1 和 o1 mini）需要更长的时间来响应用户的提示并提供答案，但它们会在制定答案时检查自己是否正确，并避免产生幻觉。当时，OpenAI 表示 o1 可以处理更复杂的博士级问题——现实世界的用户也证实了这一点。

虽然开发人员之前可以访问 o1 的预览版本，并在此基础上构建自己的应用程序（例如，博士顾问或实验室助理），但通过 API 发布的完整 o1 模型的生产就绪版本可以提高性能、降低延迟并带来新功能，使其更容易集成到实际应用程序中。

大约两周半前， OpenAI已通过其 ChatGPT Plus 和 Pro 计划向消费者推出了 o1 ，同时还增加了模型分析和响应用户上传的图像和文件的功能。

除了今天的发布之外，OpenAI 还宣布对其 Realtime API 进行重大更新，同时降低价格并采用新的微调方法，让开发人员能够更好地控制他们的模型。

完整的 o1 模型现在可以通过 OpenAI 的 API 供开发人员使用

新的 o1 模型（编号为 o1-2024-12-17）旨在出色地完成复杂的多步骤推理任务。与之前的 o1-preview 版本相比，此版本提高了准确性、效率和灵活性。

OpenAI 报告称，其在编码、数学和视觉推理任务等一系列基准测试中都取得了显著的进步。

例如，SWE-bench Verified 上的编码结果从 41.3 提高到 48.9，而以数学为重点的 AIME 测试中的表现从 42 跃升至 79.2。这些改进使 o1 非常适合构建简化客户支持、优化物流或解决具有挑战性的分析问题的工具。

一些新功能增强了 o1 对开发人员的功能。结构化输出允许响应可靠地匹配自定义格式（例如 JSON 模式），从而确保与外部系统交互时的一致性。函数调用简化了将 o1 连接到 API 和数据库的过程。而对视觉输入进行推理的能力则为制造、科学和编码开辟了用例。

开发人员还可以使用新的reasoning_effort参数微调o1的行为，该参数控制模型在任务上花费的时间，以平衡性能和响应时间。

OpenAI 的 Realtime API 得到增强，为智能对话式语音/音频 AI 助手提供支持

OpenAI 还宣布了其 Realtime API 的更新，旨在为语音助手、实时翻译工具或虚拟导师等低延迟、自然的对话体验提供支持。

新的 WebRTC 集成功能可直接支持音频流、噪音抑制和拥塞控制，从而简化语音应用的构建。开发人员现在只需进行最少的设置即可集成实时功能，即使在多变的网络条件下也是如此。

OpenAI 还为其实时 API 引入了新的定价，将 GPT-4o 音频的成本降低 60% 至每百万输入令牌 40 美元，每百万输出令牌 80 美元。

缓存音频输入成本降低了 87.5%，现在每 100 万个输入令牌售价为 2.50 美元。为了进一步提高可负担性，OpenAI 正在添加 GPT-4o mini，这是一款更小、更经济高效的型号，售价为每 100 万个输入令牌 10 美元，每 100 万个输出令牌 20 美元。

GPT-4o mini 的文本代币费率也明显较低，输入代币起价为 0.60 美元，输出代币起价为 2.40 美元。

除了定价之外，OpenAI 还让开发人员能够更好地控制 Realtime API 中的响应。并发带外响应等功能允许在不中断用户体验的情况下运行内容审核等后台任务。开发人员还可以自定义输入上下文，以专注于对话的特定部分，并控制何时触发语音响应，以实现更准确、更无缝的交互。

偏好微调提供新的自定义选项

另一个主要的新增功能是偏好微调，这是一种根据用户和开发人员偏好定制模型的方法。

与依赖精确输入输出对的监督式微调不同，偏好微调使用成对比较来告诉模型哪些响应是首选。这种方法对于主观任务（例如总结、创意写作或语气和风格很重要的场景）特别有效。

与为金融分析师打造助手的 Rogo AI 等合作伙伴进行的早期测试显示出令人鼓舞的结果。Rogo 报告称，偏好微调帮助他们的模型比传统微调更好地处理复杂、分布外的查询，将任务准确率提高了 5% 以上。该功能现已适用于 gpt-4o-2024-08-06 和 gpt-4o-mini-2024-07-18，并计划在明年初将支持范围扩大到较新的模型。

面向 Go 和 Java 开发人员的新 SDK

为了简化集成，OpenAI 正在通过 Go 和 Java 的测试版扩展其官方 SDK 产品。这些 SDK 加入了现有的 Python、Node.js 和 .NET 库，使开发人员能够更轻松地在更多编程环境中与 OpenAI 的模型进行交互。Go SDK 特别适用于构建可扩展的后端系统，而 Java SDK 则专为依赖强类型和强大生态系统的企业级应用程序量身定制。

通过这些更新，OpenAI 为开发人员提供了扩展的工具包，以构建先进的、可定制的 AI 驱动应用程序。无论是通过 o1 改进的推理能力、实时 API 增强功能还是微调选项，OpenAI 的最新产品都旨在为突破 AI 集成界限的企业提供更高的性能和成本效益。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/openai-xiang-di-san-fang-kai-fa-zhe-kai-fang-qi-zui-qiang

Like (0)

王浩然作者

0 0

谷歌：人工智能代理、多模式人工智能、企业搜索将在 2025 年占据主导地位

Previous 4天前

Google 将其编程代理 Code Assist 升级为 Gemini 2.0，并增加了源集成

Next 4天前

AI前沿

风险投资公司喜欢使用人工智能会议记事本 Granola，因此他们向其投资了 2000 万美元

Granola 的记事本应用已成为风险投资家们的热门工具，他们用它记录会议，并用人工智能技术补充笔记。这使得这家初创公司更容易从众多投资者那里筹集 2000 万美元的 A 轮融资资…

王浩然
2024年10月25日
000
AI前沿

Lambda 推出“推理即服务” API，宣称成本为人工智能行业最低

Lambda是一家成立 12 年的旧金山公司，以向机器学习研究人员以及 AI 模型构建者和训练人员按需提供图形处理单元 (GPU) 而闻名。但今天，该公司推出了Lambda&nb…

王浩然
5天前
000
AI前沿

OpenAI 雄心勃勃的增长战略伴随着巨大的财务风险

据 The Information最近的一份报告称， OpenAI的内部财务预测揭示了一项高风险战略，即将激进的收入目标与巨额预计损失相结合。该公司的计划凸显了快速发展的人工智能领…

点点
2024年10月11日
000
AI前沿

当“聊天机器人”变成一个贬义词时：企业领导者对对话式人工智能的 3 个误解

随着 OpenAI 的 ChatGPT、Meta 的 Llama 和 Anthropic 的 Claude 等法学硕士课程的激增，各种场合都出现了聊天机器人。有提供职业建议的聊天机…

点点
2024年8月28日
000
AI前沿

Patronus AI 推出全球首个自助服务 API，旨在阻止 AI 幻觉

客服聊天机器人自信地描述一款并不存在的产品。金融人工智能编造市场数据。医疗保健机器人提供危险的医疗建议。这些人工智能幻觉曾被视为有趣的怪癖，但如今已成为急于部署人工智能的公司面临的…

王浩然
2024年11月3日
000
AI前沿

Apple Intelligence 将于 2025 年支持德语、意大利语、韩语、葡萄牙语和越南语

苹果周三宣布，其生成式 AI 产品将在 2025 年提供更多语言版本。Apple Intelligence新增的语言包括英语（印度）、英语（新加坡）、德语、意大利语、韩语、葡萄牙语…

王浩然
2024年9月19日
000
AI前沿

Agentic AI 即将崛起，带来新的网络安全风险

据管理咨询公司 Gartner 称， Agentic AI可以大幅提高人工智能的潜力，到 2028 年，该技术可能会被纳入到 33% 的企业软件应用程序中，而目前这一比例仅为 1%…

王浩然
2024年12月7日
000
AI前沿

如何利用冷硬数据科学来利用人工智能

有时很难区分技术的现实与每天轰炸我们收件箱的炒作和营销信息。例如，在过去五年里，我们可能听到了太多关于元宇宙、区块链和虚拟现实的信息。目前，我们正处于一场关于被滥用的术语“人工智能…

点点
2024年10月1日
000
AI前沿

随着行业升温，Perplexity AI 估值逼近 80 亿美元

据报道， Perplexity AI正在商讨获得约 5 亿美元的新融资，这是人工智能技术爆炸式增长的重要进展。这轮潜在投资可能会使这家人工智能搜索公司的估值飙升至 80 亿美元，较…

点点
2024年10月22日
000
AI前沿

麻省理工学院的 Clio 如何增强机器人的场景理解

机器人感知长期以来一直受到现实环境复杂性的挑战，通常需要固定设置和预定义对象。麻省理工学院的工程师开发了 Clio，这是一个突破性的系统，可让机器人直观地理解并优先考虑周围环境中的…

点点
2024年10月7日
000
AI前沿

Meta 加入核能数据中心潮流

今年早些时候，Meta 试图通过简单的方式获得自己的核能数据中心，即在现有反应堆旁边建造一个。但在监管机构对该计划泼冷水之后——据报道，该地点是一种稀有蜜蜂物种的家园——该公司又提…

王浩然
2024年12月5日
000
AI前沿

Meta 有很大机会赢得 AI 硬件竞赛

在人工智能设备失败的一年里，雷朋 Meta 智能眼镜的表现超出预期。但它能保持这种势头吗？人工智能可穿戴设备经历了糟糕的一年。就在几个月前，科技界还坚信人工智能硬件将成为下一个…

王浩然
2024年9月23日
000
AI前沿

谷歌的人工智能系统可能会改变我们的写作方式：InkSight 将手写笔记数字化

纸笔是百年历史的技术，如今正迎来数字化的重大升级。谷歌研究院开发出一种人工智能系统，可以准确地将手写笔记的照片转换成可编辑的数字文本，这可能会改变数百万人捕捉和保存想法的方式。新…

王浩然
2024年11月1日
000
AI前沿

据报道，OpenAI 正在制定新策略来应对人工智能改进放缓

据报道，OpenAI 正在制定新策略来应对人工智能改进放缓据《The Information》报道， OpenAI 的下一代旗舰模型可能不会像其前代产品那样带来巨大的飞跃。据报…

王浩然
2024年11月11日
000
AI前沿

嘿，英国！以下是如何“选择退出”Meta 使用您的 Facebook 和 Instagram 数据来训练其 AI

在 Meta 最近重新引发争议的计划（将英国 Facebook 和 Instagram 用户的公开帖子用作 AI 训练素材）之后，这家社交网络巨头已采取下一步措施，开始通知当地用户…

王浩然
2024年10月5日
000
AI前沿

Automattic 为员工提供了另一次辞职机会——这次的遣散费为 9 个月

Automattic 首席执行官马特·穆伦维格 (Matt Mullenweg) 向有意离职的员工提供为期六个月的遣散费，几天后， 159 人接受了这一提议。10 月 16 日晚，…

王浩然
2024年10月24日
000
AI前沿

2024 年融资金额达 1 亿美元或以上的 39 家美国 AI 初创公司的完整名单

对于某些人来说，人工智能疲劳是真实存在的，但显然风险投资者还没有厌倦这一类别。第三季度，人工智能交易继续主导风险投资。根据Crunchbase 的数据，人工智能公司在第三季度筹集…

点点
2024年10月13日
000
AI前沿

Adobe 推出经过授权内容训练的 AI 视频生成器

Adobe发布了Firefly Video Model，这是一款全新的 AI 文本转视频生成工具，可以根据书面提示制作新颖的视频。它与OpenAI、Runway、Google和Me…

点点
2024年10月16日
000
AI前沿

为 AI 模型评分：Endor Labs 推出评估工具

Endor Labs已开始根据 AI 模型的安全性、受欢迎程度、质量和活跃度对其进行评分。这一独特功能被称为“AI 模型的 Endor 分数”，旨在通过提供直接的分数来简化识别 …

点点
2024年10月17日
000
AI前沿

阿里巴巴发布了一款“公开”挑战 OpenAI o1 推理模型的模型

一种新的所谓“推理”人工智能模型 QwQ-32B-Preview 已经问世。它是少数几个可以与 OpenAI 的o1相媲美的模型之一，也是第一个可以在宽松许可下下载的模型。 QwQ…

王浩然
2024年11月28日
000