OpenAI 的 DevDay 为 AI 应用开发者带来实时 API 和其他福利

王浩然 • 2024年10月2日下午3:00 • AI前沿 • 103 views

对于 OpenAI 来说，这是动荡的一周，高管离职和重大融资进展频频，但这家初创公司又回到了正轨，试图说服开发人员在 2024 年 DevDay 上利用其 AI 模型构建工具。该公司周二宣布了几款新工具，包括其“实时 API”的公开测试版，用于构建具有低延迟、AI 生成的语音响应的应用程序。它不完全是 ChatGPT 的高级语音模式，但很接近。

OpenAI 首席产品官凯文·韦尔 (Kevin Weil) 在活动前的记者会上表示，首席技术官米拉·穆拉蒂 (Mira Murati) 和首席研究官鲍勃·麦格鲁 (Bob McGrew) 的离职不会影响公司的发展。

“首先我要说的是，鲍勃和米拉是出色的领导者。我从他们身上学到了很多东西，他们为我们取得今天的成就做出了巨大贡献，”韦尔说。“而且，我们不会放慢脚步。”

OpenAI 正在经历又一次高管层改组——这让人想起了去年 DevDay 之后的动荡——该公司正试图说服开发人员，它仍然是构建 AI 应用的最佳平台。领导者表示，这家初创公司拥有超过 300 万名开发人员使用其 AI 模型进行构建，但 OpenAI 所处的领域竞争日益激烈。

OpenAI 指出，过去两年来，它已将开发人员访问其 API 的成本降低了 99%，但这很可能是受到 Meta 和谷歌等竞争对手不断压低价格的压力。

OpenAI 的一项新功能名为 Realtime API，它让开发者有机会在其应用中构建近乎实时的语音转语音体验，并可以选择使用 OpenAI 提供的六种声音。这些声音与 ChatGPT 提供的声音不同，开发者不能使用第三方声音，以避免版权问题。（这款模糊地基于斯嘉丽·约翰逊的声音在任何地方都找不到。）

在简报会上，OpenAI 的开发者体验主管 Romain Huet 分享了一款使用 Realtime API 构建的旅行规划应用的演示。该应用允许用户与 AI 助手口头讨论即将到来的伦敦之旅，并获得低延迟响应。Realtime API 还可以访问许多工具，因此该应用能够在回答问题的同时在地图上标注餐厅位置。

在另一个环节，Huet 展示了 Realtime API 如何通过电话与真人交谈，询问活动订餐事宜。与谷歌臭名昭著的 Duo 不同，OpenAI 的 API 无法直接致电餐馆或商店；但是，它可以与 Twilio 等呼叫 API 集成来实现这一点。值得注意的是，OpenAI 并没有添加披露信息，以便其 AI 模型在这样的通话中自动识别自己，尽管这些 AI 生成的声音听起来非常逼真。目前，添加此披露信息似乎是开发人员的责任，这可能是加州新法律的要求。

作为 DevDay 公告的一部分，OpenAI 还在其 API 中引入了视觉微调功能，这将使开发人员能够使用图像和文本来微调他们的 GPT-4o 应用程序。理论上，这应该有助于开发人员提高 GPT-4o 在涉及视觉理解的任务中的表现。OpenAI 的产品 API 负责人 Olivier Godement 告诉 TechCrunch，开发人员将无法上传受版权保护的图像（例如唐老鸭的照片）、描绘暴力的图像或其他违反 OpenAI 安全政策的图像。

OpenAI 正在努力赶上其竞争对手在 AI 模型许可领域已经提供的功能。它的即时缓存功能类似于 Anthropic 几个月前推出的功能，允许开发人员在 API 调用之间缓存常用上下文，从而降低成本并改善延迟。OpenAI 表示，开发人员使用此功能可以节省 50%，而 Anthropic承诺提供 90% 的折扣。

最后，OpenAI 提供了模型蒸馏功能，让开发人员可以使用较大的 AI 模型（例如 o1-preview 和 GPT-4o）来微调较小的模型（例如 GPT-4o mini）。与运行较大的模型相比，运行较小的模型通常可以节省成本，但此功能应该可以让开发人员提高这些小型 AI 模型的性能。作为模型蒸馏的一部分，OpenAI 推出了一个 beta 评估工具，以便开发人员可以在 OpenAI 的 API 中衡量他们的微调性能。

DevDay 可能会因为未宣布的内容而引起更大的轰动——例如，去年 DevDay 期间没有宣布任何有关 GPT Store 的消息。据我们所知，OpenAI 一直在与一些最受欢迎的 GPT 创造者试行收入分成计划，但自那以后该公司没有宣布太多消息。

此外，OpenAI 表示今年 DevDay 期间不会发布任何新的 AI 模型。等待 OpenAI o1（不是预览版或迷你版）或该初创公司的视频生成模型 Sora 的开发人员将不得不再等一段时间。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/openai-de-devday-wei-ai-ying-yong-kai-fa-zhe-dai-lai-shi

AI AI 模型 API ChatGPT DevDay GPT-4o o1 OpenAI Sora 视频生成模型

Like (0)

王浩然作者

0 0

微软开始向出版商支付 Copilot 展示内容的费用

Previous 2024年10月2日

Meta 不愿透露是否利用智能眼镜拍摄的照片来训练 AI

Next 2024年10月2日

AI前沿

2025年及以后AI的三大预测‌

近年来，人工智能（AI）的飞速发展令人叹为观止。从协助发现可能拯救生命的药物疗法，到推动自动驾驶汽车技术的革新，AI正深刻影响着我们的日常生活。作为AI的乐观拥趸，我坚信AI将继续…

王浩然
2025年3月14日
000
AI前沿

Anthropic为Claude赋予超能力：实时网络搜索，为何这改变了一切？

在人工智能领域，Anthropic公司再次引领潮流，为其旗舰语言模型Claude赋予了实时网络搜索的能力。这一创新不仅标志着AI技术的又一重大突破，更预示着AI在日常生活和工作中应…

王浩然
2025年3月25日
000
AI前沿

Pinecone 通过级联检索扩展矢量数据库，将企业 AI 准确率提高高达 48%

近年来，Pinecone 已成为领先的原生矢量数据库平台之一。Pinecone 凭借新功能继续在竞争日益激烈的市场中脱颖而出，帮助解决企业 AI 挑战今天，Pinecone 宣布…

王浩然
2024年12月3日
000
AI前沿

2024 年第三季度对生成式 AI 初创企业的投资超过 39 亿美元

并非所有人都相信生成式人工智能的投资回报。但根据资金追踪机构 PitchBook 的最新数据，许多投资者都相信这一点。根据 PitchBook 的数据，2024 年第三季度，风险…

点点
2024年10月21日
000
AI前沿

OpenAI 启动 ChatGPT 项目，让你可以组织文件、分组聊天

OpenAI最新发布的 ChatGPT 项目解决了在 ChatGPT 上组织文件和对话的需求。该功能类似于谷歌流行的NotebookLM应用程序。在“OpenAI 12 天”直…

王浩然
2024年12月16日
000
AI前沿

埃隆·马斯克的 xAI 为 Grok 添加了图像理解功能

埃隆·马斯克旗下的 xAI 为其 Grok AI 模型添加了图像理解功能。这意味着他的社交平台 X 上的付费用户可以访问 AI 聊天机器人，上传图像并向 AI 询问有关该图像的问题…

王浩然
2024年10月29日
000
AI前沿

AnyChat 整合了 ChatGPT、Google Gemini 等功能，可实现终极 AI 灵活性

一种名为AnyChat的新工具通过在单一界面下统一各种领先的大型语言模型 (LLM)，为开发人员提供了前所未有的灵活性。该平台由人工智能社区的知名人物、Gradio 的机器学习增…

王浩然
2024年11月19日
000
AI前沿

Alexa新技能：阅读、总结与回顾长篇文档‌

亚马逊的智能助手Alexa近日解锁了一项全新技能——能够阅读、总结并回顾长篇文档。这一功能为处理大量文字信息的用户提供了极大的便利。 ‌一、阅读功能‌ Alexa现在能够流畅地阅读…

王浩然
2025年2月28日
000
AI前沿

老美都要在太空建数据中心了，成本大降95%，英伟达强力支持

建数据中心，可能是各家AI大厂最重要的事情之一。这两年，科技巨头的年化资本支出，从1380亿美元同比增长到2290亿美元，这多花的910亿美元，有一大部分花在了AI数据中心建设上…

点点
2024年9月16日
000
AI前沿

多式联运 RAG 正在发展，这是开始的最佳方式

随着公司开始尝试多模态检索增强生成 (RAG)，提供多模态嵌入（一种将数据转换为 RAG 可读文件的方法）的公司建议企业在嵌入图像和视频时从小处着手。多模态 RAG 还可以显示…

王浩然
2024年11月11日
000
AI前沿

反对人工智能艺术的案例

无论生成式人工智能变得多么强大，作家特德姜说它都永远无法创造出真正的艺术。姜是当今最受推崇的科幻小说作家之一，最著名的作品是中篇小说《你一生的故事》（改编成电影《降临》）。但他也…

王浩然
2024年9月3日
000
AI前沿

Hugging Face首席科学官担忧：AI正沦为服务器上的“应声虫”‌

在人工智能（AI）技术日新月异的今天，Hugging Face的首席科学官表达了对AI发展方向的一种深切忧虑。他警告称，当前的AI系统正逐渐演变成仅执行预设任务、缺乏独立思考和批判…

王浩然
2025年3月9日
000
AI前沿

Meta 不愿透露是否利用智能眼镜拍摄的照片来训练 AI

Meta 的 AI 驱动雷朋眼镜正面有一个隐蔽的摄像头，不仅会在你要求时拍照，还会在 AI 功能触发某些关键词（例如“看”）时拍照。这意味着这款智能眼镜会收集大量照片，包括有意拍摄…

点点
2024年10月2日
000
AI前沿

Qwen2.5-Coder 改变了人工智能编程的游戏规则——而且它是免费的

阿里云发布了新的 AI 编程助手Qwen2.5-Coder，它已经成为Hugging Face Spaces上第二受欢迎的演示。早期测试表明，它的性能可与 GPT-4o 相媲美，并…

王浩然
2024年11月13日
000
AI前沿

新的AI产品创建平台Arcade设计了这款项链

化妆品零售商 Eve 和设计市场 Minted 的创始人 Mariam Naficy 长期以来一直致力于支持独立艺术家并帮助他们销售产品。她的最新创业项目Arcade AI是一个新…

王浩然
2024年10月28日
000
AI前沿

专家表示，OpenAI 的专利承诺只不过是“美德信号”

本周，OpenAI 在其网站上悄然发布了一份声明，承诺不会以攻击性的方式使用其专利。 OpenAI 坚称其坚持“广泛使用”和“合作”原则，并表示将只以支持创新的方式使用其专利。该公…

点点
2024年10月18日
000
AI前沿

利用人工智能预测和预防互联网中断

随着对减少服务中断和提高连接可靠性的需求不断增长，无缝的用户体验已成为任何互联网提供商的服务基准。为了满足这一需求，人工智能 (AI) 应运而生，成为一项不断发展的技术，可确保跨地…

王浩然
2024年12月8日
000
AI前沿

佳士得宣布人工智能艺术品拍卖，但并非所有人都满意

艺术品拍卖行佳士得此前曾出售过人工智能生成的艺术品。但很快，佳士得计划举办首场专门展示人工智能创作作品的展览，这一消息引发了褒贬不一的评价。佳士得将此次拍卖称为“增强智能”，拍卖…

王浩然
2025年2月10日
000
AI前沿

微软利用三哩岛核电站为人工智能提供动力

训练人工智能背后大型语言模型的数据中心消耗着难以想象的大量能源，大型科技公司必须确保有足够的电力来运行这些工厂。这就是微软现在全力支持核电的原因。这家科技巨头周五与核电站运营商 …

王浩然
2024年9月21日
000
AI前沿

Slack 的人工智能代理有望利用情境能力重塑生产力

Slack将把Salesforce 的Agentforce AI 代理深度整合到其工作场所协作平台中，强调情境智能是日益拥挤的 AI 代理市场中的关键差异化因素。 Slack 首席…

王浩然
2024年12月19日
000

发表回复

Please Login to Comment

OpenAI 的 DevDay 为 AI 应用开发者带来实时 API 和其他福利

相关推荐

发表回复

Share To :