OpenAI 扩展 Realtime API，提供新声音，并为开发人员降低价格

王浩然 • 2024年10月31日下午10:00 • AI前沿 • 99 views

OpenAI今天更新了其 Realtime API，目前处于测试阶段。此更新为其平台添加了用于语音转语音应用程序的新声音，并降低了与缓存提示相关的成本。

Realtime API 的 Beta 用户现在将有五种新声音可用于构建他们的应用程序。OpenAI 在 X 上的一篇文章中展示了三种新声音，分别是 Ash、Verse 和英国风格的 Ballad。

该公司在其API 文档中表示，原生语音转语音功能“跳过中间文本格式，意味着低延迟和细致入微的输出”，而且语音比以前的语音更容易操控、更具表现力。

然而，OpenAI 警告称，由于该 API 仍处于测试阶段，因此目前无法提供客户端身份验证。它还表示，实时音频处理可能存在问题。

该公司表示：“网络条件严重影响实时音频，当网络条件不可预测时，从客户端向服务器大规模可靠地传送音频是一项挑战。”

OpenAI 在人工智能语音和声音方面的历史一直备受争议。今年 3 月，该公司发布了语音克隆平台Voice Engine ，以与ElevenLabs竞争，但只向少数研究人员开放。今年 5 月，在该公司演示了GPT-4o 和语音模式后，该公司暂停使用其中一种声音 Sky，因为女演员斯嘉丽·约翰逊 (Scarlett Johansson) 表示 Sky的声音与她的声音相似。

该公司于 9 月在美国向付费用户（使用 ChatGPT Plus、Enterprise、Teams 和 Edu 的用户）推出了 ChatGPT 高级语音模式。

语音转语音 AI 理想情况下可以让企业使用语音建立更实时的响应。假设客户致电公司的客户服务平台。在这种情况下，语音转语音功能可以接收客户的声音，理解他们的询问，并使用延迟较低的 AI 生成的声音进行响应。语音转语音还允许用户生成画外音，用户说出他们的台词，但声音输出不是他们的。提供此功能的一个平台是Replica，当然还有 ElevenLabs。

OpenAI本月在其开发日期间发布了 Realtime API。该 API 旨在加快语音助手的构建。

降低成本

不过，使用语音到语音功能可能会很昂贵。

Realtime API 推出时，定价结构为每分钟音频输入 0.06 美元，每音频输出 0.24 美元，这并不便宜。不过，该公司计划通过即时缓存来降低实时 API 价格。

缓存的文本输入将减少 50%，缓存的音频输入将减少 80%。

OpenAI 还在开发日期间宣布了 Prompt Caching，并将在模型内存中保存经常请求的上下文和提示。这将减少生成响应所需创建的令牌数量。降低输入价格可以鼓励更多感兴趣的开发人员连接到 API。

OpenAI并不是唯一一家推出 Prompt Caching 的公司。Anthropic于 8 月为 Claude 3.5 Sonnet推出了 Prompt Caching 。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/openai-kuo-zhan-realtime-api-ti-gong-xin-sheng-yin-bing-wei

Like (0)

王浩然作者

0 0

Regal 声称其客户服务聊天机器人比大多数聊天机器人都要好

Previous 2024年10月31日

谷歌的人工智能系统可能会改变我们的写作方式：InkSight 将手写笔记数字化

Next 2024年11月1日

AI前沿

OpenAI 招募微软副总裁，加剧 AI 人才争夺战

Sebastien Bubeck 曾任微软生成式人工智能副总裁

点点
2024年10月22日
000
AI前沿

微软正致力于打造适用于Copilot的3D游戏体验‌

近期，有迹象表明微软正着手开发一款专为Copilot设计的3D游戏体验。这一举措不仅彰显了微软在游戏领域的持续探索与创新，也预示着AI与游戏技术的深度融合将迎来新的发展阶段。据悉…

王浩然
2025年3月12日
000
AI前沿

边缘数据对人工智能至关重要——戴尔如何帮助企业释放其价值

预计到明年，超过 50% 的企业数据将在传统数据中心或云之外创建和处理。在这个人工智能时代，企业需要能够快速访问边缘数据并从中提取价值——但这样做可能既耗时又复杂，而且许多企业领导…

王浩然
2024年11月13日
000
AI前沿

呼吁人工智能平台适度引入拟人化

观点：在虚构的《星球大战》宇宙中，没有人认真对待人工智能。在乔治·卢卡斯 47 年前的科幻系列电影中，人类历史时间轴上不存在来自奇点和机器学习意识的威胁，人工智能仅限于自主移动机器…

点点
2024年10月15日
000
AI前沿

人工智能如何塑造民主对话的未来

在当今政治两极分化的世界中，在复杂的社会和政治问题上找到共同点变得越来越困难。随着社会变得越来越多元化，气候变化、移民和经济政策等关键问题上的分歧只会越来越大。让人们聚在一起就复杂…

点点
2024年11月5日
000
AI前沿

引导人工智能部署：避免陷阱并确保成功

通往人工智能的道路不是短跑，而是一场马拉松，企业需要调整自己的步伐。那些在学会走路之前就开始跑步的人将会失败，成为那些试图快速到达人工智能终点线的企业的坟墓。事实是，没有终点线。没…

点点
2024年10月12日
000
AI前沿

Google 的 Gemini API 和 AI Studio 助力 Google 搜索

从今天开始，使用 Google Gemini API 及其Google AI Studio构建基于 AI 的服务和机器人的开发人员将能够利用 Google 搜索的数据来支持其提示结…

王浩然
2024年11月2日
000
AI前沿

MiniMax 推出自己的开源 LLM，具有行业领先的 4M 代币上下文

如今，MiniMax 在美国最为人熟知的身份可能是Hailuo背后的这家新加坡公司。Hailuo 是一种逼真的高分辨率生成式 AI 视频模型，可与Runway、OpenAI 的 S…

王浩然
2025年1月15日
000
AI前沿

X 在巴西扭转局势

埃隆·马斯克旗下的社交网络 X（前身为 Twitter）似乎在与巴西最高法院的对抗中退缩了。《纽约时报》报道了一份新的法庭文件，其中该公司的律师表示，X 已经遵守了法庭的命令——…

点点
2024年9月23日
000
AI前沿

高通推出用于个人电脑、汽车、智能家居和企业的人工智能芯片

高通在2025 年消费电子展 (CES 2025)上发布了针对个人电脑、汽车、智能家居和企业的人工智能技术和合作。在拉斯维加斯举行的大型科技贸易展上，高通技术公司展示了如何利用其…

王浩然
2025年1月7日
000
AI前沿

人类新视野：Anthropic科学家揭示AI的“思考”方式，发现其秘密规划并偶尔说谎‌

在人工智能领域，科学家们一直致力于探索和理解大型语言模型（LLMs）如何处理信息并做出决策。近日，Anthropic公司的一项新研究为我们揭示了这些AI系统内部工作的惊人细节，发现…

王浩然
2025年3月31日
000
AI前沿

2024年电子游戏发布时间表在“从《星球大战不法分子》中学习”后，《刺客信条：阴影》推迟到2025年2024年电子游戏发布时间表

育碧宣布大幅推迟《刺客信条：暗影》，该版将于2025年2月14日发布，而不是之前计划于今年11月发布。现有的预购将退还。出版商一直以《刺客信条》大片的年度关键假日销售期为目标，这…

点点
2024年9月26日
000
AI前沿

在建立真正的业务关系的同时探索人工智能世界

人工智能 (AI) 的发展速度超乎人们的想象。从提高生产力到改善决策能力和创造力，工作场所中的人工智能不再是一个未来概念，而是我们日常生活中不可或缺的一部分。根据微软的 2024 …

点点
2024年9月21日
000
AI前沿

埃隆·马斯克 xAI 推出 Grok 3 以挑战竞争对手

马斯克称之为“可怕的智能”的人工智能聊天机器人进入市场，与 OpenAI 和 DeepSeek 直接竞争埃隆·马斯克的人工智能初创公司 xAI 推出了 Grok 3，这是一款新型…

王浩然
2025年2月19日
000
AI前沿

周三亚马逊Alexa活动前瞻‌

在科技日新月异的今天，智能助手已成为我们生活中不可或缺的一部分。亚马逊的Alexa作为智能助手的佼佼者，其每一次更新都备受瞩目。本文将为您揭秘周三即将举行的亚马逊Alexa活动，带…

王浩然
2025年2月27日
000
AI前沿

OpenAI 和 Anthropic 同意将模型送交美国政府进行安全评估

OpenAI和Anthropic与美国国家标准与技术研究所（NIST）下属的人工智能安全研究所签署协议，合作开展人工智能模型安全研究、测试和评估。该协议为人工智能安全…

王浩然
2024年9月2日
000
AI前沿

改变我们在董事会中对 GenAI 的看法：把握短期和长期投资回报率

随着世界各地的领导团队开始规划 2025 年，每个人都在思考一个问题：他们在人工智能和/或生成式人工智能 (GenAI) 上的投资何时能获得回报。Google Cloud 的最新研…

点点
2024年10月11日
000
AI前沿

OpenAI的ChatGPT用户激增至4亿，GPT-5即将面世‌

OpenAI的ChatGPT用户量已突破4亿周活跃用户大关，这一里程碑彰显了公司在消费者和企业市场的快速扩张。根据首席运营官Brad Lightcap周四在X平台上的帖子，Chat…

王浩然
2025年2月22日
000
AI前沿

Cloudflare 的新市场将允许网站向 AI 机器人收取抓取费用

Cloudflare周一宣布计划在明年推出一个市场，网站所有者可以向 AI 模型提供商出售抓取其网站内容的权限。该市场是 Cloudflare 首席执行官 Matthew Prin…

王浩然
2024年9月24日
000
AI前沿

科学家如何在太空中研究宇航员的心理健康

保持宇航员在太空中的健康不仅仅是确保他们有足够的运动和好的食物。考虑他们的心理健康也很重要。这是任何工作的一个重要因素，但对于在国际空间站（ISS）上生活在太空中的人来说尤其重要。…

点点
2024年9月29日
000

发表回复

Please Login to Comment

OpenAI 扩展 Realtime API，提供新声音，并为开发人员降低价格

降低成本

相关推荐

发表回复

Share To :