Hume 推出语音控制功能，让用户和开发者可以发出自定义 AI 声音

王浩然 • 2024年12月3日下午1:00 • AI前沿 • 83 views

Hume AI是一家专注于情感智能语音界面的初创公司，它推出了语音控制，这是一项实验性功能，使开发人员和用户能够通过精确调节声音特征来创建自定义 AI 声音 – 无需编码、AI 提示工程或声音设计技能。

此版本以公司早期的 Empathic Voice Interface 2 (EVI 2) 奠定的基础为基础，引入了自然性、情感响应和定制方面的高级功能。

EVI 2 和语音控制都避免了语音克隆的风险，Cowen 表示这种做法存在道德和实践挑战。

相反，Hume 专注于提供工具来创建符合用户需求的独特、富有表现力的声音，例如客户服务聊天机器人、数字助理、导师、指南或辅助功能。

超越预设的 AI 语音，迈向定制化解决方案

语音控制为开发人员提供了从 10 个不同维度调整声音的能力，其中包括：

“男性/女性：性别的发声，范围在更男性化和更女性化之间。

自信度：声音的坚定度，介于胆怯和大胆之间。

浮力：声音的密度，范围介于放气和浮力之间。

自信：声音的确定程度，介于害羞和自信之间。

热情：声音中的兴奋，介于平静和热情之间。

鼻音：声音的开放度，范围在清晰与鼻音之间。

放松度：声音中的压力，介于紧张与放松之间。

平滑度：声音的质感，介于平滑和断奏之间。

温和：声音背后的活力，介于温和与有力之间。

紧密度：声音的包容度，范围介于紧密和气息之间。”

这款无需编码的工具允许用户通过虚拟屏幕滑块实时微调语音属性。它目前在 Hume 的虚拟游乐场中可用，需要免费用户注册才能访问。

该版本解决了人工智能行业的一个关键痛点：对预设声音的依赖，这往往无法满足品牌或应用程序的特定需求，或者与语音克隆相关的风险。

这种对定制化的关注与休姆开发具有情感细微差别的语音人工智能的更广泛目标相一致。

2024 年 9 月，随着EVI 2 的推出，该公司在语音 AI 方面的努力得到了凸显，该公司称这是对其前代产品的重大升级。

EVI 2 将延迟降低了 40%，成本降低了 30%，并扩展了语音调制功能，为开发人员提供了一种比语音克隆更安全的替代方案。

滑块 > 文字提示

Hume 的研究驱动方法在其产品开发中发挥着核心作用。该公司由前谷歌 DeepMinder Alan Cowen 共同创立，采用基于跨文化语音记录和情感调查数据的专有模型。

这种植根于情感科学的方法构成了 EVI 2 和新推出的语音控制的支柱。

语音控制通过解决人类感知声音的细微、通常难以言喻的方式扩展了这些原则。

该工具的基于滑块的界面反映了声音的常见感知品质，例如浮力或自信度，而不会试图通过基于文本的提示过度简化这些属性。

开发人员工具

语音控制目前已推出测试版本，并与 Hume 的 Empathic Voice Interface (EVI) 集成，使其可用于广泛的应用程序。

开发人员可以选择基本语音，调整其特性，并实时预览结果。此过程可确保会话间的可重复性和稳定性，这是客户服务机器人或虚拟助手等实时应用程序的关键功能。

EVI 2 的影响在语音控制功能上显而易见。早期型号引入了对话提示和多语言功能等功能，这些功能拓宽了语音 AI 应用的范围。

例如，EVI 2 支持亚秒级响应时间，实现自然、即时的对话。它还允许在交互过程中动态调整说话风格，使其成为企业的多功能工具。

在竞争激烈的市场中脱颖而出

Hume 专注于语音定制和情商，这使其成为语音 AI 领域的强大竞争对手，甚至可以与资金雄厚的竞争对手抗衡，例如拥有高级语音模式的 OpenAI 和 ElevenLabs，这两家公司都提供预设声音库。

Hume 继续在其语音 AI 创新方法的基础上继续发展。扩展语音控制的计划包括引入更多可修改维度、在极端调整下改善语音质量以及增加可用的基本语音范围。

随着语音控制的推出，Hume 巩固了其在语音 AI 创新领域的领先地位，提供优先考虑定制、情商和实时适应性的工具。开发人员现在可以通过 Hume 的平台访问语音控制，这标志着 AI 驱动的语音解决方案的发展又向前迈进了一步。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/hume-tui-chu-yu-yin-kong-zhi-gong-neng-rang-yong-hu-he-kai

Like (0)

王浩然作者

0 0

Couchbase 推出全新 Capella AI 服务，让企业 AI 更贴近数据

Previous 2024年12月3日

Pinecone 通过级联检索扩展矢量数据库，将企业 AI 准确率提高高达 48%

Next 2024年12月3日

AI前沿

谷歌利用人工智能编写新代码；裁员

谷歌首席执行官桑达尔·皮查伊 (Sundar Pichai)在第三季度财报电话会议上表示，谷歌超过四分之一的新代码是由人工智能生成的。他说，然后工程师们会审查并接受代码，帮助他…

王浩然
2024年11月7日
000
AI前沿

人工智能代理入门（第 2 部分）：自主性、保障措施和陷阱

在我们的第一部分中，我们概述了利用 AI 代理提高企业效率的关键策略。我解释了与独立 AI 模型不同，代理如何使用上下文和工具迭代地优化任务以增强代码生成等结果。我还讨论了多代理系…

王浩然
2024年11月27日
000
AI前沿

波士顿动力人形机器人将获得新功能

机器人与人工智能研究所合作旨在在过去研究的基础上推进包括 Atlas 在内的人形机器人的发展波士顿动力公司与机器人与人工智能研究所（前身为人工智能研究所）合作，通过强化学习推…

王浩然
2025年2月19日
000
AI前沿

AI图像生成新纪元：迎接Reve Image 1.0的到来

在人工智能领域，图像生成技术一直是一个令人兴奋且充满挑战的研究方向。随着技术的不断进步，我们见证了从模糊到清晰、从简单到复杂的图像生成过程的演变。如今，一款名为Reve Image…

王浩然
2025年3月28日
000
AI前沿

色情生成器、作弊工具和“专家”医疗建议：深入探究OpenAI的定制聊天机器人市场

Gizmodo 对 OpenAI 的 GPT 商店进行的分析发现，超过 100 种工具似乎违反了该公司关于性内容、欺骗、法律和医疗建议、赌博、虚假评论生成和浪漫陪伴的政策。去年 …

王浩然
2024年9月5日
000
AI前沿

自动驾驶送货机器人获得 AI 升级；Uber Eats 将于 2025 年部署 2,000 个

Serve Robotics 推出其先进的新型送货机器人

点点
2024年10月22日
000
AI前沿

微软刚刚放弃了 Drasi，它可能会改变我们处理大数据的方式

微软推出了一种新的开源数据处理系统Drasi ，旨在简化对复杂基础设施中关键事件的检测和响应。此次发布是继去年推出面向云的开放应用平台Radius之后的又一举措，进一步巩固了微软…

王浩然
2024年10月6日
000
AI前沿

仓库中的机器人经过人工智能训练，可实现更快的分类

Ambi Robotics 最近发布了 Prime-1，该公司称这是第一个用于商业仓库运营中部署的机器人分拣机的 AI 基础模型。 Prime-1 代表可立即投入生产的工业操作专家…

王浩然
2025年1月26日
000
AI前沿

科学家如何在太空中研究宇航员的心理健康

保持宇航员在太空中的健康不仅仅是确保他们有足够的运动和好的食物。考虑他们的心理健康也很重要。这是任何工作的一个重要因素，但对于在国际空间站（ISS）上生活在太空中的人来说尤其重要。…

点点
2024年9月29日
000
AI前沿

合成数据的前景与风险

有可能仅使用另一个人工智能生成的数据来训练一个人工智能吗？这听起来可能有点荒唐。但这个想法已经存在了相当长一段时间——而且随着新的真实数据越来越难获得，这种想法越来越受到关注。 A…

王浩然
2024年10月14日
000
AI前沿

2024 年融资金额达 1 亿美元或以上的 39 家美国 AI 初创公司的完整名单

对于某些人来说，人工智能疲劳是真实存在的，但显然风险投资者还没有厌倦这一类别。第三季度，人工智能交易继续主导风险投资。根据Crunchbase 的数据，人工智能公司在第三季度筹集…

点点
2024年10月13日
000
AI前沿

微调大法好！揭秘LLaMA 3.1和Orca 2背后的智能炼金术

在当今快节奏的人工智能 (AI) 世界中，微调大型语言模型 (LLM)已变得至关重要。这个过程不仅仅是简单地增强这些模型并对其进行定制以更精确地满足特定需求。随着人工智能继续融…

点点
2024年9月7日
000
AI前沿

开源AI辩论：为什么选择性透明度构成严重威胁‌

在当今科技巨头纷纷宣称其AI产品开源的时代，“开源”这一曾经的内行术语已跃然成为公众视野中的热门词汇。然而，在这个AI技术发展的关键时期，任何公司的失误都可能让公众对AI的信任度倒…

王浩然
2025年3月24日
000
AI前沿

Lapsi 正在重新启动听诊器作为健康跟踪数据平台

医疗技术消费化正在继续：总部位于阿姆斯特丹的初创公司Lapsi Health刚刚获得 FDA 对其首款临床支持工具——数字听诊器的批准。美国医疗器械监管机构食品药品管理局已将其列为…

王浩然
2024年10月1日
000
AI前沿

现代汽车公布未来智慧城市人工智能驱动愿景

现代汽车在 2024 年世界智慧城市博览会上展示了其未来智慧城市愿景，并播放了一部重点介绍尖端技术和合作伙伴关系的电影

点点
2024年9月5日
000
AI前沿

GitHub Spark 让你用简单的英语构建 Web 应用程序

当 GitHub Copilot 推出并开始自动完成代码行（后来是整个代码片段）时，许多人都在问：我们多久才能用自然语言描述一个应用程序，然后 Copilot 会为我们构建它？近几…

王浩然
2024年10月30日
000
AI前沿

Nvidia 对 AI 芯片的霸主地位可能会因此而减弱

在过去几年的人工智能淘金热中，Nvidia 一直主导着“铲子”市场（即训练模型所需的芯片）。但许多领先的人工智能开发商的策略转变为竞争对手提供了机会。 Nvidia 老板黄仁勋呼吁…

王浩然
2025年1月6日
000
AI前沿

微软的新 Magentic-One 系统指挥多个 AI 代理完成用户任务

希望部署多个 AI 代理的企业通常需要实施一个框架来管理它们。为此，微软研究人员最近推出了一种名为Magentic-One 的新型多智能体基础设施，该基础设施允许单个 AI 模…

王浩然
2024年11月10日
000
AI前沿

PIN AI 推出移动应用程序，让您可以在手机上创建自己的个性化、私人 DeepSeek 或 Llama 驱动的 AI 模型

通过《她》和其他众多科幻作品，我们很容易想象这样一个世界：每个人都有自己的个性化人工智能助手——它知道我们是谁、我们的职业、我们的爱好、我们的目标和激情、我们的好恶…&…

王浩然
2025年2月14日
000
AI前沿

谷歌的人工智能笔记应用程序 NotebookLM 现在可以大声向你解释复杂的主题

谷歌周三宣布，其人工智能笔记和研究应用NotebookLM将添加“音频概览”功能。音频概览将为用户提供另一种方式来消化和理解他们上传到该应用的文档中的信息，例如课程阅读材料或法律摘…

王浩然
2024年9月13日
000