aiOla 推出开源AI 音频转录模型,可实时隐藏敏感信息

aiOla 推出开源AI 音频转录模型,可实时隐藏敏感信息

希望使用人工智能模型来转录高管、员工和客户的音频(特别是人类语音)的企业可能会对人工智能程序监听和记录敏感信息的想法持谨慎态度。

然而,以色列音频 AI 初创公司aiOla有一个新的模型来解决这一问题。aiOla 的新 Whisper-NER 建立在 OpenAI 的行业标准开源模型 Whisper 之上,本身是完全开源的,现在可在Hugging Face和Github上获取,供企业组织和个人使用、调整、修改和部署。

它将自动语音识别 (ASR) 与命名实体识别 (NER) 相结合。这项创新旨在通过在转录过程中自动识别和屏蔽姓名、电话号码和地址等敏感信息来增强隐私。

Hugging Face还提供了一个演示模型供用户试用,允许他们录制语音片段,并让模型在生成的打字记录中屏蔽他们输入的特定单词。在我的简短测试中,该模型成功地屏蔽了我讲话中的“VentureBeat”一词,这是一个专有名词和通用语。

Whisper-NER 解决了口语内容转录中的一项重大挑战:确保隐私并遵守数据保护法规。该模型处理音频文件,同时应用 NER 直接在转录管道内标记或屏蔽特定类型的敏感信息。与传统的多步骤系统不同,传统的多步骤系统会在中间处理阶段暴露数据,而 Whisper-NER 无需单独的 ASR 和 NER 工具,从而降低了漏洞的风险。

aiOla 研究副总裁 Gill Hetz 在最近接受 VentureBeat 视频电话采访时表示:“我们将其设计为一种开源工具,旨在提高人工智能的隐私保护。它可以帮助用户屏蔽敏感数据,而无需额外的软件步骤。”

此前,aiOla 因发布 Whisper 变体而闻名,该变体可以准确可靠地识别行业特定的术语并将其转录,以及更快的语音到文本和语音识别模型。

完全开源,供社区和商业使用

Whisper-NER 是完全开源的,并在 MIT 许可下使用,允许用户自由采用、修改和部署它,包括用于商业应用。

该模型可在 GitHub 和 Hugging Face 上访问,确保其高级功能得到广泛应用。还提供了演示,以帮助用户探索其功能和适应性。

开源发布符合aiOla促进协作和创新的理念。

“当人们合作时,人工智能就会向前发展,”Hetz 说。“这就是我们将这个模型开源的原因——鼓励社区采用和改进。”

语音和数据隐私方面的创新

Whisper-NER 建立在 OpenAI 的 Whisper 框架之上,在结合了合成语音和基于文本的 NER 数据集的合成数据集上进行训练。这种独特的训练方法使模型能够同时处理转录和实体识别任务,从而提供卓越的准确性。

Hetz 表示:“我们不再将 ASR 转录和 NLP [自然语言处理] 实体提取分开,而是将两者合并到一个模块中。提取文本时,模型会同时识别指定实体。”

这种综合方法在开放获取、非同行评审网站 arXiv.org 上发表的一篇研究论文中进行了描述,它不仅简化了工作流程,而且显著增强了数据安全性。

此外,Whisper-NER 支持零样本学习,使其能够识别和屏蔽训练期间未明确包含的实体类型。

Whisper-NER 的灵活性使其适用于各种用例,包括合规性监控、库存管理、质量保证等。

对于不需要屏蔽的应用程序,可以配置模型以简单标记敏感实体,为组织提供适合其需求的可定制选项。

赫兹表示:“医疗保健和法律等受到严格监管的行业从我们的隐私优先方法中受益最多,但即使是敏感数据有限的公司也可以使用这项技术。”

道德人工智能和适应性

Whisper-NER 实现了安全、注重隐私的转录,代表着道德 AI 开发的进步。它的开源可用性确保开发人员、研究人员和组织可以自由地将该模型纳入他们的运营中。通过降低与数据泄露相关的风险,它符合医疗保健、法律和客户服务等行业对安全、AI 驱动的解决方案日益增长的需求。

“这个版本基于 Whisper 构建,最适合英语,但支持多种语言。开源贡献者可以进一步调整它以适应不同的语言和术语,”Hetz 解释道。aiOla 鼓励全球贡献,以扩大该模型的覆盖范围和功能。

随着 Whisper-NER 向公众开放,aiOla 加强了其致力于创建负责任的 AI 工具的承诺,这些工具优先考虑用户隐私和安全,同时通过开放访问促进协作和创新。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/aiola-tui-chu-kai-yuan-ai-yin-pin-zhuan-lu-mo-xing-ke-shi

Like (0)
王 浩然的头像王 浩然作者
Previous 2024年11月23日
Next 2024年11月24日

相关推荐

发表回复

Please Login to Comment