IMAX 利用 AI 扩大原创内容覆盖范围

IMAX 利用 AI 扩大原创内容覆盖范围

随着全球内容消费量不断增长,对非英语内容的需求超过对英语电影和节目的需求,IMAX 正在利用人工智能来扩大其原创内容的本地化。

根据普华永道的报告,娱乐和媒体行业在 2023 年将增长 5%,达到 2.8 万亿美元。预计该行业将继续扩张,但未来五年的复合年增长率将接近 4%,达到 3.4 万亿美元。即使在美国、英国、澳大利亚和加拿大等英语市场,非英语内容也在迅速增长。去年,Netflix 报告称,过去三年来,其在英国的非英语内容观众人数增长了 90% 。

IMAX 已经考虑到了所有这些因素,目前正在探索利用人工智能进行本地化,以吸引更多眼球。

周一,这家以大型影院和沉浸式电影体验而闻名的加拿大制作剧院公司宣布与迪拜初创公司Camb.ai合作,使用其人工智能语音模型翻译原创内容,包括纪录片。

Camb.ai 已为澳大利亚网球公开赛欧洲电视网美国职业足球大联盟等现场体育赛事和联赛部署了 AI 配音和语音翻译功能,该公司提供 Boli 模型用于语音转文本翻译,提供 Mars 模型用于语音模拟。这些模型可通过这家初创公司的 DubStudio 平台获得,该平台支持 140 种语言,包括互联网上没有大量数据的各种资源匮乏的语言。

Camb.ai 联合创始人兼首席技术官 Akshat Prakash 在接受独家采访时表示:“OpenAI 和 Anthropic 等公司对社会有着不同的愿景。他们试图建立非常横向的模型,可以覆盖广泛的任务。……我们根本不需要这样做。我们的一些模型参数不到 1 亿,而且非常专业。”

普拉卡什 (Prakash) 是前苹果工程师,曾与团队合作开发 Siri 的 AI 和 ML 模型,去年他与父亲阿夫尼什·普拉卡什 (Avneesh Prakash) 共同创立了 Camb.ai。

“我们是一代人,都在印度长大。三十年过去了,我们遇到了同样的语言挑战,”这位首席技术官说。

他说,Camb.ai 使用学术授权数据集对 70% 的模型进行了预训练,这些数据集具有商业用途。其余 30% 涉及通过早期合作伙伴获得的数据进行微调,这些合作伙伴将其模型部署用于基于 AI 的配音和翻译。

“我们不会做可能会破坏互联网的事情,我们一直非常小心,完全避免这种情况,”普拉卡什断言道。“有些公司认为他们可以侥幸逃脱惩罚,因为他们正在开发面向消费者的应用程序或工具,他们认为抓取互联网的 10PB 数据是没问题的。”

Camb.ai 采用“三层”方法提供基于 AI 的翻译,包括其 Boli 和 Mars 模型的基础层、托管这些 AI 模型的基础设施层,以及用于前端的 DubStudio 平台。

Prakash 称,与其他基于 AI 的模型不同,Camb.ai 的 Boli 会输入语音标记,生成翻译语言的输出文本标记,并保留细微差别。一旦 Boli 生成文本,Mars 就会使用相同的音频输入信号将文本翻译成语音,以捕捉实际音频的表现,包括环境声音,例如体育赛事中观众欢呼的背景音乐,他说。

Prakash表示,Camb.ai 的技术可以同时提供多达 10 种语言的语音翻译,延迟时间为 20 到 30 秒,可以通过 30 到 40 秒的流媒体和广播延迟来弥补。

IMAX 将分阶段推出 AI 翻译,首先从资源丰富的语言开始。此次部署是在 Camb.ai 对其原始内容进行内部测试后进行的。

IMAX Global 总裁马克·韦尔顿 (Mark Welton) 表示:“虽然我们的合作才刚刚开始,但我们将继续合作,更好地探索其潜力以及如何最好地推动我们前进。”

韦尔顿表示,人工智能的部署将有助于节省翻译成本,但他没有透露具体细节。

Camb.ai 目前拥有 50 名员工。2 月份,该公司在由 Courtside Ventures 领投的种子轮融资中筹集了 400 万美元。Prakash表示,这家初创公司正在完成更大规模的 A 轮前融资,以扩大其覆盖范围和员工人数。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/imax-li-yong-ai-kuo-da-yuan-chuang-nei-rong-fu-gai-fan-wei

Like (0)
王 浩然的头像王 浩然作者
Previous 2024年11月29日
Next 2024年11月30日

相关推荐

发表回复

Please Login to Comment