Meta 的 AI 之旅将不可避免地将其带入新兴的 AI 视频领域。现在,马克·扎克伯格领导的这家公司推出了
Movie Gen,这是另一款能够通过简短的文本提示制作出逼真视频的视频生成器。Meta 声称,这款产品对好莱坞和普通 Instagram 用户都同样有用,尽管 Meta 以外的任何人都无法使用它。Movie Gen 可以创建音频,这使其成为 我们见过的最强大的深度伪造生成器。
在一篇博客文章中,Meta 展示了几个示例视频,其中包括一只快乐的小河马在水下游泳,不知何故漂浮在水面下,似乎毫无问题地屏住呼吸。其他视频展示了穿着“维多利亚时代”服装的企鹅,袖子和裙子太短,无法代表那个时代。还有一个视频,一个女人在猎豹旁边做 DJ,猎豹太专注于节拍而不在乎眼前的危险。
每个人都在进入人工智能视频生成领域。今年,微软的 VASA-1和OpenAI 的 Sora已经承诺通过简单的文本提示生成“逼真”的视频。尽管早在 2 月份就曾预告过 Sora,但至今尚未面世。Meta 的 Movie Gen 比竞争对手提供了更多功能,包括使用文本提示编辑现有视频、基于图像创建视频以及为创建的视频添加人工智能生成的声音。
视频编辑套件似乎特别新颖。它既适用于生成的视频,也适用于真实世界的捕捉。Meta 声称其模型“保留了原始内容”,同时为镜头添加了元素,无论是背景还是场景主角的服装。Meta 展示了如何拍摄人物照片并将其放入生成的电影中。
Meta 已经有了音乐和声音生成模型,但这家社交媒体巨头展示了几个 13B 参数音频生成器的示例,该生成器可以在视频中添加音效和配乐。文本输入可以简单到“树叶沙沙作响和树枝折断”,然后添加到生成的蛇在森林地面上蜿蜒的视频中。音频生成器目前限制为 45 秒,因此它不会为整部电影配乐。至少,现在还不会。
不,抱歉,你还不能使用它。Meta 的首席产品官 Chris Cox 在 Threads 上写道:“我们还没有准备好在短期内将其作为产品发布——它仍然很昂贵,而且生成时间太长。”
Meta在讨论 Movie Gen 的白皮书中表示,整个软件套件由多个基础模型组成。该公司最大的视频模型是一个 30B 参数转换器模型,最大上下文长度为 73,000 个视频标记。音频生成器是一个 13B 参数基础模型,可以进行视频转音频和文本转音频。
很难将其与最大的 AI 公司的视频生成器进行比较,尤其是因为 OpenAI声称Sora 使用“称为补丁的数据,每个补丁都类似于 GPT 中的令牌”。Meta 是少数仍在使用其新 AI 工具发布数据的大公司之一,随着 AI 过度商业化,这种做法已被抛弃。尽管如此,Meta 的白皮书并没有提供太多关于其 Movie Gen 训练数据来源的信息。很有可能,数据集的一部分来自Facebook 用户的视频。Meta 还使用您使用Meta Ray-Ban智能眼镜拍摄的照片来训练其 AI 模型。
目前你还不能使用 Movie Gen。相反,其他 AI 电影生成器(如RunwayML 的 Gen 3)会提供有限数量的代币来制作短片,之后你才需要付费。404 Media今年早些时候发布的一份报告指出,Runway 通过数千个 YouTube 视频训练了其 AI,与大多数 AI 初创公司一样,它在抓取这些内容之前从未征求过许可。
Meta 表示,在创建此模型时,它与电影制作人和视频制作人密切合作,并将在 Movie Gen 的开发过程中继续保持这种合作。今年早些时候的报道表明,电影公司已经开始与人工智能公司拉近关系。独立宠儿 A24 最近与专门从事人工智能的 VC 公司合作,其中一些与 OpenAI 有关。另一方面,据报道,Meta 正在与朱迪·丹奇和奥卡菲娜等好莱坞明星洽谈,希望在未来的人工智能项目中使用他们的声音。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/meta-de-movie-gen-ai-shi-pin-sheng-cheng-qi-neng-gou-zhi