OpenAI 今天宣布公开发布其超现实主义 AI 视频生成软件Sora——距离 2024 年 2 月首次公开展示已过去近 10 个月。
事实上,OpenAI 实际上发布的是比当时首次亮相的模型升级很多的模型:新的 Sora Turbo 将在sora.com上提供给美国和欧盟及英国以外大多数国家的 ChatGPT Plus 和 Pro 付费用户(每月 20 美元或 200 美元)。
OpenAI 联合创始人兼首席执行官 Sam Altman 在 YouTube 直播中宣布了这一消息,这是该公司“OpenAI 12 天”系列假日主题公告的一部分,定于美国东部时间下午 1 点/太平洋时间上午 10 点发布。
Sora 可以从文本输入或静止图像生成各种视频,创建时长在 10 到 20 秒之间的剪辑,并且分辨率范围从 480p 到 1080p,宽高比从横向到方形和垂直。
OpenAI 为该产品创建了一个全新的独特界面,其中包括网格或列表视图,用户可以在其中切换以查看他们的世代。
用户还可以进入“故事板”模式,该模式允许他们在时间轴视图中生成多个链接剪辑。该模型试图在剪辑之间提供无缝过渡——用户可以拖动以使剪辑更突然,或使剪辑时间更长、更流畅。
ChatGPT Plus 用户每月最多可以生成 50 个 480p 分辨率的视频。
对于专业人士和重度用户,Pro 计划提供更高的分辨率、更长的持续时间以及低速下的无限生成。
OpenAI 还宣布计划在 2025 年初推出针对不同用户需求的定制定价选项。
MKBHD 发布的消息
著名科技评论 YouTuber Marques Brownlee(其昵称 MKHBD)在 Sora 发布前大约一小时爆料了 Sora 被释放的消息。
“传言是真的——OpenAI 的 AI 视频生成器 SORA 今天将向公众推出…”布朗利在社交网络 X 的一篇帖子中写道。
布朗利还分享了他使用文本/图像/视频到视频生成器制作的视频示例,作为 OpenAI 在该程序全面发布之前为其提供种子的数十位早期创意合作伙伴之一,他获得了该程序的早期使用权。
布朗利分享说,虽然 Sora 可以制作出令人印象深刻、有时甚至令人毛骨悚然的逼真镜头,例如新闻播音员或像他这样的小工具评论员的镜头,但它也倾向于产生幻觉,产生随机细节和人工智能生成的迹象,例如新闻字幕中乱码、无意义的文字,非自然的物理现象,甚至看似随机地添加或删除物体。
他还指出,OpenAI 对生成真实人物的肖像以及暴力和露骨主题的内容实施了相当严格的限制。
不过,在他的完整YouTube 评论中,他最终也得出结论:“这对人类来说现在还有很多需要消化的事情……[它]是新的基准,这再次是有史以来最糟糕的一次。”
早期测试人员抗议在 Hugging Face 上泄露
大约两周前,beta 测试人员将 Sora泄露给 AI 代码共享社区 Hugging Face,以抗议 OpenAI 对 beta 测试程序的处理方式。正如泄密者在他们的 Hugging Face 空间中写道:
“数百名艺术家通过漏洞测试、反馈和实验工作为这家市值 1500 亿美元的公司提供无偿劳动。虽然数百人免费贡献,但少数人将通过比赛被选中,以放映他们用 Sora 创作的电影——提供的报酬微不足道,与 OpenAI 获得的大量公关和营销价值相比微不足道。”
Sora 的出现正值现实真人版 AI 视频生成领域竞争日趋激烈之际。Runway继续快速升级其 AI 视频生成平台,推出新功能,包括上周推出的重新录制现有镜头中的对话并匹配角色面部的功能。仅在过去几周内, Luma AI和中国竞争对手(如Kling、Hailuo以及最近的腾讯)都推出了令人印象深刻的 AI 视频生成工具。
因此,尽管 OpenAI 凭借 ChatGPT 的成功和早期引人注目的 Sora 视频,可能拥有强大的知名度,有助于向大众推广这款新型 AI 视频生成器,但现在有许多竞争选项似乎至少从表面上看可以提供类似或更好的视频质量。这使得 Sora 的成功率降低。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/openai-xiang-gong-zhong-fa-bu-chao-xian-shi-zhu-yi-ai-shi