Google Cloud 在 Vertex 上推出 Veo AI 视频生成器模型

王浩然 • 2024年12月4日下午2:00 • AI前沿 • 96 views

随着亚马逊凭借其新的 Nova 系列基础模型向人工智能领域迈出重要一步，谷歌也在加倍加强其自身的多模态人工智能能力。这家科技巨头的云部门宣布，其最新的视频和图像生成模型Veo和Imagen 3现已在Vertex AI上可用。

此举使团队能够将尖端的视频和图像生成功能集成到他们的 AI 工作流程中，从而解锁各种用例——尤其是在营销和广告领域。这也使 Google Cloud 成为第一家向客户提供视频模型的超大规模提供商。

虽然 Veo 模型目前处于私人预览阶段，但 Imagen 3 将从下周开始向所有 Vertex AI 用户全面开放。值得注意的是，Imagen 3 还包含编辑功能，使用户能够优化生成的图像以满足特定的创意需求。

Veo 和 Imagen 3 提供什么？

Veo首次亮相于Google I/O 开发者大会，是 Google DeepMind 对 Runway 的 Gen-3 和 OpenAI 的 Sora 等竞争对手的回应，可提供复杂的视频生成体验。该模型将文本或图像提示转换为具有各种视觉风格的电影高清视频，生成超过 60 秒的剪辑。它与众不同之处在于帧级一致性，确保主体在镜头内无缝移动。

Imagen 3 也来自 DeepMind，它负责将文本生成为图像，能够生成各种风格的照片级逼真的视觉效果。谷歌声称它在细节、照明精度和伪影减少方面都超越了前代产品。

除了生成功能外，Google 许可名单上的用户还可以使用 Imagen 3 的高级自定义选项。这些选项包括图像升级、修复、外绘和背景替换 – 所有这些都由文本提示引导。此外，用户可以提供参考图像，使 Imagen 3 能够创建符合特定品牌美学、徽标或产品功能的内容。

对行业的广泛影响

Vertex AI 长期以来一直是 Google Cloud 简化 AI 应用程序开发和部署的旗舰平台。通过集成 Veo 和 Imagen 3，该平台为组织提供了一套更全面的工具，以在营销、销售和其他领域进行创新。

例如，Imagen 3 简化了产品图片和社交媒体内容等高质量资产的创建，而 Veo 则通过为团队提供将这些视觉效果转换为精美视频的选项来扩展此功能。这加快了生产速度、降低了成本并加速了原型制作，使团队能够快速迭代其创意策略。

谷歌产品管理高级总监 Warren Barkley 在一篇博文中表示：“Agoda 等客户正在利用 Veo、Gemini 和 Imagen 等人工智能模型的强大功能来简化其视频广告制作，从而大幅缩短制作时间。”他还强调，这两种模型都包含数字水印和内容审核护栏等安全功能，以减轻与生成式人工智能相关的风险。

其他早期采用者包括亿滋国际（拥有奥利奥、吉百利和妙卡等品牌）和全球营销与传播服务公司 WPP。随着 Google 基础模型的覆盖范围不断扩大，各行各业的企业都有了重新构想视觉内容创作和交付方式的绝佳机会。

竞争持续升温

尽管包括 Google Cloud、Amazon Web Services 和 Microsoft Azure 在内的所有主要云提供商都在各自的 AI 编排平台上提供图像生成模型，但到目前为止，视频生成仍然相当罕见。谷歌今天推出 Veo 私人预览版的举动改变了这一现状。

有趣的是，在 Veo 发布后不久，AWS 在 re:Invent 大会上引起轰动，发布了Nova Reel，这是一个基础模型，可以根据文本和图像提示生成六秒长的工作室质量的视频。

该模型以及 Nova 家族的其他模型将通过Amazon Bedrock推出，Amazon Bedrock 是该公司的完全托管服务，旨在简化生成式 AI 应用程序的创建和部署。

微软目前似乎在这一领域落后了。其AI Foundry不包括视频生成模型。不过，我们预计，一旦 OpenAI 的 Sora 上市，这种情况就会改变。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/google-cloud-zai-vertex-shang-tui-chu-veo-ai-shi-pin-sheng

Like (0)

王浩然作者

0 0

亚马逊推出用于生成文本、图像和视频的 Nova AI 模型系列

Previous 2024年12月4日

AWS SageMaker 正在转型为数据和 AI 的综合中心

Next 2024年12月4日

AI前沿

狮门影业片库卖去炼 AI ，潘多拉魔盒就此打开

AI初创公司Runway近日与狮门娱乐（Lions Gate Entertainment）签订了一项合作协议，旨在将生成式人工智能技术引入电影和电视制作领域。根据该协议，Runw…

点点
2024年9月20日
000
AI前沿

Google NotebookLM不断发展：IT 领导者需要了解其企业应用程序

谷歌的研究工具NotebookLM最近因一项新功能而引起轰动，该功能可让用户生成听起来很像播客的内容。不过，尽管该公司一直在添加新功能，但它也在企业领域看到了越来越多的用例。 N…

王浩然
2024年9月20日
000
AI前沿

研究发现，由于效果不佳，Deepfakes 对 2024 年选举几乎没有影响

尽管互联网上越来越多地充斥着虚假图片，但我们至少可以相信人类在重要时刻嗅出谎言的能力。最近的大量研究表明，人工智能生成的虚假信息对今年全球选举没有产生任何实质性影响，因为它还不是很…

王浩然
2024年12月28日
000
AI前沿

Google Imagen 3 与竞争对手：文本转图像模型的新基准

人工智能 (AI)正在改变我们创建视觉效果的方式。文本转图像模型让我们能够非常轻松地从简单的文本描述生成高质量的图像。广告、娱乐、艺术和设计等行业已经采用这些模型来探索新的创意可能…

点点
2024年10月16日
000
AI前沿

人工智能酒店计划在拉斯维加斯开业：CES 2025

该酒店共有 300 间客房，包括公寓和酒店客房，其中 60% 专供酒店客人使用，40% 专供公寓使用一家全新的人工智能酒店即将在拉斯维加斯开业，并在 CES上亮相。当我们坐在 …

王浩然
2025年1月11日
000
AI前沿

大英百科全书现在是一家人工智能公司

《大英百科全书》曾是20世纪的标志，但在21世纪却被视为过时，如今，它正全力投入人工智能领域，据《纽约时报》报道，它可能很快以近 10 亿美元的估值上市。直到 2012 年印刷业…

王浩然
2024年12月25日
000
AI前沿

Meta 向研究人员开放其 MobileLLM，并发布完整权重

Meta AI 宣布开源MobileLLM，这是一套针对移动设备优化的语言模型，其模型检查点和代码现已在 Hugging Face 上提供。不过，目前它仅在 Creative Co…

王浩然
2024年11月3日
000
AI前沿

Zoom 的定制 AI 头像工具可能存在风险

Zoom 希望将你变成一个由 AI 动画制作的、逼真的头像——但要等到明年某个时候。今天，Zoom 在年度开发者大会上宣布了即将推出的功能，该功能将把用户录制的自己的视频片段转换…

王浩然
2024年10月12日
000
AI前沿

人工智能与区块链和去中心化数据相遇

区块链可以成为去中心化人工智能系统的基础，成为一股强大的力量，透明而公平——确保每个人不仅可以使用技术，还可以获得它带来的回报。随着 OpenAI、谷歌和 Anthropic 等…

点点
2024年10月21日
000
AI前沿

硅谷在 2024 年扼杀了人工智能末日运动

多年来，技术专家一直在敲响警钟，警告先进的人工智能系统可能给人类造成灾难性的破坏。但到了 2024 年，这些警告声被科技行业所推广的生成式人工智能的实用而繁荣的愿景所淹没——这一…

王浩然
2025年1月2日
000
AI前沿

Stable Diffusion 3.5 登陆 Amazon Bedrock：这对企业 AI 工作流程意味着什么

创建精美的生成式 AI 图像可能很有趣也很有用，但这并不是企业所需要的全部。企业文本转图像生成不仅仅是创建图像。它还涉及与现有工作流程和其他企业 AI 工具的集成。这是Stabl…

王浩然
2024年12月20日
000
AI前沿

Hugging Face扩展LeRobot平台，引入自动驾驶机器训练数据‌

Hugging Face近日宣布对其LeRobot平台进行重大扩展，新增了针对自动驾驶机器的训练数据。这一举措旨在提升自动驾驶技术的准确性和可靠性，通过引入高质量的训练数据，助力自…

王浩然
2025年3月12日
000
AI前沿

微软通过新数据工具增强 Fabric 功能，以加速企业 AI 工作流程

今天，微软启动了Ignite 大会，讨论人工智能的各个方面，包括如何组建最大的人工智能代理生态系统，并允许企业使用其提供的 1,800 种大型语言模型中的任何一种来构建更多此类应用…

王浩然
2024年11月21日
000
AI前沿

Okta 的失败对 2025 年身份安全的未来有何启示

2025 年需要成为身份提供者全力改善软件质量和安全各个方面的一年，包括红队，同时使他们的应用程序更加透明，并获得超越标准的结果的客观性。 Anthropic、OpenAI和其他…

王浩然
2024年11月17日
000
AI前沿

拥抱变化而不牺牲传统：人工智能代理对信用合作社的承诺

近年来，金融服务业一直引领创新，推出金融科技、数字银行和其他技术解决方案，该行业在风险投资中一直名列前茅。然而，信用合作社等金融机构的情况却并非如此，它们通常依靠与会员的面对面互动…

王浩然
2025年1月15日
000
AI前沿

利用 RAG 弥补人工智能领域的知识空白：提高性能的技术和策略

人工智能 (AI)彻底改变了我们与技术的互动方式，催生了虚拟助手、聊天机器人和其他能够处理复杂任务的自动化系统。尽管取得了这些进展，但即使是最先进的人工智能系统也面临着重大限制，即…

点点
2024年10月17日
000
AI前沿

网络保险的新挑战：为什么AI驱动的攻击正在突破保险覆盖范围以及未来的应对之策

在当今时代，网络攻击对于现代企业而言可能是致命的，且成本极高。黑客利用AI技术，能够比以往任何时候都更快地利用漏洞。然而，标准的商业保险产品，如一般责任险或专业责任险（即错误与遗漏…

王浩然
2025年2月23日
000
AI前沿

OpenAI 将 o1 AI 模型扩展到企业和教育领域，与Anthropic直接竞争

发布 o1 AI 模型后，OpenAI 引入了「Self-Play」训练方法，让模型与自身不同版本进行对话和推理。为了提升用户体验，OpenAI 又于近日重磅推出了o1-previ…

点点
2024年9月22日
000
AI前沿

OpenAI的GPT 4.5模型向更多ChatGPT用户开放‌

随着人工智能技术的不断进步，OpenAI再次引领行业潮流，宣布将其最新的GPT 4.5模型向更多的ChatGPT用户开放。这一消息无疑为人工智能爱好者及从业者带来了振奋人心的消息，…

王浩然
2025年3月8日
000
AI前沿

‌Meta新AR眼镜：科研神器，可测量心率‌

近日，Meta公司推出了一款专为科研设计的增强现实（AR）眼镜，该眼镜不仅具备高清显示和精准定位功能，还能实时监测用户的心率，为科研工作者提供了前所未有的便捷与精准数据支持。 ‌一…

王浩然
2025年3月2日
000