谷歌宣布了一款名为 Whisk 的新 AI 工具,该工具可让您使用其他图像作为提示来生成图像,而不需要长文本提示。
使用 Whisk,您可以提供图像来建议您想要的主题、场景和 AI 生成图像的风格,并且您可以为这三个方面中的每一项提示 Whisk 提供多张图片。(如果您愿意,也可以填写文本提示。)如果您手头没有图片,您可以点击骰子图标让 Google 填写一些提示图片(尽管这些图片 似乎也是 AI 生成的)。如果您想添加有关您正在寻找的图像的额外细节,您还可以在流程结束时在文本框中输入一些文本,但这不是必需的。
然后,Whisk 将为每张图片生成图片和文本提示。如果您对结果满意,可以收藏或下载图片,也可以通过在文本框中输入更多文本或单击图片并编辑文本提示来优化图片。
谷歌在一篇博客文章中强调,Whisk 的设计初衷是“快速的视觉探索,而不是像素完美的编辑”。该公司还表示,Whisk 可能“达不到目标”,这就是为什么它允许你编辑底层提示。
在撰写本文时,我使用该工具花了几分钟时间,对它进行修改非常有趣。图像生成需要几秒钟,这很烦人,虽然图像有点奇怪,但我生成的所有内容都很有趣。
谷歌表示,Whisk 使用的是其 Imagen 3 图像生成模型的“最新”版本,该模型于今天发布。谷歌还推出了其视频生成模型的下一个版本Veo 2,该公司表示,该模型能够理解“独特的电影摄影语言”,并且产生多余手指等幻觉的频率比其他模型要低(其他模型之一可能是OpenAI 的 Sora)。Veo 2 将首先出现在谷歌的 VideoFX 中,你可以在谷歌实验室的候补名单上获得它,明年某个时候它将扩展到 YouTube Shorts 的“其他产品”中。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/gu-ge-de-whisk-ai-sheng-cheng-qi-jiang-chong-xin-hun-he-ni