谷歌的 Whisk AI 生成器将“重新混合”你输入的图片

王浩然 • 2024年12月28日下午7:00 • AI前沿 • 86 views

谷歌宣布了一款名为 Whisk 的新 AI 工具，该工具可让您使用其他图像作为提示来生成图像，而不需要长文本提示。

使用 Whisk，您可以提供图像来建议您想要的主题、场景和 AI 生成图像的风格，并且您可以为这三个方面中的每一项提示 Whisk 提供多张图片。（如果您愿意，也可以填写文本提示。）如果您手头没有图片，您可以点击骰子图标让 Google 填写一些提示图片（尽管这些图片似乎也是 AI 生成的）。如果您想添加有关您正在寻找的图像的额外细节，您还可以在流程结束时在文本框中输入一些文本，但这不是必需的。

然后，Whisk 将为每张图片生成图片和文本提示。如果您对结果满意，可以收藏或下载图片，也可以通过在文本框中输入更多文本或单击图片并编辑文本提示来优化图片。

谷歌在一篇博客文章中强调，Whisk 的设计初衷是“快速的视觉探索，而不是像素完美的编辑”。该公司还表示，Whisk 可能“达不到目标”，这就是为什么它允许你编辑底层提示。

在撰写本文时，我使用该工具花了几分钟时间，对它进行修改非常有趣。图像生成需要几秒钟，这很烦人，虽然图像有点奇怪，但我生成的所有内容都很有趣。

谷歌表示，Whisk 使用的是其 Imagen 3 图像生成模型的“最新”版本，该模型于今天发布。谷歌还推出了其视频生成模型的下一个版本Veo 2，该公司表示，该模型能够理解“独特的电影摄影语言”，并且产生多余手指等幻觉的频率比其他模型要低（其他模型之一可能是OpenAI 的 Sora）。Veo 2 将首先出现在谷歌的 VideoFX 中，你可以在谷歌实验室的候补名单上获得它，明年某个时候它将扩展到 YouTube Shorts 的“其他产品”中。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/gu-ge-de-whisk-ai-sheng-cheng-qi-jiang-chong-xin-hun-he-ni

Google Veo 2 Whisk

Like (0)

王浩然作者

0 0

Gemini 现在可以判断你的手机屏幕上是否有 PDF

Previous 2024年12月28日

研究发现，由于效果不佳，Deepfakes 对 2024 年选举几乎没有影响

Next 2024年12月28日

AI前沿

卡曼筹集2000万美元，打造小行星采矿自主航天器

近日，卡曼公司宣布成功筹集2000万美元资金，旨在开发一款用于小行星采矿的自主航天器。这一雄心勃勃的项目旨在利用先进的自主技术和太空探索经验，从小行星上开采宝贵资源，为未来的太空经…

王浩然
2025年2月24日
000
AI前沿

IBM Cloud 将于明年提供英特尔 Gaudi 3 AI 芯片

英特尔为其 Gaudi 3 AI 加速器芯片找到了首个云客户：IBM Cloud。 IBM 和英特尔周四表示，IBM Cloud 将于明年初开始向客户提供 Gaudi 3。该芯片的…

王浩然
2024年8月31日
000
AI前沿

Tails OS 与 Tor Project 合并

Tor 项目是一家非盈利组织，负责维护 Tor 匿名网络的软件。目前，该项目正与使用 Tor 的便携式操作系统制造商 Tails 携手合作。两家组织都希望共享资源、降低管理费用，并…

点点
2024年10月1日
000
AI前沿

企业级AI语音模型Jargonic横空出世：aiOla声称其在业务术语识别上超越竞品

近年来，语音识别模型的准确性不断提高，但大多数模型仍是在理想条件下进行训练和测试的，如安静的环境、清晰的音频和通用词汇。然而，对于企业而言，现实世界的音频环境要复杂得多。为了解决这…

王浩然
2025年4月1日
000
AI前沿

微软的 Muse AI 可以在观察玩家游戏后设计视频游戏世界

微软研究人员已经实现了人工智能领域许多专家认为遥不可及的目标：教会人工智能像人类一样理解三维空间并与之互动。这一突破以Muse的形式出现，这是一种人工智能模型，可以理解和生成复杂的…

王浩然
2025年2月20日
000
AI前沿

OpenAI 筹集数十亿美元资金，并承诺与“美国及其盟国政府”合作

OpenAI 周三在网上发布的一份声明称，该公司已筹集 66 亿美元，估值达到 1570 亿美元。据《华尔街日报》报道，此轮融资由 Thrive Capital 领投，投资额为 1…

王浩然
2024年10月3日
000
AI前沿

Cloudflare 的新市场将允许网站向 AI 机器人收取抓取费用

Cloudflare周一宣布计划在明年推出一个市场，网站所有者可以向 AI 模型提供商出售抓取其网站内容的权限。该市场是 Cloudflare 首席执行官 Matthew Prin…

王浩然
2024年9月24日
000
AI前沿

美洲杯利用人工智能让电视观众看到风

通过电视观看第 37 届美洲杯帆船赛的球迷将首次能够观察到这项运动中一个至关重要但却看不见的部分，此前只有水手们自己才能辨别：风。跨国咨询公司凯捷和美洲杯媒体联手创建了 Wind…

点点
2024年9月11日
000
AI前沿

Automattic 为员工提供了另一次辞职机会——这次的遣散费为 9 个月

Automattic 首席执行官马特·穆伦维格 (Matt Mullenweg) 向有意离职的员工提供为期六个月的遣散费，几天后， 159 人接受了这一提议。10 月 16 日晚，…

王浩然
2024年10月24日
000
AI前沿

Kimi创始人杨植麟最新分享：关于OpenAI o1新范式的深度思考

OpenAI o1的发布，又一次引发了行业内关于大模型进化新范式的讨论。讨论的焦点是两个公认的大模型进化瓶颈：数据瓶颈——数据不够用了；以及算力瓶颈——3.2万张卡已是目前的天花…

点点
2024年9月16日
000
AI前沿

为什么黄仁勋和马克·贝尼奥夫认为代理型人工智能有“巨大”机遇

Nvidia创始人兼首席执行官黄仁勋表示，展望未来，人工智能代理的机会将是“巨大的”。黄仁勋本周在 Salesforce 的旗舰活动Dreamforce的炉边谈话中表示，目前…

王浩然
2024年9月22日
000
AI前沿

OpenAI推出全新语音AI模型：gpt-4o-transcribe，让你的文本应用秒变语音交互神器

OpenAI，这家因ChatGPT而广为人知的AI公司，近日再次在语音AI领域迈出重要一步。公司宣布推出三款全新的语音模型——gpt-4o-transcribe、gpt-4o-mi…

王浩然
2025年3月24日
000
AI前沿

Stable Diffusion 3.5 登陆 Amazon Bedrock：这对企业 AI 工作流程意味着什么

创建精美的生成式 AI 图像可能很有趣也很有用，但这并不是企业所需要的全部。企业文本转图像生成不仅仅是创建图像。它还涉及与现有工作流程和其他企业 AI 工具的集成。这是Stabl…

王浩然
2024年12月20日
000
AI前沿

1X 发布生成世界模型来训练机器人

机器人初创公司1X Technologies开发了一种新的生成模型，可以大大提高在模拟中训练机器人系统的效率。该公司在一篇新博客文章中宣布了这一模型，它解决了机器人技术的一个重要挑…

王浩然
2024年9月20日
000
AI前沿

在索尼的PlayStation State of Play中宣布的一切

在今晚的PlayStation State of Play中，我们得到了一些关于PS5在不久的将来等待我们的见解。这包括查看即将发布的标题和已发布标题的更新。这是惊喜的混合体——比…

点点
2024年9月26日
000
AI前沿

OpenAI计划将Sora的视频生成器整合至ChatGPT

‌ 引言‌ OpenAI，这家在人工智能领域持续引领创新的公司，近日宣布了一项令人兴奋的新计划：将Sora的视频生成器功能整合至其广受欢迎的ChatGPT聊天机器人中。这一举措预示…

王浩然
2025年3月3日
000
AI前沿

企业如何评估和选择AI工具

1. **明确问题与需求**：在考虑采用新的AI系统前，企业应先明确自身面临的问题、关键挑战和核心需求。只有当AI技术能解决公司已有的、可衡量的问题时，才值得进一步探索。 2. *…

王浩然
2025年2月11日
000
AI前沿

SpaceX 北极星黎明任务将向我们展示太空飞行如何改变身体

8 月 27 日，所有人的目光都将聚焦在美国宇航局位于佛罗里达州的肯尼迪航天中心，观看一次历史性的飞行。 SpaceX 的猎鹰 9 号火箭将把 Dragon 载人太空舱和四名私人宇…

点点
2024年9月3日
000
AI前沿

自动驾驶送货机器人获得 AI 升级；Uber Eats 将于 2025 年部署 2,000 个

Serve Robotics 推出其先进的新型送货机器人

点点
2024年10月22日
000
AI前沿

编排代理：以集成、人机交互和企业知识为核心

毫无疑问，人工智能代理将继续成为企业人工智能中快速增长的趋势。但随着越来越多的公司希望部署代理，他们也在寻找一种方法来帮助他们理解这些自主或半自主的人工智能引导机器人将采取的诸多…

王浩然
2024年11月23日
000

发表回复

Please Login to Comment

谷歌的 Whisk AI 生成器将“重新混合”你输入的图片

相关推荐

发表回复

Share To :