Midjourney v7 发布：语音提示与快速草稿模式引发热议

王浩然 • 4天前 • AI前沿 • 42 views

自2022年问世以来，Midjourney作为AI图像生成领域的佼佼者，一直被视为该领域的“黄金标准”。近日，这家初创公司推出了其最新版本——Midjourney v7，该版本带来了诸多创新功能，其中最引人注目的莫过于语音提示和更快的草稿模式。然而，这次发布却收获了褒贬不一的评价。

语音提示：开启图像生成的新方式

在Midjourney v7中，用户不再局限于通过文本提示和附加图像来指导图像生成。现在，只要用户拥有一台配备麦克风的电脑或其他音频输入设备，就可以通过语音直接向Midjourney发出指令。这种全新的交互方式使得图像生成过程更加直观和便捷。用户只需对着麦克风说出自己的想法，Midjourney便能根据语音内容自动转化为文本提示，并据此生成图像。

然而，关于Midjourney是否从零开始构建了全新的语音输入模型（语音转文本），还是采用了其他提供商的现成模型，目前尚不清楚。Midjourney的创始人David Holz对此问题尚未作出回应。

快速草稿模式：加速创意流程

与语音提示功能相辅相成的是Midjourney v7引入的快速草稿模式。这一模式能够显著缩短图像生成的时间，通常在一分钟甚至30秒内即可完成。尽管初始生成的图像质量可能略低于之前的版本，但用户可以通过点击“增强”或“变化”按钮来重新渲染图像，使其达到更高的质量。

快速草稿模式的设计理念在于让用户能够更快地看到初步的图像结果，并根据实时反馈进行调整和优化。通过这种方式，用户可以更加自然和迅速地与模型进行互动，将更多精力集中在创意构思上，而不是纠结于具体的语言描述。

个性化风格与操作门槛

为了使用Midjourney v7的新功能，用户首先需要完成一个个性化风格的设置过程。这一过程要求用户对200对图像进行评分，选择自己更喜欢的选项。完成个性化设置后，用户才能在Midjourney的网站上开启创作之旅。值得注意的是，Midjourney v7要求用户必须生成一个新的v7专属个性化风格才能开始使用，这在一定程度上增加了新用户的使用门槛。

初始反响：评价两极分化

尽管Midjourney在过去的新版本发布中通常能收获用户的热烈反响，但Midjourney v7的发布却遭遇了更加复杂的评价。许多用户期待这次更新能带来图像质量和指令遵循性的显著提升，以及对人体解剖结构（尤其是手部）和文本生成能力的改进。然而，一些用户在使用后发现，v7在这些方面的表现并未达到预期，甚至在某些情况下还不如之前的版本。

例如，有用户在社交平台上表示：“有点失望。OpenAI已经树立了很高的标杆。能和你的图像生成器像和兄弟聊天一样？这太震撼了。但Midjourney v7看起来‘更真实’了，我们真的需要这个吗？”还有用户指出：“v7并不感觉像是一个全新的版本，更像是v6.2的升级。”

不过，也有用户对Midjourney v7表示了赞赏。他们认为新版本在图像质量和艺术性方面有了显著提升，并且语音提示功能为创作过程带来了更多乐趣和便利。

未来展望：持续优化与社区互动

Midjourney公司表示，v7是一个全新的模型，它拥有自己的优势和挑战。公司鼓励用户尝试不同的提示风格，并分享他们的使用体验，以帮助团队进一步完善平台。在接下来的两个月里，Midjourney计划进行定期更新，每一到两周发布一次新功能。其中，一个重要的更新将是一个专为v7设计的角色和对象参考系统，该系统将大大简化用户通过文本提示来引用特定角色或对象的过程。

此外，Midjourney还将通过公共分享空间和反馈渠道与社区保持紧密联系，并计划举办一次路线图排名会议，以优先安排未来的开发工作。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/midjourney-v7-fa-bu-yu-yin-ti-shi-yu-kuai-su-cao-gao-mo-shi

AI图像生成 Midjourney v7 个性化风格快速草稿模式未来更新用户评价社区互动角色和对象参考系统语音提示

Like (0)

王浩然作者

0 0

外部开发如何成为游戏开发中的关键一环：Keywords CEO访谈

Previous 4天前

Gemini 2.5 Pro 正式发布：无限制使用且价格更亲民

Next 4天前

AI前沿

男子诱骗 OpenAI 语音机器人合唱披头士乐队的歌曲“Eleanor Rigby”

OpenAI 不希望它的聊天机器人唱歌，但有时这种能力还是会显现出来。

点点
2024年9月30日
000
AI前沿

NVIDIA 全新微服务助力主权 AI

为了确保 AI 系统反映本地价值观和法规，各国越来越多地推行自主 AI 战略；利用自己的基础设施、数据和专业知识开发 AI。NVIDIA 推出四款全新 NVIDIA NIM来支持这…

AI News
2024年8月29日
000
AI前沿

IBM 推出 Granite 3.0 AI 模型并承诺开源

IBM在公司年度TechXchange活动上推出了迄今为止最先进的 AI 模型系列，称为 Granite 3.0 。 Granite 3.0 系列包括一系列适用于各种应用…

点点
2024年10月22日
000
AI前沿

GibberLink：让AI代理以机器语言互相“通话”‌

在人工智能领域，随着技术的不断进步，AI代理间的通信成为了一个备受关注的课题。近日，一款名为GibberLink的创新技术横空出世，它实现了AI代理之间以一种独特的“机器语言”进行…

王浩然
2025年3月8日
000
AI前沿

新研究发现 RAG 系统存在 16 个主要问题，包括困惑度

美国最近的一项研究发现，Perplexity 和 Bing Copilot 等流行的检索增强生成(RAG) 研究系统的实际表现远远达不到过去 12 个月中占据头条新闻的营销炒作和大…

点点
2024年11月5日
000
AI前沿

Babak Hodjat，Cognizant 人工智能首席技术官 – 访谈系列

Babak Hodjat 是Cognizant的人工智能首席技术官，曾任 Sentient 联合创始人兼首席执行官。他负责全球最大的分布式人工智能系统背后的核心技术。Babak 还…

点点
2024年10月18日
000
AI前沿

NVIDIA Isaac GR00T N1：重新定义人形机器人的未来

在人工智能和机器人技术的交汇点，NVIDIA的Isaac GR00T N1项目正引领着人形机器人领域的一场革命。这一创新不仅展现了技术在模拟人类动作和智能方面的惊人进步，更预示着一…

王浩然
2025年3月25日
000
AI前沿

揭秘OpenAI：兴趣驱动的探索，非目标导向的马拉松

我们被倡导要想明白自己的目标是什么、并做出计划。然而，两位人工智能研究者却认为，这只适用于普通的小愿望。一旦涉及过于高远的、不确定能否实现的目标，比如打造 AGI（通…

点点
2024年9月9日
000
AI前沿

腾讯推出“浑元3D 2.0”，人工智能让3D设计时间从几天缩短到几秒

腾讯推出了“浑元3D 2.0 ”，这是一款人工智能系统，可在几秒钟内将单幅图像或文字描述转化为详细的3D模型。该系统将一个通常需要很长时间的过程（熟练的艺术家可能需要几天或几周的时…

王浩然
2025年1月22日
000
AI前沿

为什么 DeepSeek 的新 AI 模型认为它是 ChatGPT

本周早些时候，资金雄厚的中国人工智能实验室 DeepSeek 发布了一款“开放”人工智能模型，该模型在热门基准测试中击败了许多竞争对手。该模型DeepSeek V3规模庞大但效率高…

王浩然
2024年12月29日
000
AI前沿

Cohere 刚刚推出了“North”，这是该公司迄今为止针对注重隐私的企业的最大 AI 赌注

Cohere今天发布了North，这是一个安全的 AI 工作区平台，在企业市场直接挑战 Microsoft Copilot和 Google Vertex AI。该公司声称其新平台在…

王浩然
2025年1月10日
000
AI前沿

CoreWeave创始人：在40亿美元IPO前夕，已入账4.88亿美元‌

随着科技行业的蓬勃发展，云计算领域再次迎来了一个令人瞩目的里程碑。CoreWeave，这家专注于高性能计算的云计算服务提供商，正站在40亿美元IPO（首次公开募股）的门槛上。而在此…

王浩然
2025年3月8日
000
AI前沿

联想泄露消息称，更便宜的 Copilot Plus 电脑将于本月上市

联想似乎已准备好推出价格更实惠的新款 Copilot Plus 电脑。可靠泄密者 Evan Blass发布了联想的一份新闻稿，详细介绍了将于本周晚些时候在 IFA 贸易展上发布的多…

王浩然
2024年9月3日
000
AI前沿

忘掉 Nvidia：Ndea 希望打造能够不断自我改进且“看不到任何瓶颈”的人工智能

谷歌前工程师、广为使用的 Python 深度学习框架Keras的创建者 François Chollet 与 Zapier 联合创始人 Mike Knoop 共同创立了新的人工智能…

王浩然
2025年1月16日
000
AI前沿

ServiceNow 提倡使用“隐形”人工智能代理来简化工人的采用

企业开始部署人工智能代理。但是，如果组织计划大规模部署代理生态系统并提高员工接受度，他们可能会考虑将人工智能代理视为在后台工作的工具，以避免吓倒那些认为他们必须知道如何使用这些工具…

王浩然
2024年10月26日
000
AI前沿

Together AI 3.05亿美元赌注：DeepSeek-R1等推理模型正在增加而非减少GPU需求‌重写并翻译后的内容

DeepSeek-R1刚出现时，业界普遍担忧先进推理能力的实现可能会减少对基础设施的需求。然而，事实证明情况并非如此。至少，根据Together AI的说法，DeepSeek和开源…

王浩然
2025年2月22日
000
AI前沿

在人工智能时代，学术科学的未来取决于现实世界的研究

当今的大学面临诸多挑战。随着当今市场的变化，大学必须适应。当今的关键问题包括经济下滑趋势对捐赠基金造成冲击、学费上涨带来的入学挑战、来自第三方在线教育的竞争以及人口结构变化导致新生…

点点
2024年10月17日
000
AI前沿

D-ID推出AI视频翻译工具

D-ID 的工具与 YouTube 和 Vimeo 等平台竞争，面向个人创作者和企业，通过先进的 AI 技术提供无缝的多语言观看体验。 D-ID 最近推出了一款创新的AI 视频翻译…

王浩然
2024年8月23日
010
AI前沿

微软和 a16z 搁置分歧，联手反对人工智能监管

两个深度交织的科技生态系统中的两大力量——大型既有企业和初创公司——停止数钱，联合恳求政府停止甚至放弃考虑可能影响他们的经济利益（或者用他们喜欢的话说，创新）的监管。 “我们两家公…

王浩然
2024年11月2日
000
AI前沿

NVIDIA新推Llama 3.1 Nemotron Ultra，性能超越DeepSeek R1，体积仅其一半‌

在AI领域，大型语言模型（LLM）的竞争日益激烈，各大科技公司纷纷推出自己的旗舰产品，以期在这个充满挑战与机遇的市场中占据一席之地。近日，NVIDIA宣布推出其最新的LLM——Ll…

王浩然
4小时前
000