Midjourney v7 发布:语音提示与快速草稿模式引发热议

Midjourney v7 发布:语音提示与快速草稿模式引发热议

自2022年问世以来,Midjourney作为AI图像生成领域的佼佼者,一直被视为该领域的“黄金标准”。近日,这家初创公司推出了其最新版本——Midjourney v7,该版本带来了诸多创新功能,其中最引人注目的莫过于语音提示和更快的草稿模式。然而,这次发布却收获了褒贬不一的评价。

语音提示:开启图像生成的新方式

在Midjourney v7中,用户不再局限于通过文本提示和附加图像来指导图像生成。现在,只要用户拥有一台配备麦克风的电脑或其他音频输入设备,就可以通过语音直接向Midjourney发出指令。这种全新的交互方式使得图像生成过程更加直观和便捷。用户只需对着麦克风说出自己的想法,Midjourney便能根据语音内容自动转化为文本提示,并据此生成图像。

然而,关于Midjourney是否从零开始构建了全新的语音输入模型(语音转文本),还是采用了其他提供商的现成模型,目前尚不清楚。Midjourney的创始人David Holz对此问题尚未作出回应。

快速草稿模式:加速创意流程

与语音提示功能相辅相成的是Midjourney v7引入的快速草稿模式。这一模式能够显著缩短图像生成的时间,通常在一分钟甚至30秒内即可完成。尽管初始生成的图像质量可能略低于之前的版本,但用户可以通过点击“增强”或“变化”按钮来重新渲染图像,使其达到更高的质量。

快速草稿模式的设计理念在于让用户能够更快地看到初步的图像结果,并根据实时反馈进行调整和优化。通过这种方式,用户可以更加自然和迅速地与模型进行互动,将更多精力集中在创意构思上,而不是纠结于具体的语言描述。

个性化风格与操作门槛

为了使用Midjourney v7的新功能,用户首先需要完成一个个性化风格的设置过程。这一过程要求用户对200对图像进行评分,选择自己更喜欢的选项。完成个性化设置后,用户才能在Midjourney的网站上开启创作之旅。值得注意的是,Midjourney v7要求用户必须生成一个新的v7专属个性化风格才能开始使用,这在一定程度上增加了新用户的使用门槛。

初始反响:评价两极分化

尽管Midjourney在过去的新版本发布中通常能收获用户的热烈反响,但Midjourney v7的发布却遭遇了更加复杂的评价。许多用户期待这次更新能带来图像质量和指令遵循性的显著提升,以及对人体解剖结构(尤其是手部)和文本生成能力的改进。然而,一些用户在使用后发现,v7在这些方面的表现并未达到预期,甚至在某些情况下还不如之前的版本。

例如,有用户在社交平台上表示:“有点失望。OpenAI已经树立了很高的标杆。能和你的图像生成器像和兄弟聊天一样?这太震撼了。但Midjourney v7看起来‘更真实’了,我们真的需要这个吗?”还有用户指出:“v7并不感觉像是一个全新的版本,更像是v6.2的升级。”

不过,也有用户对Midjourney v7表示了赞赏。他们认为新版本在图像质量和艺术性方面有了显著提升,并且语音提示功能为创作过程带来了更多乐趣和便利。

未来展望:持续优化与社区互动

Midjourney公司表示,v7是一个全新的模型,它拥有自己的优势和挑战。公司鼓励用户尝试不同的提示风格,并分享他们的使用体验,以帮助团队进一步完善平台。在接下来的两个月里,Midjourney计划进行定期更新,每一到两周发布一次新功能。其中,一个重要的更新将是一个专为v7设计的角色和对象参考系统,该系统将大大简化用户通过文本提示来引用特定角色或对象的过程。

此外,Midjourney还将通过公共分享空间和反馈渠道与社区保持紧密联系,并计划举办一次路线图排名会议,以优先安排未来的开发工作。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/midjourney-v7-fa-bu-yu-yin-ti-shi-yu-kuai-su-cao-gao-mo-shi

Like (0)
王 浩然的头像王 浩然作者
Previous 4天前
Next 4天前

相关推荐

发表回复

Please Login to Comment