
腾讯推出了“浑元3D 2.0 ”,这是一款人工智能系统,可在几秒钟内将单幅图像或文字描述转化为详细的3D模型。该系统将一个通常需要很长时间的过程(熟练的艺术家可能需要几天或几周的时间)变成了一项快速、自动化的任务。
继前代模型之后,该模型的新版本在Hugging Face和GitHub上均作为开源项目提供,让全球开发人员和研究人员可以立即使用该技术。
该公司的研究团队在一份技术报告中写道:“创建高质量的 3D 资产对于艺术家来说是一个耗时的过程,因此自动生成是研究人员的长期目标。”
升级后的系统在前代系统的基础上进行构建,同时在速度和质量方面进行了显著的提升。

Hunyuan3D 2.0 如何将图像转化为 3D 模型
Hunyuan3D 2.0 使用两个主要组件:Hunyuan3D-DiT创建基本形状,而Hunyuan3D-Paint添加表面细节。该系统首先创建对象的多个 2D 视图,然后将它们构建成完整的 3D 模型。新的引导系统确保对象的所有视图匹配——解决了AI 生成的3D 模型中常见的问题。
研究人员解释道:“我们将相机放置在特定高度,以捕捉每个物体的最大可见区域。”这种方法与他们混合不同视点的方法相结合,有助于系统捕捉其他模型经常错过的细节,尤其是物体的顶部和底部。

更快、更准:Hunyuan3D 2.0 的优势
技术成果令人印象深刻。根据行业标准测量,Hunyuan3D 2.0 比现有系统生成更精确、更具视觉吸引力的模型。标准版本可在约 25 秒内创建完整的 3D 模型,而更小、更快的版本只需 10 秒即可完成。
Hunyuan3D 2.0 的独特之处在于它能够同时处理文本和图像输入,这使其比以前的解决方案更加通用。该系统还引入了“自适应无分类器引导”和“混合输入”等创新功能,有助于确保生成的 3D 模型的一致性和细节。
根据他们发布的基准测试,Hunyuan3D 2.0的CLIP 得分为 0.809,超过了开源和专有替代方案。该技术在纹理合成和几何精度方面取得了显著的改进,在所有标准行业指标中均优于现有解决方案。
该系统的关键技术进步在于它无需大量计算能力即可创建高分辨率模型。该团队开发了一种新方法来增加细节,同时保持处理需求可控——这是其他 3D AI 系统常见的限制。
将 3D 建模工具带入更多行业
这些进步对许多行业都意义重大。游戏开发者可以快速创建角色和环境的测试版本。网上商店可以以 3D 形式展示产品。电影制片厂可以更高效地预览特效。
腾讯通过 Hugging Face 共享了其系统的几乎所有部分。开发人员现在可以使用该代码创建与标准设计软件兼容的 3D 模型,使其可立即在专业环境中使用。
虽然这项技术标志着自动化 3D 创作向前迈出了重要一步,但它也引发了人们对未来艺术家如何工作的疑问。腾讯并不认为混元 3D 2.0 是人类艺术家的替代品,而是一个处理技术任务的工具,让创作者专注于艺术决策。
随着 3D 内容在游戏、购物和娱乐领域日益重要,Hunyuan3D 2.0 等工具预示着未来创建虚拟世界将变得像描述一样简单。未来的挑战可能不是生成 3D 模型,而是决定如何处理它们。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/teng-xun-tui-chu-hun-yuan-3d-2-ren-gong-zhi-neng-rang-3d