英特尔蒙面人形控制器：一种实现物理逼真且可引导的人体运动的全新方法

点点 • 2024年10月4日下午7:00 • AI前沿 • 135 views

英特尔实验室的研究人员与学术界和行业专家合作，推出了一项突破性技术，可以从稀疏的多模态输入中生成逼真且可引导的人体运动。他们的工作在欧洲计算机视觉会议(ECCV 2024) 上亮相，重点是克服在高维人形角色中生成自然、基于物理的人类行为的挑战。这项研究是英特尔实验室推动计算机视觉和机器学习的更广泛计划的一部分。

英特尔研究院及其合作伙伴最近在欧洲计算机视觉协会（ECVA）组织的顶级会议ECCV 2024 上发表了六篇前沿论文。

论文《从多模态输入生成物理上逼真且可定向的人体运动》展示了多项创新，包括一种新颖的防御策略，用于保护文本转图像模型免受基于提示的红队攻击，以及开发一个旨在提高这些模型空间一致性的大规模数据集。在这些贡献中，该论文强调了英特尔致力于推进生成式建模，同时优先考虑负责任的 AI实践。

使用多模式输入生成逼真的人体运动

英特尔的蒙面人形控制器 (MHC) 是一款突破性的系统，旨在在模拟物理环境中生成类似人类的动作。与严重依赖完整详细动作捕捉数据的传统方法不同，MHC 旨在处理来自各种来源的稀疏、不完整或部分输入数据。这些来源可能包括 VR 控制器（可能仅跟踪手部或头部运动）；操纵杆输入（仅提供高级导航命令）；视频跟踪（某些身体部位可能被遮挡）；甚至来自文本提示的抽象指令。

该技术的创新之处在于它能够解释和填补数据缺失或不完整的空白。它通过英特尔所谓的“追赶、结合和完成”（CCC）功能实现这一点：

追赶：此功能允许 MHC 在发生中断时恢复并重新同步其运动，例如当系统以失败状态启动时，例如人形角色摔倒。系统可以快速纠正其动作并恢复自然运动，而无需重新训练或手动调整。
组合：MHC 可以将不同的动作序列混合在一起，例如将一个动作（例如挥手）的上半身动作与另一个动作（例如行走）的下半身动作合并。这种灵活性允许从现有动作数据生成全新的行为。
完整：当给定稀疏输入（例如部分身体运动数据或模糊的高级指令）时，MHC 可以智能地推断并生成动作的缺失部分。例如，如果仅指定手臂动作，MHC 可以自主生成相应的腿部动作以保持身体平衡和真实感。

最终形成了一个高度适应性的动作生成系统，即使指令不完整或指定不足，也可以创建流畅、逼真且物理准确的动作。这使得 MHC 成为游戏、机器人、虚拟现实以及任何需要高质量类人动作但输入数据有限的场景的理想选择。

MHC 对生成运动模型的影响

蒙面人形控制器 (MHC) 是英特尔实验室及其合作伙伴为负责任地构建生成模型而做出的更广泛努力的一部分，包括那些支持文本转图像和3D 生成任务的模型。正如 ECCV 2024 上所讨论的那样，这种方法对机器人、虚拟现实、游戏和模拟等行业具有重要意义，因为生成逼真的人体运动至关重要。通过整合多模式输入并使控制器能够在动作之间无缝过渡，MHC 可以处理传感器数据可能存在噪声或不完整的现实世界情况。

英特尔实验室的这项工作与 ECCV 2024 上展示的其他先进研究相得益彰，例如他们对文本转图像模型的新颖辩护以及改进图像生成空间一致性的技术开发。这些进步共同展示了英特尔在计算机视觉领域的领导地位，重点是开发安全、可扩展且负责任的 AI 技术。

结论

英特尔实验室与学术合作伙伴共同开发的蒙面人形控制器 (MHC) 代表着人类动作生成领域迈出的重要一步。通过解决从多模态输入生成逼真动作的复杂控制问题，MHC 为虚拟现实、游戏、机器人和模拟领域的新应用铺平了道路。这项研究在 ECCV 2024 上展出，表明英特尔致力于推进负责任的人工智能和生成建模，为各个领域的更安全、更具适应性的技术做出贡献。

原创文章，作者：点点，如若转载，请注明出处：https://www.dian8dian.com/ying-te-er-meng-mian-ren-xing-kong-zhi-qi-yi-zhong-shi-xian

3D 生成 MHC 人形控制器英特尔

Like (0)

点点

0 0

因卡马拉·哈里斯深度伪造案，法官阻止加州实施新 AI 法

Previous 2024年10月4日

Sonar 推出 AI 代码保证和 AI CodeFix：提高 AI 生成代码的安全性和生产力

Next 2024年10月4日

AI前沿

企业供应链需要特定领域的AI，而非通用模型：Articul8如何构建新模型，实现3倍性能提升

在企业运营中广泛实施AI的过程中，许多企业发现通用模型在处理需要深厚领域知识和顺序推理的专门工业任务时常常力不从心。虽然微调和检索增强生成（RAG）可以提供帮助，但对于像供应链这样…

王浩然
2天前
000
AI前沿

抵御人工智能攻击——正确的防御策略

随着人工智能威胁的激增，组织必须掌握如何预防和防御此类攻击。一种流行的方法是使用人工智能来防御其他恶意人工智能。然而，这只是部分有效。人工智能可以用作防御盾牌，但前提是员工具备正确…

点点
2024年11月5日
000
AI前沿

AWS 关闭了用于 AI 音乐的 MIDI 键盘 DeepComposer

AWS 奇怪的人工智能键盘实验DeepComposer不复存在。该公司在今天的一篇博客文章中宣布关闭已有 5 年历史的 DeepComposer，这是一款物理 MIDI 钢琴和 …

王浩然
2024年9月19日
000
AI前沿

联发科新天玑1000旗舰移动芯片上的“Agentic”AI到底是什么？

每个芯片制造商都在 AI 领域孤注一掷，但联发科的 Dimensity 9400 SoC 却推动了“代理”AI 的概念，即能够为您控制手机的 AI。总部位于中国的芯片制造商联发科…

王浩然
2024年10月10日
000
AI前沿

NVIDIA Isaac GR00T N1：重新定义人形机器人的未来

在人工智能和机器人技术的交汇点，NVIDIA的Isaac GR00T N1项目正引领着人形机器人领域的一场革命。这一创新不仅展现了技术在模拟人类动作和智能方面的惊人进步，更预示着一…

王浩然
2025年3月25日
000
AI前沿

Gartner：2025 年十大战略技术趋势

本周，在奥兰多举行的年度 IT 研讨会/Xpo 上，Gartner 公布了 2025 年十大战略技术趋势，人工智能、物联网技术和量子计算的进步均榜上有名。该活动在天鹅…

点点
2024年10月22日
000
AI前沿

DPAD 算法增强脑机接口，有望推动神经技术进步

人类大脑拥有由数十亿个神经元组成的复杂网络，不断产生电活动。这种神经交响乐编码了我们的每一个想法、动作和感觉。对于研究脑机接口 (BCI) 的神经科学家和工程师来说，破译这种复杂的…

点点
2024年9月14日
000
AI前沿

人工智能中的幻觉：葛兰素史克如何解决药物开发中的关键问题

生成式人工智能已成为许多行业的关键基础设施，医疗保健也不例外。然而，随着葛兰素史克等组织不断突破生成式人工智能所能实现的界限，它们面临着重大挑战——尤其是在可靠性方面。幻觉，即人工…

王浩然
2025年1月15日
000
AI前沿

代码私语者：Anthropic 的 Claude 如何改变软件开发人员的游戏规则

软件开发领域正在经历自开源编码出现以来最大的变革。人工智能助手曾经被专业开发人员持怀疑态度，但现在已成为价值7369.6亿美元的全球软件开发市场中不可或缺的工具。引领这一巨变的产品…

王浩然
2024年12月24日
000
AI前沿

为什么微服务可能会随着单体应用的强势回归而终结

随着科技公司认识到单片架构的局限性，向微服务的转变在 2010 年代初开始获得发展势头。然而，亚马逊 (Prime Video)、Invision、Istio 和 Segment等…

王浩然
2024年12月1日
000
AI前沿

Midjourney结束了必须使用Discord来生成AI图片的时代

Midjourney是否因竞争对手数量激增而感到压力？随着越来越多的公司进入AI图像生成领域，竞争自然会加剧，用户也会有更多选择。因此，Midjourney可能会感到一些压力，并…

王浩然
2024年8月23日
000
AI前沿

DoNotPay 因“世界首位机器人律师”被罚款

美国联邦贸易委员会称，该公司从未用真正的人类律师测试过其人工智能律师的准确性。 DoNotPay 是一家 AI 公司，以帮助用户取消不必要的订阅和对抗停车罚单而闻名，该公司已与联邦…

王浩然
2024年9月30日
000
AI前沿

Gemini 2.0 闪亮登场：闪思（Flash Thinking）融入记忆与Google应用集成

几个月前，Google为其Gemini AI聊天机器人增添了推理模式功能。如今，Gemini 2.0闪思（Flash Thinking）实验性功能进一步扩展，为聊天体验带来了更多特…

王浩然
2025年3月17日
000
AI前沿

OpenAI 未能在 2025 年之前提供其承诺的退出工具

早在5 月份，OpenAI 就表示正在开发一款工具，让创作者可以指定他们希望自己的作品如何纳入或排除在其 AI 训练数据中。但 7 个月过去了，这项功能仍未面世。 OpenAI 当…

王浩然
2025年1月2日
000
AI前沿

OpenAI 向公众发布超现实主义 AI 视频生成器 Sora Turbo

OpenAI 今天宣布公开发布其超现实主义 AI 视频生成软件Sora——距离 2024 年 2 月首次公开展示已过去近 10 个月。事实上，OpenAI 实际上发布的是比当时首…

王浩然
2024年12月10日
000
AI前沿

Anthropic 的全新 Claude 模型弥补了 AI 能力与实用性之间的差距

Anthropic 最近公布了其 Claude AI 模型系列的重大更新。公告推出了增强版 Claude 3.5 Sonnet，并首次推出了全新 Claude 3.5 Haiku …

点点
2024年11月5日
000
AI前沿

生成式 3D 平台获资助，瞄准重工业

生成式 3D 数据平台 Bifrost AI 在由 Carbide Ventures 领投、Airbus Ventures 参投的 A 轮融资中获得了 800 万美元。 …

王浩然
2024年11月11日
000
AI前沿

苹果或将在2027年推出真正现代化的Siri‌

近年来，随着人工智能技术的迅猛发展，智能语音助手已成为众多科技巨头竞相布局的关键领域。然而，在这一激烈竞争中，苹果公司的Siri似乎显得有些力不从心。据最新消息透露，苹果可能要到2…

王浩然
2025年3月3日
000
AI前沿

科学家设计分子级记忆状态，超越传统计算限制

利默里克大学的一组研究人员公布了一种用于计算目的的分子设计创新方法。这种方法从人脑功能中汲取灵感，有望大幅提高人工智能系统的速度和能源效率。由伯纳尔研究所的 Damien Tho…

点点
2024年9月17日
000
AI前沿

Uber 正在组建一支零工队伍，为人工智能模型标记数据

Uber 正在扩大其零工劳动力队伍并创建一个新的类别：人工智能注释和数据标记。这家叫车公司已开始为一个名为 Scaled Solutions 的新 AI 和数据标签部门招聘合同工…

王浩然
2024年11月29日
000