Meta 推出 AI 工具，让机器人在现实世界中拥有人类的触感

王浩然 • 2024年11月3日下午12:00 • AI前沿 • 94 views

Meta本周发布了几项有关机器人和具身 AI 系统的重大公告。其中包括发布基准和工件，以便更好地理解和与物理世界互动。Meta 发布的三项研究工件 Sparsh、Digit 360 和 Digit Plexus 专注于触觉感知、机器人灵活性和人机交互。Meta 还发布了 PARTNR，这是评估人机协作中的规划和推理的新基准。

该报告的发布正值基础模型的进步重新引发了人们对机器人技术的兴趣，人工智能公司正逐步将竞争从数字领域扩展到物理世界。

业界重新燃起希望，相信借助大型语言模型 (LLM) 和视觉语言模型 (VLM) 等基础模型，机器人可以完成需要推理和规划的更复杂的任务。

触觉

Sparsh是与华盛顿大学和卡内基梅隆大学合作创建的，是用于基于视觉的触觉感应的编码器模型系列。它旨在为机器人提供触觉感知能力。触觉感知对于机器人任务至关重要，例如确定可以对某个物体施加多大的压力以避免损坏它。

将基于视觉的触觉传感器融入机器人任务的经典方法是使用标记数据来训练可以预测有用状态的自定义模型。这种方法无法跨不同的传感器和任务推广。

Meta 将 Sparsh 描述为一种通用模型，可应用于不同类型的基于视觉的触觉传感器和各种任务。为了克服前几代触觉感知模型面临的挑战，研究人员通过自监督学习(SSL) 训练了 Sparsh 模型，从而无需标记数据。该模型已在来自不同数据集的 460,000 多张触觉图像上进行了训练。根据研究人员的实验，在有限的标记数据预算下，Sparsh 比特定于任务和传感器的端到端模型平均提高了 95.1%。研究人员根据各种架构创建了不同版本的 Sparsh，包括Meta 的 I-JEPA和 DINO 模型。

触摸传感器

除了利用现有数据外，Meta 还发布了硬件，用于从物理上收集丰富的触觉信息。Digit 360是一种人造手指形触觉传感器，具有 18 多种传感功能。该传感器拥有超过 800 万个像素，用于捕捉指尖表面的全向和颗粒变形。Digit 360 可捕捉各种传感模式，从而更深入地了解环境和物体交互。

Digit 360 还拥有设备上的 AI 模型，以减少对云服务器的依赖。这使得它能够在本地处理信息并以最小的延迟响应触摸，类似于人类和动物的反射弧。

Meta 的研究人员写道：“除了提高机器人的灵活性之外，这种突破性的传感器还具有从医学、假肢到虚拟现实和远程呈现等重要应用的潜在价值。”

Meta 公开发布Digit 360 的代码和设计是为了促进社区推动的触觉研究和创新。但就像发布开源模型一样，其硬件和模型的潜在采用也为 Meta 带来了很多好处。研究人员认为，Digit 360 捕获的信息有助于开发更逼真的虚拟环境，这对 Meta 未来的元宇宙项目大有裨益。

Meta 还发布了 Digit Plexus，这是一个旨在促进机器人应用开发的硬件软件平台。Digit Plexus 可以将各种指尖和皮肤触觉传感器集成到一只机器人手上，对从传感器收集的触觉数据进行编码，并通过一根电缆将其传输到主机。Meta 正在发布Digit Plexus 的代码和设计，以使研究人员能够在该平台上进行构建并推进机器人灵活性研究。

Meta 将与触觉传感器制造商 GelSight Inc. 合作生产 Digit 360。他们还将与韩国机器人公司 Wonik Robotics 合作，在 Digit Plexus 平台上开发带有触觉传感器的全集成机械手。

评估人机协作

Meta 还发布了人机协作中的规划和推理任务 ( PARTNR )，这是评估人工智能模型在与人类合作完成家务时的有效性的基准。

PARTNR 建立在 Meta 的模拟环境 Habitat 之上。它包括 60 栋房屋中的 100,000 个自然语言任务，涉及 5,800 多个独特物体。该基准测试旨在评估 LLM 和 VLM 遵循人类指令的表现。Meta

的新基准测试加入了越来越多的项目，这些项目正在探索在机器人和具身 AI 设置中使用 LLM 和 VLM。在过去的一年里，这些模型已显示出巨大的潜力，可作为机器人在复杂任务中的规划和推理模块。Figure 和 Covariant 等初创公司已经开发出使用基础模型进行规划的原型。与此同时，AI 实验室正在致力于为机器人创建更好的基础模型。一个例子是 Google DeepMind 的RT-X 项目，它汇集了来自各种机器人的数据集来训练视觉-语言-动作 (VLA) 模型，该模型可推广到各种机器人形态和任务。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/meta-tui-chu-ai-gong-ju-rang-ji-qi-ren-zai-xian-shi-shi-jie

AI 工具 DeepMind Google I-JEPA Meta 自监督学习

Like (0)

王浩然作者

0 0

智能手机上有 AI？Hugging Face 的 SmolLM2 将强大的模型带到你的手掌上

Previous 2024年11月3日

好戏还没完：2024 年人工智能投资将大幅增加

Next 2024年11月3日

AI前沿

收入预测初创公司 Gong 年收入突破3亿美元，暗示潜在IPO之路‌

近日，收入预测领域的初创公司Gong宣布其年度收入（ARR）已突破3亿美元大关。这一里程碑式的成就不仅彰显了Gong在市场上的强劲表现，也为其未来的潜在IPO之路铺平了道路。 Go…

王浩然
2025年3月7日
000
AI前沿

Narvar 如何利用人工智能和数据来增强客户购买后体验

当客户点击电子商务网站上的“购买”按钮后会发生什么？这是一个被称为售后环节的领域，它通常是零售商运营中最昂贵和影响最大的方面之一。售后活动包括确定交付、客户保留以及（如果需要）退…

王浩然
2025年1月10日
000
AI前沿

Meta 正在制造能“感受”触觉的机械手

Meta 表示，它正在与传感器公司 GelSight 和韩国机器人公司 Wonik Robotics合作，将人工智能触觉传感器商业化。这些新设备并非面向消费者，而是面向科学家。M…

王浩然
2024年11月2日
000
AI前沿

超越法学硕士：SandboxAQ 的大型量化模型如何优化企业 AI

虽然大型语言模型 (LLM) 和生成式 AI在过去一年中占据了企业 AI 讨论的主导地位，但企业还可以通过其他方式从 AI 中获益。其中一种替代方案是大型定量模型 (LQM)。 L…

王浩然
2024年12月20日
000
AI前沿

提高生产力：在组织中实施人工智能工具的实用指南

从销售和客户服务到内容创作，将生成式人工智能融入现代工作场所无疑是一种变革。它引发的连锁反应从根本上改变了各行业的角色、任务和战略重点。生成式人工智能不仅提高了生产力，还改变了我们…

王浩然
2024年12月11日
000
AI前沿

OpenAI o1 介绍：人工智能推理能力的飞跃，助力解决高级问题

OpenAI 的新模型OpenAI o1或 Strawberry 代表了人工智能领域的重大进步。它以 OpenAI 的 GPT 系列等先前模型为基础，并引入了增强的推理能力，从而加…

点点
2024年9月17日
000
AI前沿

MemGPT团队官宣创业，融资1000万美金，硅谷大佬Jeff Dean也投了

据TechCrunch本周一报道，MemGPT团队首次官宣创业。由该团队创立的Letta公司，推出了一个同名的AI上下文内存管理平台Letta。最近2年，大语言模型快速发展，但受…

点点
2024年9月25日
000
AI前沿

企业如何评估和选择AI工具

1. **明确问题与需求**：在考虑采用新的AI系统前，企业应先明确自身面临的问题、关键挑战和核心需求。只有当AI技术能解决公司已有的、可衡量的问题时，才值得进一步探索。 2. *…

王浩然
2025年2月11日
000
AI前沿

人工智能生产力引擎在最新一轮融资中筹集 5000 万美元

协作式 AI 生产力引擎 You.com 在由成长期 B2B 投资者 Georgian 领投的 B 轮融资中获得了 5000 万美元。 Salesforce Ventures、NV…

点点
2024年9月12日
000
AI前沿

引领人工智能的财务挑战：OpenAI 的运营成本概览

OpenAI目前面临着重大的财务挑战。例如，据报道，2023 年，为了维护其基础设施并运行其旗舰产品，OpenAI每天需要支付约 70 万美元。然而，到 2024 年，由于计算需求…

点点
2024年10月11日
000
AI前沿

DeepSeek的力量对商业意味着什么

一、引言在人工智能（AI）领域，新兴力量的崛起往往能迅速改变行业格局。近期，中国AI研究公司DeepSeek的突破性进展，不仅挑战了现有AI巨头的地位，还为全球商业环境带来了深远…

王浩然
2025年3月14日
000
AI前沿

Salesforce 的 AgentForce：想要管理你整个业务的 AI 助手

Salesforce周四推出了Agentforce，这是一套由人工智能驱动的自主代理，旨在增强各个业务职能领域的人类员工的能力。该公司将其定位为人工智能的“第三次浪潮”，超越预测模…

王浩然
2024年9月15日
000
AI前沿

OpenAI 在 2025 年初大力宣传通用人工智能和超级智能

就像2024 年在纽约市结束的方式一样，2025 年人工智能新闻周期也以一声雷鸣般的响声开始。 OpenAI 联合创始人兼首席执行官 Sam Altman昨天 (1 月 5 日) …

王浩然
2025年1月7日
000
AI前沿

被AI颠覆一半工作的前大厂员工，花了8个月找到用AI工作的新方式

一专多会，才能长久

点点
2024年8月21日
010
AI前沿

Aesthetic 推出“时尚版 Shazam”

Aesthetic 是一家新成立的时尚公司，致力于成为“服装界的 Shazam”。该公司本周成立，利用人工智能帮助人们识别和购买他们在社交媒体上寻找的服装。这款名为 Alma …

王浩然
2024年10月30日
000
AI前沿

LLM 反学习如何塑造 AI 隐私的未来

大型语言模型 (LLM)的快速发展带来了人工智能 (AI) 的重大进步。从自动化内容创建到在医疗保健、法律和金融领域提供支持，LLM 正在凭借其理解和生成类似人类的文本的能力重塑行…

点点
2024年10月24日
000
AI前沿

研究人员称，医疗领域的人工智能应该受到监管，但不要忘记算法

在最近的一篇评论中，麻省理工学院、Equality AI 和波士顿大学的团队强调了医疗保健领域人工智能模型和非人工智能算法的监管差距。有人可能会说，医生的主要职责之一就是不断评估…

王浩然
2025年1月3日
000
AI前沿

Creatio发布首个内置代理型数字人才的AI原生平台

引言在数字化转型的大潮中，企业对于客户关系管理（CRM）系统的需求日益增强。为了满足这一需求，Creatio，一家领先的CRM解决方案提供商，近日宣布推出其首个AI原生平台，该平…

王浩然
2025年3月19日
000
AI前沿

麻省理工学院首次推出受大型语言模型启发的方法，用于教授机器人新技能

麻省理工学院本周展示了一种训练机器人的新模型。与用于教机器人新任务的标准数据集不同，该方法更具规模性，模仿用于训练大型语言模型 (LLM) 的大量信息。研究人员指出，模仿学习（即…

王浩然
2024年11月3日
000
AI前沿

德勤调查：企业对生成式人工智能持谨慎乐观态度

一项新调查发现，一年前，企业对生成式人工智能的前景充满热情，但随着它们面临将人工智能的可能性转化为成果的复杂性，这种热情已逐渐消退，转而变得乐观起来。德勤第四份《企业生成人工智能…

王浩然
2025年1月26日
000

发表回复

Please Login to Comment

Meta 推出 AI 工具，让机器人在现实世界中拥有人类的触感

触觉

触摸传感器

评估人机协作

相关推荐

发表回复

Share To :