Hugging Face 将“Pi-Zero”引入 LeRobot,使人工智能机器人更易于构建和部署

Hugging Face 将“Pi-Zero”引入 LeRobot,使人工智能机器人更易于构建和部署

Hugging Face和Physical Intelligence本周悄然推出了Pi0(Pi-Zero) ,这是第一个将自然语言命令直接转化为身体动作的机器人基础模型。

Hugging Face 首席研究科学家 Remi Cadene 在一篇迅速引起整个 AI 社区关注的 X 帖子中宣布:“Pi0 是最先进的视觉语言动作模型。它以自然语言命令作为输入,直接输出自主行为。”

此次发布标志着机器人技术的一个关键时刻:机器人基础模型首次通过开源平台广泛普及。就像 ChatGPT 彻底改变了文本生成一样,Pi0 旨在改变机器人学习和执行任务的方式。
Pi0 如何将 ChatGPT 式学习引入机器人技术,解锁复杂任务

该模型最初由 Physical Intelligence 开发,现已移植到 Hugging Face 的LeRobot 平台,可以执行折叠衣物、收拾桌子和包装杂货等复杂任务——这些活动传统上对于机器人来说极难掌握。

物理智能研究团队在公告中写道:“如今的机器人只是功能狭窄的专家,它们被设计成在精心设计的场景中重复执行动作。Pi0 改变了这一点,它允许机器人学习并遵循用户的指令,让编程变得像告诉机器人你想要做什么一样简单。”

Pi0 背后的技术代表了一项重大的技术成就。该模型基于来自七个不同机器人平台和 68 个独特任务的数据进行训练,使其能够处理从精细操作任务到复杂的多步骤程序的所有任务。它采用一种称为流匹配的新技术,以 50Hz 的频率产生平滑的实时动作轨迹,使其高度精确且适应现实世界的部署。

新技术 FAST 将机器人训练速度提高 5 倍,拓展 AI 潜力

在此基础上,该团队还推出了“ Pi0-FAST ”,这是该模型的增强版本,它采用了一种称为频率空间动作序列标记(FAST)的新标记方案。此版本的训练速度比其前身快五倍,并且在不同环境和机器人类型中表现出更好的泛化能力。

这对行业的影响是巨大的。制造工厂可以通过简单的口头指令而不是复杂的编码来重新编程机器人以执行新任务。仓库可以部署更灵活的自动化系统,以适应不断变化的需求。即使是小型企业也可能会发现机器人更容易获得,因为编程和部署的障碍大大降低。

然而,挑战依然存在。虽然 Pi0 代表了重大进步,但它仍然存在局限性。该模型偶尔会难以完成非常复杂的任务,并且需要大量的计算资源。在工业环境中,可靠性和安全性也存在问题。

此次发布正值人工智能行业发展的关键时刻。随着各大公司竞相开发和部署通用人工智能 (AGI),Pi0 代表了弥合语言模型与物理世界交互之间差距的首次成功尝试之一。

该技术目前可通过Hugging Face 平台使用,开发人员只需几行代码即可下载和使用预先训练的策略:

python运行复制

policy = Pi0Policy.from_pretrained("lerobot/pi0")

对于企业用户来说,这种可访问性可以加速各行业采用先进机器人技术。企业现在可以针对特定用例微调模型,从而有可能减少部署机器人解决方案所需的时间和成本

企业领导者为何应该关注开源机器人技术

开发团队还发布了全面的文档和培训材料,使更广泛的用户能够使用该技术。机器人技术的普及化可能会为从医疗保健到零售等各个领域带来创新应用。

随着技术的成熟,它可能会重塑我们对自动化和人机交互的看法。通过自然语言控制机器人的能力可以让机器人在家庭、医院和小型企业中更容易获得帮助——而传统机器人由于编程复杂性而难以在这些领域获得关注。

随着这一版本的发布,机器人技术的未来看起来将越来越具有对话性、适应性和可访问性。虽然还有许多工作要做,但 Pi0 代表着朝着使多功能智能机器人成为现实而不是科幻幻想迈出了重要一步。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/hugging-face-jiang-pizero-yin-ru-lerobot-shi-ren-gong-zhi

Like (0)
王 浩然的头像王 浩然作者
Previous 2025年2月9日
Next 2025年2月10日

相关推荐

发表回复

Please Login to Comment