麻省理工学院首次推出受大型语言模型启发的方法,用于教授机器人新技能

麻省理工学院首次推出受大型语言模型启发的方法,用于教授机器人新技能

麻省理工学院本周展示了一种训练机器人的新模型。与用于教机器人新任务的标准数据集不同,该方法更具规模性,模仿用于训练大型语言模型 (LLM) 的大量信息。

研究人员指出,模仿学习(即代理通过跟随执行任务的个体进行学习)在引入小挑战时可能会失败。这些挑战可能是照明、不同环境或新障碍。在这些情况下,机器人根本没有足够的数据可供利用来适应。

该团队寻求一种类似 GPT-4 的模型来通过强力数据方法解决问题。

“在语言领域,数据都是句子,”新论文的主要作者王立瑞说。“在机器人领域,考虑到数据中的各种异质性,如果你想以类似的方式进行预训练,我们需要一种不同的架构。”

该团队引入了一种名为异构预训练变压器HPT)的新架构,该架构将来自不同传感器和不同环境的信息汇集在一起​​。然后使用变压器将数据汇总到训练模型中。变压器越大,输出越好。

然后用户输入机器人设计、配置和他们想要完成的工作。

“我们的梦想是拥有一个通用的机器人大脑,你可以下载它并使用它,而无需任何训练,”卡内基梅隆大学副教授戴维·赫尔德在谈到这项研究时说道。“虽然我们还处于早期阶段,但我们将继续努力,希望规模化能带来机器人策略方面的突破,就像大型语言模型一样。”

这项研究的部分资金来自丰田研究院。去年,丰田研究院首次展示了一种一夜之间训练机器人的方法。最近,该公司达成了一项具有里程碑意义的合作伙伴关系,将把其机器人学习研究与波士顿动力硬件结合起来。  

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/ma-sheng-li-gong-xue-yuan-shou-ci-tui-chu-shou-da-xing-yu

Like (0)
王 浩然的头像王 浩然作者
Previous 2024年11月2日
Next 2024年11月3日

相关推荐

发表回复

Please Login to Comment