Hugging Face 推出用于机器人命令的自然语言 AI 模型

王浩然 • 2025年2月19日下午8:00 • AI前沿 • 51 views

模型使得构建和部署能够执行复杂任务的人工智能机器人变得更加容易。

开源代码库Hugging Face推出了一种机器人基础人工智能模型，可将自然语言命令转化为身体动作。

该模型名为 Pi0，由人工智能机器人初创公司 Physical Intelligence 开发，并移植到 Hugging Face 的 LeRobot 平台。

Hugging Face 首席研究科学家 Remi Cadene 在 X 上表示，该模型是目前最先进的视觉语言动作模型。

他说：“它以自然语言命令作为输入并直接输出自主行为。”

Pi0 可以控制各种不同的机器人，既可以执行特定任务，也可以训练其应对更具挑战性的场景。它还可以根据个人或公司自己的数据集进行微调。

物理智能利用来自 7 个机器人平台的数据以及 68 项之前被认为对于机器人来说过于复杂的独特任务来训练模型，其中包括折叠衣物、等候餐桌和包装杂货。

该公司在一篇博客文章中表示，经过 8 个月的开发，Pi0 是迈向人工智能的第一步，它可以让用户简单地要求机器人执行他们想要的任何任务，就像他们目前对大型语言模型 (LLM) 和聊天机器人助手所做的那样。

报告称：“折叠一件衬衫或清理一张桌子需要解决一些有史以来最困难的工程问题。”

“与 LLM 一样，我们的模型是在广泛而多样的数据上进行训练的，可以遵循各种文本指令。与 LLM 不同的是，它涵盖图像、文本和动作，并通过对机器人的具体经验进行训练来获得物理智能，学习通过新颖的架构直接输出低级运动命令。”

Hugging Face 工程师还在博客中表示，新模型为 Hugging Face 生态系统带来了通用机器人智能，也是机器人基础模型首次通过开源平台广泛应用。

Avrio 研究所首席执行官兼总裁 Shawn DuBravac表示，Pi0 有潜力降低机器人技术应用的门槛，因为它可以减少所需的时间和成本，并允许非程序员用自然语言代替编码命令来指挥机器人。Avrio 研究所致力于与各家公司合作，了解技术变革。

“它还可以改变组织部署的机器人类型，”DuBravac 说。“组织可以构建和部署通用机器人，这些机器人只需进行最少的重新编程，就可以为不同的环境分配新任务，而不是为单一的特定用例设计机器人。”

在基础模型的基础上，Physical Intelligence 还推出了 Pio-Fast，这是一个增强版本，它采用了一种称为频率空间动作序列标记化的标记方案。该公司表示，它的训练速度提高了五倍，并且在不同环境和机器人类型中表现出更好的泛化能力。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/hugging-face-tui-chu-yong-yu-ji-qi-ren-ming-ling-de-zi-ran

Like (0)

王浩然作者

0 0

人工智能人形机器人公司融资 3.5 亿美元

Previous 2025年2月19日

埃隆·马斯克 xAI 推出 Grok 3 以挑战竞争对手

Next 2025年2月19日

AI前沿

新的 LLM 优化技术可将内存成本降低高达 75%

东京初创公司 Sakana AI 的研究人员开发了一种新技术，使语言模型能够更有效地利用内存，帮助企业降低在大型语言模型 (LLM) 和其他基于 Transformer 的模型上构…

王浩然
2024年12月17日
000
AI前沿

OpenAI 首席研究官随首席技术官 Mira Murati 离职而离职

OpenAI 首席研究官 Bob McGrew 和研究副总裁 Barret Zoph 在 OpenAI 首席技术官 Mira Murati宣布离职数小时后也宣布离职。首席执行官 …

王浩然
2024年9月26日
000
AI前沿

日本最有趣的独角兽

尽管日本的创业行业是世界上最大的行业之一，但就独角兽企业数量和风险投资规模而言，日本仍落后于美国、中国和英国等其他地区。多年来，人口老龄化、整体经济通缩以及工薪阶层倾向于在传统的大…

点点
2024年10月13日
000
AI前沿

报告称，到2030年人工智能模型可扩大10000倍

人工智能（AI）最近的进步主要归结于一点：规模。大约在本世纪初，人工智能实验室注意到，不断扩大算法或模型的规模，并持续为其提供更多数据，可以极大地提高算法和模型的性能。最新的一…

点点
2024年9月3日
000
AI前沿

腾讯的 EzAudio AI 将文本转换为逼真的声音，引发创新和争论

约翰霍普金斯大学和腾讯 AI 实验室的研究人员推出了EzAudio，这是一种新的文本转音频 (T2A) 生成模型，有望以前所未有的效率从文本提示中产生高质量的音效。这一进步标志着人…

王浩然
2024年9月22日
000
AI前沿

投资者争相入股 ElevenLabs，该公司估值或很快达到 30 亿美元

据悉，专门为音频应用开发 AI 工具的初创公司 ElevenLabs 正在接受现有和新投资者的接洽，商讨新一轮融资事宜，此轮融资可能令该公司的估值高达 30 亿美元。这家成立两…

王浩然
2024年10月6日
000
AI前沿

过度投资的AI，坑了美国消费一把

“不下馆子，小零食也不吃了，刷牙洗澡这些虽然不能少，但也要尽量控制支出。” 这段话是对美国消费股二季报的总结。二季度，美国沃尔玛、宝洁等代表的必选消费公司营收虽然还在正增长，但大部…

点点
2024年9月12日
000
AI前沿

Microsoft Copilot Vision 现已推出，让 AI 能够看到你在线做什么

Microsoft Copilot日益智能化。这家由萨蒂亚·纳德拉 (Satya Nadella) 领导的公司刚刚宣布，其人工智能助手现在具有“视觉”功能，可与用户一起浏览互联网。…

王浩然
2024年12月8日
000
AI前沿

移动网络运营商如何利用人工智能革新电信行业

三十多年来，移动网络运营商 (MNO) 一直将研发重点放在五个关键领域：消息传递、漫游、策略、信令和清算。鉴于这些系统处理的数据量巨大，MNO 越来越注重利用人工智能 (AI)来增…

点点
2024年10月5日
000
AI前沿

亚马逊与 Anthropic 合作增强 Alexa

亚马逊正准备推出其 Alexa 语音助手的改进版本，预计将于今年 10 月美国购物旺季之前上市。这项新技术在公司内部被称为“Remarkable”，将由 Anthropic 的C…

点点
2024年9月4日
000
AI前沿

Wonder Dynamics 现在可让您直接从多摄像机视频转为完全动画的 3D 场景

Wonder Dynamics 在人工智能增强视觉效果领域取得了重大进展，为动画师和电影制作人提供了实用的工具，并迅速被 Autodesk 收购。他们的最新工具进一步自动化了动画过…

王浩然
2024年10月31日
000
AI前沿

情绪分析能有效预测金融市场的趋势吗？

情绪分析通过揭示传统分析经常忽略的见解，改变了金融市场预测。该策略通过处理来自新闻、社交媒体和财务报告的文本数据，捕捉市场对资产和行业的情绪和态度。随着情绪分析的有效性越来越明…

AI News
2024年9月1日
000
AI前沿

人工智能搜索大战升温：Genspark 按需添加由 Claude 提供支持的财务报告

早在 2024 年 6 月——快速发展的生成式 AI 领域的永恒——一家由微软、谷歌和百度校友创立的初创公司MainFunc 推出了其首款产品 Genspark，一款 AI 搜索引…

王浩然
2024年11月17日
000
AI前沿

智能手机上有 AI？Hugging Face 的 SmolLM2 将强大的模型带到你的手掌上

Hugging Face今天发布了SmolLM2，这是一组新的紧凑型语言模型，它实现了令人印象深刻的性能，同时所需的计算资源比大型模型少得多。新模型采用 Apache 2.0 许…

王浩然
2024年11月3日
000
AI前沿

苹果智能家居中心因Siri挑战而推迟发布‌

据最新报道，苹果公司的智能家居中心产品发布计划遭遇挫折，原因竟出自其内置的Siri语音助手。这款备受期待的智能家居中心原本被视为苹果在智能家居领域的一大突破，但如今却面临延期发布的…

王浩然
2025年3月11日
000
AI前沿

Google 的 NotebookLM 是秘密的 CRM 杀手吗？

我从未从事过销售工作，至少不是虚拟销售。我最接近的一次——这是我的年龄——是在十几岁时在商场从事零售工作，然后在我童年住所附近的 VHS/DVD 租赁店工作，所以我非常尊重那些比我…

王浩然
2024年11月1日
000
AI前沿

OpenText 扩展 AI 功能以提高企业生产力和投资回报率

关于人工智能及其能为企业带来什么，人们有着很多炒作和承诺。对于企业软件供应商OpenText来说，超越炒作，真正展示人工智能的价值，已经成为日常任务。今天，OpenText 宣布…

王浩然
2024年11月22日
000
AI前沿

Nscale 将向英国数据中心投资 25 亿美元，助力生成式人工智能和政府雄心

总部位于伦敦的 AI 超大规模提供商Nscale宣布，计划在未来三年内向英国数据中心行业投资 25 亿美元（20 亿英镑）。这一重大承诺将支持英国政府的 AI 机遇行动计划以及该国…

王浩然
2025年1月14日
000
AI前沿

Nvidia 的 AI 代理游戏现已推出新模型和编排蓝图

随着Nvidia宣布推出多项新服务和模型以促进 AI 代理的创建和部署，业界继续推动代理 AI 的发展。今天，Nvidia 推出了 Nemotron，这是基于Meta的 Lla…

王浩然
2025年1月8日
000
AI前沿

GenLayer推出AI代理交易新方案：让多个大型语言模型投票选出合适合同

GenLayer创新策略：利用AI集体智慧优化合同制定流程在人工智能（AI）技术日新月异的今天，AI正逐渐渗透到各个行业和领域的核心业务流程中。近期，GenLayer公司推出了一…

王浩然
2025年3月19日
000