Meta 向研究人员开放其 MobileLLM，并发布完整权重

王浩然 • 2024年11月3日下午5:00 • AI前沿 • 120 views

Meta AI 宣布开源MobileLLM，这是一套针对移动设备优化的语言模型，其模型检查点和代码现已在 Hugging Face 上提供。不过，目前它仅在 Creative Commons 4.0 非商业许可下提供，这意味着企业不能在商业产品上使用它。

MobileLLM最初在 2024 年 7 月发表的一篇研究论文中描述，现在已完全可用且具有开放权重，标志着高效的设备端 AI 的一个重要里程碑。

这些开放权重的发布使 MobileLLM 成为 Apple Intelligence 更直接（尽管是迂回）的竞争对手。Apple Intelligence 是 Apple 的设备/私有云混合 AI 解决方案，由多个模型组成，本周将向美国和欧盟以外的 iOS 18 操作系统用户发货。然而，由于仅限于研究使用，并且需要从 Hugging Face 下载和安装，因此目前它可能仍仅限于计算机科学和学术界。

提高移动设备的效率

MobileLLM 旨在解决在智能手机和其他资源受限的设备上部署 AI 模型的挑战。

这些模型的参数数量从 1.25 亿到 10 亿不等，旨在在移动硬件典型的有限内存和能量容量内运行。

Meta 的研究表明，通过强调架构而不是规模，精心设计的紧凑模型可以直接在设备上提供强大的 AI 性能。

解决扩展问题

MobileLLM 背后的设计理念偏离了强调宽度和大量参数的传统 AI 缩放定律。

Meta AI 的研究重点是深度、薄型架构，以最大限度地提高性能，改善模型捕捉抽象概念的方式。

Meta 首席人工智能科学家 Yann LeCun 强调了这些以深度为重点的策略对于在日常硬件上实现高级人工智能的重要性。

MobileLLM 采用了多项创新，旨在使较小的模型更有效：

•深度优于宽度：该模型采用深度架构，在小规模场景中表现出色，优于更宽但更浅的架构。

•嵌入共享技术：这些技术可以最大限度地提高权重效率，这对于维持紧凑的模型架构至关重要。

•分组查询注意力：受到 Ainslie 等人 (2023) 的研究启发，该方法优化了注意力机制。

•立即逐块权重共享：一种通过最小化内存移动来减少延迟的新策略，有助于保持移动设备上的执行效率。

性能指标和比较

尽管体积小，MobileLLM 模型在基准测试任务上却表现出色。1.25 亿和 3.5 亿参数版本在零样本任务中的准确率比之前最先进的 (SOTA) 模型分别提高了 2.7% 和 4.3%。

值得注意的是，350M 版本甚至与更大的 Meta Llama-2 7B 型号的 API 调用性能相匹配。

这些成果表明，结构良好的小型模型可以有效地处理复杂的任务。

专为智能手机和边缘计算而设计

MobileLLM 的发布与 Meta AI 为实现先进 AI 技术民主化所做的更广泛努力相一致。

由于云成本和隐私问题导致对设备上 AI 的需求不断增加，像 MobileLLM 这样的模型将发挥关键作用。

这些模型针对内存限制为 6-12 GB 的设备进行了优化，使其可以集成到 iPhone 和 Google Pixel 等流行智能手机中。

开放但不商业

Meta AI 决定开源 MobileLLM，反映出该公司对合作和透明度的承诺。遗憾的是，许可条款目前禁止商业使用，因此只有研究人员才能受益。

通过共享模型权重和预训练代码，他们邀请研究界来拓展和完善他们的工作。

这可以加速小型语言模型 (SLM) 领域的创新，使得无需依赖广泛的云基础设施即可获得高质量的人工智能。

有兴趣测试 MobileLLM 的开发者和研究人员现在可以访问 Hugging Face 上的模型，这些模型与 Transformers 库完全集成。随着这些紧凑模型的发展，它们有望重新定义高级 AI 在日常设备上的运行方式。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/meta-xiang-yan-jiu-ren-yuan-kai-fang-qi-mobilellm-bing-fa

Like (0)

王浩然作者

0 0

微软的代理 AI 工具 OmniParser 在开源排行榜上名列前茅

Previous 2024年11月3日

Noma 为企业 AI 解决方案提供从数据存储到部署的安全保障

Next 2024年11月3日

AI前沿

Grok 3疑似短暂屏蔽对特朗普和马斯克的负面提及

近日，有报道称，人工智能系统Grok 3似乎曾短暂地对涉及特朗普和马斯克的负面言论进行了屏蔽。这一发现引发了公众的广泛关注与讨论，人们开始质疑Grok 3是否具备足够的公正性和客观…

王浩然
2025年2月26日
000
AI前沿

OpenAI 启动 ChatGPT 项目，让你可以组织文件、分组聊天

OpenAI最新发布的 ChatGPT 项目解决了在 ChatGPT 上组织文件和对话的需求。该功能类似于谷歌流行的NotebookLM应用程序。在“OpenAI 12 天”直…

王浩然
2024年12月16日
000
AI前沿

科技巨头们到底向AI投了多少钱？看这六张图表就够了

据媒体报道，生成式人工智能引发了美国现代史上最大的消费热潮之一，企业和投资者押注数千亿美元，深信这项技术将重塑全球经济版图，并潜藏着巨大的盈利前景。但问题在于：这笔庞大的投资是否以…

点点
2024年9月12日
000
AI前沿

Runway Gen-4 AI：解决角色一致性挑战，让AI电影制作真正有用

Runway AI公司近日推出了其最先进的AI视频生成模型——Gen-4，标志着电影制作工具迈入了一个全新的竞争阶段。这款新系统引入了跨多个镜头的角色和场景一致性功能，这是迄今为止…

王浩然
2025年4月1日
000
AI前沿

马克·贝尼奥夫警告称，人工智能虽然有用，但被夸大了，并将部分责任归咎于微软

科技行业最热衷炒作的人之一、Salesforce 首席执行官马克·贝尼奥夫 (Marc Benioff) 想让你知道，他对生成式人工智能充满期待，但即便如此，他也不认为它能做到其最…

点点
2024年10月18日
000
AI前沿

Nvidia 在卡内基梅隆大学成立人工智能、机器人技术社区

该计划旨在加强具有人工智能技术转型潜力的社区之间的公私合作伙伴关系

点点
2024年10月22日
000
iPhone 16 Pro是第一款感觉像相机的手机

摄影爱好者有句流行語——通常归因于Chase Jarvis——最好的相机就是你带的相机。换句话说，如果你想拍照时没有相机，相机有多好并不重要。如今，这将争辩说，最好的相机是我们大…

free
AI前沿 2024年9月28日
000
AI前沿

大模型拉新大战，Kimi竟然不是赢家？揭秘背后真相

2024年以来，大模型厂商在各大平台开启了烧钱大战，大模型广告铺天盖地，从线上甚至烧到了地铁、机场广告牌，动辄上亿的成本背后，留存依旧是各大大模型厂商的一道难关。今年以来，大模型…

点点
2024年9月9日
000
AI前沿

小众人工智能助手如何帮助释放真正的能力

随着人工智能继续渗透到越来越多的行业，未来十年左右这个市场的价值尚不可知。在这一扩张中，人工智能助手经历了巨大的增长，无论是其运作范围还是其产生的货币价值。具体来说，…

AI News
2024年9月6日
000
AI前沿

xAI 以每月价值 25 美元的 API 积分吸引开发者，并支持 OpenAI、Anthropic SDK

我们已经知道这一点有一段时间了，但现在我们可以确定的是：生成式人工智能竞赛对于开发人员来说就像对于最终用户来说一样是一场竞赛。举个例子：今天，埃隆·马斯克的 xAI（社交网络 X…

王浩然
2024年11月6日
000
AI前沿

OpenAI的GPT 4.5模型向更多ChatGPT用户开放‌

随着人工智能技术的不断进步，OpenAI再次引领行业潮流，宣布将其最新的GPT 4.5模型向更多的ChatGPT用户开放。这一消息无疑为人工智能爱好者及从业者带来了振奋人心的消息，…

王浩然
2025年3月8日
000
AI前沿

Nvidia 将开源 Run:ai 软件，该软件以 7 亿美元收购，旨在帮助企业管理 AI GPU

Nvidia 已完成对Run:ai的收购，Run :ai是一家软件公司，可帮助客户更轻松地为 AI 编排 GPU 云，并表示将开源该软件。收购价格并未披露，但有报道称，当 Nvi…

王浩然
2024年12月31日
000
AI前沿

Patronus AI 推出全球首个自助服务 API，旨在阻止 AI 幻觉

客服聊天机器人自信地描述一款并不存在的产品。金融人工智能编造市场数据。医疗保健机器人提供危险的医疗建议。这些人工智能幻觉曾被视为有趣的怪癖，但如今已成为急于部署人工智能的公司面临的…

王浩然
2024年11月3日
000
AI前沿

神秘「蓝莓」登顶文生图竞技场，疑似Flux.1续作，网友：都来免费打广告了

都来玩这套。继OpenAI“草莓”之后，又有神秘模型蓝莓来“霸榜”。在文生图模型排行榜上，两个“无人认领”的模型blueberry_0和blueberry_1力压Flux.1、…

点点
2024年9月29日
000
AI前沿

人工智能的未来可能与 Twitter 很相似

大约一个月前，Michael Sayman 意识到他终于可以开发他多年来一直在思考的应用程序：一个社交网络，除了你之外的每个人都是人工智能机器人。大型语言模型终于足够好，足够便宜，…

王浩然
2024年9月30日
000
AI前沿

人工智能活了过来：从调酒师到手术助手再到小狗，未来的机器人正在路上

人形机器人不再是科幻小说中的东西。想象一下这样一个世界：机器人不仅能在工厂与我们合作，还能在商店迎接我们、协助手术并照顾我们所爱的人。特斯拉计划在2026 年部署数千台 Optim…

王浩然
2025年1月20日
000
AI前沿

OpenAI前研究员卷入AI版权案，被传票传唤‌

在人工智能领域，一起涉及版权的法律纠纷正引起广泛关注。据最新报道，一位曾供职于OpenAI的关键研究员因涉及一场关于AI技术的版权争议案件，已被法院正式传票传唤。这场版权风波的核…

王浩然
2025年3月5日
000
AI前沿

GenLayer推出AI代理交易新方案：让多个大型语言模型投票选出合适合同

GenLayer创新策略：利用AI集体智慧优化合同制定流程在人工智能（AI）技术日新月异的今天，AI正逐渐渗透到各个行业和领域的核心业务流程中。近期，GenLayer公司推出了一…

王浩然
2025年3月19日
000
AI前沿

Fal.Con 2024：CrowdStrike 推出弹性设计框架以加强全球网络安全

CrowdStrike首席执行官乔治·库尔茨 (George Kurtz) 在Fal.Con 2024开幕式上向客户和合作伙伴表示感谢，他表示，如果没有他们的帮助，公司不可能度过今…

王浩然
2024年9月22日
000
AI前沿

使用 Azure 和 OpenAI 微调预训练模型

在人工智能 (AI) 的动态领域，微调预训练模型对于根据特定需求定制 AI 至关重要。Microsoft Azure 与 OpenAI 合作，为此提供了一个强大的平台，帮助开发人员…

王浩然
2024年8月31日
000