智能手机上有 AI？Hugging Face 的 SmolLM2 将强大的模型带到你的手掌上

王浩然 • 2024年11月3日上午11:00 • AI前沿 • 160 views

Hugging Face今天发布了SmolLM2，这是一组新的紧凑型语言模型，它实现了令人印象深刻的性能，同时所需的计算资源比大型模型少得多。

新模型采用 Apache 2.0 许可发布，有三种大小——135M 、 360M和1.7B参数——适合部署在智能手机和其他处理能力和内存有限的边缘设备上。最值得注意的是，1.7B 参数版本在几个关键基准测试中优于 Meta 的Llama 1B 模型。

小型模型在人工智能性能测试中发挥强大作用

Hugging Face 的模型文档称：“SmolLM2 比其前身有了显著的进步，特别是在指令遵循、知识、推理和数学方面。”最大的变体在 11 万亿个 token 上进行了训练，使用了包括FineWeb-Edu和专门的数学和编码数据集在内的多样化数据集组合。

这一发展正值人工智能行业努力应对运行大型语言模型 (LLM) 的计算需求的关键时刻。虽然 OpenAI 和 Anthropic 等公司不断突破模型规模的界限，但人们越来越认识到需要能够在设备本地运行的高效、轻量级人工智能。

追求更大的 AI 模型的势头让许多潜在用户望尘莫及。运行这些模型需要昂贵的云计算服务，而云计算服务本身也存在问题：响应时间慢、数据隐私风险高以及小公司和独立开发者根本无法承受的高成本。SmolLM2 提供了一种不同的方法，将强大的 AI 功能直接带入个人设备，指向未来更多用户和公司可以使用先进的 AI 工具，而不仅仅是拥有庞大数据中心的科技巨头。

随着人工智能转向移动设备，边缘计算得到推动

考虑到其规模，SmolLM2 的性能尤其值得关注。在衡量聊天功能的MT-Bench 评估中，1.7B 模型获得了 6.13 分，与更大的模型相媲美。它在数学推理任务中也表现出色，在GSM8K 基准测试中获得了 48.2 分。这些结果挑战了模型越大越好的传统观点，表明精心的架构设计和训练数据管理可能比原始参数计数更重要。

这些模型支持一系列应用，包括文本重写、摘要和函数调用。由于体积小巧，它们可以在隐私、延迟或连接限制使基于云的 AI 解决方案不切实际的场景中部署。这在医疗保健、金融服务和其他数据隐私不容置疑的行业中可能特别有价值。

业内专家认为，这是更高效的人工智能模型的广泛趋势的一部分。在设备本地运行复杂语言模型的能力可以为移动应用开发、物联网设备和数据隐私至关重要的企业解决方案等领域带来新的应用。

高效人工智能的竞争：小型模型挑战行业巨头

然而，这些较小的模型仍然存在局限性。根据 Hugging Face 的文档，它们“主要理解和生成英文内容”，并且可能并不总是产生事实准确或逻辑一致的输出。

SmolLM2 的发布表明，人工智能的未来可能不仅仅属于越来越大的模型，而是属于能够以更少的资源提供强大性能的更高效的架构。这可能对实现人工智能的民主化和减少人工智能部署对环境的影响具有重要意义。

这些模型可通过Hugging Face 的模型中心立即获得，每个尺寸变体都提供基础版本和指令调整版本。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/zhi-neng-shou-ji-shang-you-ai-hugging-face-de-smollm2-jiang

Like (0)

王浩然作者

0 0

麻省理工学院首次推出受大型语言模型启发的方法，用于教授机器人新技能

Previous 2024年11月3日

Meta 推出 AI 工具，让机器人在现实世界中拥有人类的触感

Next 2024年11月3日

AI前沿

微软让开发人员更容易构建 AI 应用程序——这对 AWS 来说可能是个坏消息

微软周二公布了其人工智能工具的一项雄心勃勃的扩展，推出了适用于 Azure 的 GitHub Copilot和一套以开发人员为中心的功能，这些功能可能会从根本上改变人工智能时代的软…

王浩然
2024年11月1日
000
AI前沿

OpenAI 将 o1 AI 模型扩展到企业和教育领域，与 Anthropic 直接竞争

OpenAI已向所有ChatGPT Enterprise和ChatGPT Edu客户开放其最新的 AI 模型o1-preview和o1-mini。这些模型旨在处理复杂的推理任务，有…

王浩然
2024年9月20日
000
AI前沿

亚马逊推出人工智能购物指南

亚马逊周三推出了一系列针对消费者的人工智能功能和产品中的最新产品：人工智能购物指南。该指南将于周四推出，涵盖亚马逊网站上的 100 多种产品类型，有助于整合消费者在购买前往往会研究…

王浩然
2024年10月10日
000
AI前沿

人工智能驱动的栩栩如生的人形机器人将成为“情感伴侣”

人形机器人 Uma 的设计与人类相似，能够理解自然语言，可以讲故事、回答问题这种栩栩如生的形态是否代表着机器人的未来？这是 Una，它是由总部位于深圳的优必选机器人公司打造的 …

王浩然
2025年2月21日
000
AI前沿

研究人员开源 Sky-T1，这是一种“推理”人工智能模型，训练成本不到 450 美元

所谓的推理人工智能模型正变得越来越容易开发，并且更便宜。周五，加州大学伯克利分校天空计算实验室的研究团队 NovaSky 发布了 Sky-T1-32B-Preview，该推理模型…

王浩然
2025年1月12日
000
AI前沿

用AI找客户，半年怒赚200万美元，AI销售是Agent的下一站

继搜索、抄写、写作、编程之后，销售成为AI Agent的下一个重要落地场景。根据字节跳动推出的《生成式AI商业落地白皮书》，经过590名企业中高层的票选，在“十大生成式AI最有价…

点点
2024年9月12日
000
AI前沿

微软的新 Magentic-One 系统指挥多个 AI 代理完成用户任务

希望部署多个 AI 代理的企业通常需要实施一个框架来管理它们。为此，微软研究人员最近推出了一种名为Magentic-One 的新型多智能体基础设施，该基础设施允许单个 AI 模…

王浩然
2024年11月10日
000
AI前沿

Adobe 推出经过授权内容训练的 AI 视频生成器

Adobe发布了Firefly Video Model，这是一款全新的 AI 文本转视频生成工具，可以根据书面提示制作新颖的视频。它与OpenAI、Runway、Google和Me…

点点
2024年10月16日
000
AI前沿

探讨人工智能对社会影响的非小说类书籍

人工智能 (AI) 是执行复杂计算的代码或技术，涵盖模拟、数据处理和分析。人工智能的重要性日益凸显，已成为医疗保健、教育和金融等许多行业的变革者。事实证明，人工智能的使用可使许多…

点点
2024年9月18日
000
AI前沿

人工智能驱动的制造业和机器人创新技术揭晓

工业自动化开发商 Vention 宣布推出基于人工智能的增强功能以及用于先进制造和机器人技术的新产品

点点
2024年9月18日
000
AI前沿

使用生成式人工智能进行 SEO 的 12 种方法

生成式人工智能 (GenAI) 的兴起正在改变数字营销人员处理搜索引擎优化 (SEO) 的方式。GenAI 驱动的工具正在帮助企业提高搜索排名并比以往更有效地推动自然流量。根据se…

王浩然
2024年10月20日
000
AI前沿

亚马逊通过 AI 视频搜索改进 Ring 订阅服务

亚马逊正在改进其 Ring 视频门铃和摄像头的订阅服务。一项名为 Ring Home Premium 的新服务将包括全天候录制和人工智能视频搜索等功能，起价为每月 19.99 美…

王浩然
2024年10月10日
000
AI前沿

科尔莫戈罗夫-阿诺德网络：高效且可解释的神经网络新前沿

神经网络一直处于人工智能发展的前沿，推动了从自然语言处理和计算机视觉到战略游戏、医疗保健、编程、艺术，甚至自动驾驶汽车等各个领域的发展。然而，随着这些模型在规模和复杂性方面的扩展，…

王浩然
2024年8月22日
000
AI前沿

帕尔默·卢基的人工智能防御公司 Anduril 正在俄亥俄州建造一座价值 10 亿美元的工厂

西方的火焰正向东方袭来。科技亿万富翁兼VR 耳机大亨帕尔默·卢基 (Palmer Luckey)创立的人工智能防御公司 Anduril周四宣布计划在俄亥俄州哥伦布市建造一家工厂。…

王浩然
2025年1月21日
000
AI前沿

利用人工智能预测和预防互联网中断

随着对减少服务中断和提高连接可靠性的需求不断增长，无缝的用户体验已成为任何互联网提供商的服务基准。为了满足这一需求，人工智能 (AI) 应运而生，成为一项不断发展的技术，可确保跨地…

王浩然
2024年12月8日
000
AI前沿

数据中心技术正在蓬勃发展，但对于初创企业来说采用并不容易

数据中心行业正在迅速扩张，以跟上人工智能飞轮式增长的步伐。虽然这些数据中心是人工智能基础设施的必需品，但它们存储着人工智能公司的计算能力，建造成本高昂，运行成本似乎更高，而且耗能巨…

王浩然
2024年10月14日
000
AI前沿

Spotify携手Eleven Labs，拓展AI有声读物库

近日，全球领先的流媒体音乐服务平台Spotify宣布与Eleven Labs达成合作，旨在进一步扩大其AI有声读物库的规模。此次合作标志着Spotify在音频内容领域的又一重要布局…

王浩然
2025年2月24日
000
AI前沿

畅销书作家批评全国小说写作月的人工智能中立立场

全国小说写作月（NaNoWriMo）是一个已有 25 年历史的非营利组织，旨在鼓励任何有兴趣的人每年 11 月创作一本小说。该组织最近宣布将接受使用人工智能 (AI)作为写作过程的…

王浩然
2024年9月5日
000
AI前沿

萨姆·奥特曼的世界币成为世界币，并展示新的虹膜扫描球来证明你的人类身份

世界币 (Worldcoin) 是 Sam Altman 共同创办的“人格证明”加密项目，该项目通过扫描人的眼球，周四宣布将“币”从其名称中删除，现在改名为“世界币”。世界币项目背…

点点
2024年10月18日
000
AI前沿

谁最常使用人工智能？人类经济指数对数据进行了分析

人工智能正在重塑现代职场，但到目前为止，其对个人任务和职业的影响仍然难以量化。Claude背后的人工智能初创公司Anthropic的一份新报告以数据为依据，展示了企业和专业人士如何…

王浩然
2025年2月11日
000