Hugging Face 的 SmolVLM 可以大幅降低企业的 AI 成本

王浩然 • 2024年11月28日下午2:00 • AI前沿 • 151 views

Hugging Face 刚刚发布了SmolVLM，这是一种紧凑型视觉语言 AI 模型，可能会改变企业在运营过程中使用人工智能的方式。新模型以惊人的效率处理图像和文本，而所需的计算能力仅为其竞争对手的一小部分。

时机再好不过了。当公司苦苦挣扎于实施大型语言模型的成本飞涨以及视觉 AI 系统的计算需求时，SmolVLM 提供了一种实用的解决方案，既不会为了可访问性而牺牲性能。

小模型，大影响：SmolVLM 如何改变游戏规则

Hugging Face 的研究团队在模型卡上解释道： “SmolVLM 是一个紧凑的开放多模态模型，可以接受任意序列的图像和文本输入以产生文本输出。”

该模型前所未有的效率使得这一性能更加重要：它只需要 5.02 GB 的 GPU RAM，而Qwen-VL 2B和InternVL2 2B等竞争模型分别需要 13.70 GB 和 10.52 GB。

这种效率代表了人工智能开发的根本性转变。Hugging Face 并没有遵循行业中“越大越好”的理念，而是证明了精心的架构设计和创新的压缩技术可以在轻量级封装中提供企业级性能。这可以大大降低希望实施人工智能视觉系统的公司的进入门槛。

视觉智能突破：SmolVLM 先进压缩技术解析

SmolVLM背后的技术成就令人瞩目。该模型引入了一种激进的图像压缩系统，可以比同类中的任何先前模型更有效地处理视觉信息。研究人员解释说：“SmolVLM 使用81 个视觉标记来编码大小为 384×384 的图像块”，这种方法使模型能够处理复杂的视觉任务，同时保持最小的计算开销。

这种创新方法不仅限于静态图像。在测试中，SmolVLM 在视频分析方面表现出意想不到的能力，在CinePile 基准测试中获得了 27.14% 的分数。这使其在更大、资源更密集的模型中具有竞争力，这表明高效的 AI 架构可能比以前想象的更强大。

企业 AI 的未来：可访问性与性能的结合

SmolVLM的商业意义深远。通过让计算资源有限的公司也能使用先进的视觉语言功能，Hugging Face 基本上实现了一项以前只有科技巨头和资金雄厚的初创公司才能使用的技术的普及。

该模型有三种版本，旨在满足不同的企业需求。企业可以部署基础版本进行定制开发，使用合成版本增强性能，或实施指导版本以立即部署在面向客户的应用程序中。

SmolVLM依据Apache 2.0 许可证发布，以形状优化的 SigLIP 图像编码器和用于文本处理的 SmolLM2 为基础。训练数据来源于 Cauldron 和 Docmatix 数据集，可确保在各种业务用例中实现稳健的性能。

研究团队表示：“我们期待看到社区将使用 SmolVLM 创造什么。”这种对社区发展的开放态度，加上全面的文档和集成支持，表明 SmolVLM 可能成为未来几年企业 AI 战略的基石。

这对人工智能行业的影响是巨大的。随着企业在实施人工智能解决方案的同时管理成本和环境影响方面面临越来越大的压力，SmolVLM 的高效设计为资源密集型模型提供了一种引人注目的替代方案。这可能标志着企业人工智能新时代的开始，性能和可访问性不再相互排斥。

该模型可通过 Hugging Face 平台立即使用，并有可能重塑企业在 2024 年及以后实施视觉 AI 的方式。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/hugging-face-de-smolvlm-ke-yi-da-fu-jiang-di-qi-ye-de-ai

CinePile 基准 Hugging Face InternVL2 2B Qwen-VL 2B SmolVLM 紧凑型视觉语言 AI 模型降低企业的 AI 成本

Like (0)

王浩然作者

0 0

通过智能数据映射和检索打破云备份“黑匣子”

Previous 2024年11月28日

阿里巴巴发布了一款“公开”挑战 OpenAI o1 推理模型的模型

Next 2024年11月28日

AI前沿

LlamaIndex推出构建非结构化数据代理的云服务‌

在数字化转型的浪潮中，企业对于非结构化数据的处理能力日益成为竞争的关键。为了满足这一需求，LlamaIndex近日宣布推出了一项创新的云服务，旨在帮助企业轻松构建和管理非结构化数据…

王浩然
2025年3月5日
000
AI前沿

Meta向移动开发人员推销VR，在Quest上对Android应用程序提供新支持

在周三的Meta Connect会议上，该公司向开发人员推销其Quest混合现实平台，作为下一个大型应用程序商店。随着苹果和谷歌等科技巨头对其应用程序商店垄断的监管受到严格监管，M…

free
2024年9月26日
000
AI前沿

AI编程初创公司Codeium据传正以近30亿美元估值进行融资谈判

近日，据知情人士透露，AI编程领域的初创公司Codeium正积极与投资者进行谈判，计划以接近30亿美元的估值筹集新一轮资金。这一消息标志着Codeium在AI编程技术领域的快速发展…

王浩然
2025年2月24日
000
AI前沿

Vanta 工程副总裁 Iccha Sethi – 访谈系列

Iccha Sethi 是领先的信任管理平台Vanta的工程副总裁，她领导的计划专注于增强安全性和合规性自动化。此前，她是 GitHub 的工程主管，负责管理包括 Actions、…

点点
2024年10月4日
000
AI前沿

一小时翻译整部《甄嬛传》，AI面试官发offer……在杭州看AI落地的1000种玩法

2024年9月19日开幕的阿里云云栖大会上，近300家涵盖算力、模型、应用的AI企业，和近1000种AI产品，构成了一幅全行业的活地图。多模态和具身智能，两个今年最热的AI风口，…

点点
2024年9月21日
000
AI前沿

微软希望与 OpenAI 建立开放关系

微软和 OpenAI 之间有着某种共生关系，前者向一家初创的人工智能实验室投入了数十亿美元的资金，作为回报，微软获得了尖端模型的早期使用权，这些模型现已融入微软的生产力软件套件中。…

王浩然
2024年12月25日
000
AI前沿

以下是增强 AI 性能的 3 个关键 LLM 压缩策略

在当今快节奏的数字环境中，依赖人工智能的企业面临着新的挑战：运行人工智能模型的延迟、内存使用和计算能力成本。随着人工智能的快速发展，支持这些创新的模型变得越来越复杂和资源密集。虽然…

王浩然
2024年11月11日
000
AI前沿

金融领域的人工智能：重新定义金融服务的双刃剑

如今，只有懒人不会讨论人工智能 (AI) 及其彻底改变我们生活各个方面（包括金融）的潜力。事实上，人工智能市场正在呈现惊人的增长——2024 年市场规模超过1840 亿美元，比 2…

王浩然
2024年8月31日
000
AI前沿

OpenAI 筹集数十亿美元资金，并承诺与“美国及其盟国政府”合作

OpenAI 周三在网上发布的一份声明称，该公司已筹集 66 亿美元，估值达到 1570 亿美元。据《华尔街日报》报道，此轮融资由 Thrive Capital 领投，投资额为 1…

王浩然
2024年10月3日
000
AI前沿

YC 初创公司 Pharos 获得 Felicis 领投的 500 万美元种子轮融资，旨在将 AI 引入医院质量报告

医务人员和行政人员每天都要填写大量文书工作，工作压力越来越大。数十家甚至数百家初创公司看到了利用生成式人工智能减轻这些官僚程序负担的机会。这些公司正在开发人工智能医疗文书、预授权…

王浩然
2024年10月26日
000
AI前沿

领导者对负责任的人工智能所需的治理水平存在分歧

领导者对于如何打造负责任的人工智能存在分歧，有两种观点，一种是治理主导，一种是实验优先，而监管机构则在寻找正确的平衡方面面临更大困难。这些见解是在上周的人工智能领袖论坛上…

王浩然
2024年12月10日
000
AI前沿

研究发现，由于效果不佳，Deepfakes 对 2024 年选举几乎没有影响

尽管互联网上越来越多地充斥着虚假图片，但我们至少可以相信人类在重要时刻嗅出谎言的能力。最近的大量研究表明，人工智能生成的虚假信息对今年全球选举没有产生任何实质性影响，因为它还不是很…

王浩然
2024年12月28日
000
AI前沿

在 Midjourney 之前，有 NightCafe — 而且它现在还在营业

图像生成的 OG 是成功的，只是少了一些审核挑战艾丽·拉塞尔 (Elle Russell) 是位于澳大利亚凯恩斯的NightCafe的联合创始人，该公司提供一套人工智能艺术创作工…

王浩然
2024年9月1日
000
AI前沿

ChatGPT 获得屏幕共享和实时视频分析功能，可与 Gemini 2 相媲美

OpenAI终于在其先进的语音模式中添加了期待已久的视频和屏幕共享功能，允许用户以不同的方式与聊天机器人进行交互。目前，ChatGPT Teams、Plus 和 Pro 用户的 …

王浩然
2024年12月17日
000
AI前沿

Sakana AI 获 1 亿美元融资，挑战 OpenAI、Anthropic 成为“世界级”人工智能实验室

人工智能热潮席卷全球。中国阿里巴巴凭借 Qwen2-VL登上新闻头条仅几天后，由前谷歌研究员 David Ha 和 Llion Jones 以及前外交官 Ren Ito 创立的日本…

王浩然
2024年9月5日
000
AI前沿

新的 NFL 投注应用程序利用人工智能来平衡比赛

随着劳动节的过去和职业橄榄球赛季的正式开始，体育分析公司 Field Vision Sports 推出了所谓的首款移动应用程序，提供基于人工智能和机器学习的 NFL 比赛预测，让投…

点点
2024年9月11日
000
AI前沿

Perplexity 称其目前每周处理 1 亿次搜索查询

Perplexity 首席执行官 Aravind Srinivas表示，该人工智能搜索引擎目前每周执行 1 亿次查询。按月推算，大约有 4 亿次查询，高于7 月份的 2.5 亿次查…

王浩然
2024年10月26日
000
AI前沿

Koyeb无服务器云平台：助力开发者快速部署Tenstorrent AI加速器‌

近日，Koyeb无服务器云平台宣布了一项重大更新，允许开发者在该平台上轻松部署Tenstorrent AI加速器。这一更新为开发者提供了更为灵活和高效的AI计算资源，助力他们加速A…

王浩然
2025年2月27日
000
AI前沿

Meta的Vanilla Maverick AI模型在热门聊天基准测试中排名落后

在人工智能领域，每一次基准测试的发布都如同一次没有硝烟的战争，各大科技巨头纷纷亮出自己的杀手锏，以期在排行榜上占据一席之地。近日，一项针对聊天机器人性能的基准测试结果揭晓，Meta…

王浩然
1小时前
000
AI前沿

老美都要在太空建数据中心了，成本大降95%，英伟达强力支持

建数据中心，可能是各家AI大厂最重要的事情之一。这两年，科技巨头的年化资本支出，从1380亿美元同比增长到2290亿美元，这多花的910亿美元，有一大部分花在了AI数据中心建设上…

点点
2024年9月16日
000