Moondream今天以 450 万美元的种子前融资和一项激进的主张走出了隐身模式:对于 AI 模型来说,越小越好。这家初创公司得到了Felicis Ventures、微软的 M12 GitHub Fund和Ascend的支持,它构建了一个视觉语言模型,该模型仅使用 16 亿个参数即可运行,但性能却可与四倍于其大小的模型相媲美。
该公司的开源模型已经引起了广泛关注,下载量超过 200 万次,GitHub 上有 5100 个星。Moondream 首席执行官兼前 AWS 技术总监杰伊·艾伦 (Jay Allen) 表示:“它的特别之处在于它是最小的模型之一,具有高精度的特点,而且运行得非常好。它可以在任何地方轻松快速地运行。它甚至可以在 iOS 和手机上运行。”
边缘计算与企业 AI 相遇:Moondream 如何解决云成本危机
这家初创公司解决了企业采用 AI 时日益严重的问题:云计算的巨额成本和隐私问题。Moondream 的方法允许 AI 模型在从智能手机到工业设备的设备上本地运行。
“随着人工智能进入越来越多的应用,我认为我们有点左右为难,既想享受人工智能的所有好处,又不一定想把我们的整个生活都直播到云端,”艾伦表示。“我倾向于尽可能多地在边缘端做事,这样我就能控制自己的隐私。”
实际应用:从零售库存到工厂车间智能
早期采用者已经发现了该技术的多种应用。零售商通过移动扫描将其用于自动库存管理。运输公司将其用于车辆检查,而拥有隔离系统的制造工厂则在本地实施人工智能进行质量控制。
技术成果引人注目。最近的基准测试显示,Moondream2在 VQAv2 上的准确率达到 80.3% ,在 GQA 上的准确率达到 64.3% ——与更大的模型相比毫不逊色。该系统的能源效率令人印象深刻,首席技术官 Vik Korrapati 指出,“每十亿个参数每代币消耗大约 0.6 焦耳。”
大卫与歌利亚:小团队如何对抗科技巨头
虽然大型科技公司专注于需要大量计算资源的大规模模型,但 Moondream 的目标是实际实施。“这个领域的很多公司都专注于 AGI,这最终会成为一个很大的干扰,”Korrapati 说。“我们专注于感知问题,以及如何以开发人员需要的尺寸和形式提供尖端的多模态功能。”
该公司现在推出了Moondream 云服务,旨在简化开发,同时保持边缘部署的灵活性。“他们想要的是最简单的途径,从类似云的产品开始,这样他们就可以随意使用它,”艾伦说。“但一旦他们这样做了,他们就不想感觉自己被束缚了。”
这种混合方法引起了开发人员的共鸣。该公司在开源社区中拥有大量追随者,艾伦将此归功于他们的“黑客、开源精神”和透明的开发流程。
至于来自科技巨头的竞争,艾伦仍然对 Moondream 的专注战略充满信心。“对于许多大公司来说,这往往是他们的 8,000 项优先事项之一,”他说。“似乎没有多少公司像我们一样专注于为开发者提供无缝的多模式体验。”
该公司预计,未来 12 个月内企业将广泛采用视觉语言模型,但 Korrapati 警告称,“与 AI 谈论时间表是一场危险的游戏”。
有了新资金,Moondream 计划扩大团队,包括在其西雅图总部招聘全栈工程师。该公司的下一个挑战将是扩大其技术规模,同时保持其早期成功的效率和可访问性。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/moondream-chou-ji-450-wan-mei-yuan-yi-zheng-ming-xiao-xing