麻省理工学院衍生公司 Liquid 首次推出非变压器 AI 模型，它们已经是最先进的

wang, jinchang • 2024年10月3日下午1:00 • AI前沿 • 202 views

Liquid AI是一家由麻省理工学院 (MIT) 计算机科学与人工智能实验室 (CSAIL) 前研究人员共同创立的初创公司，该公司宣布推出其首批多模式 AI 模型：“液体基础模型 (LFM)”。与当前生成式人工智能浪潮中的大多数其他模型不同，这些模型并非基于2017 年开创性论文“注意力就是你所需要的”中概述的变压器架构。

相反，Liquid 表示其目标“是探索构建生成式预训练变压器 (GPT) 之外的基础模型的方法”，并使用新的 LFM，特别是从“第一原理……就像工程师制造发动机、汽车和飞机一样”构建。

看来他们已经做到了这一点——因为新的 LFM 模型已经比其他同等尺寸的基于变压器的模型拥有更优异的性能，例如 Meta 的 Llama 3.1-8B 和微软的 Phi-3.5 3.8B。

Liquid 的 LFM 目前有三种不同的尺寸和型号：

LFM 1.3B（最小）
低频调速 3B
LFM 40B MoE（最大的，“混合专家”模型，类似于 Mistral 的 Mixtral）

其名称中的“B”代表十亿，指的是控制模型信息处理、分析和输出生成的参数（或设置）的数量。通常，参数数量越多的模型在更广泛的任务中就越有能力。

Liquid AI 已经表示，LFM 1.3B 版本在许多领先的第三方基准测试中均优于Meta 的新 Llama 3.2-1.2B和微软的 Phi-1.5，其中包括流行的大规模多任务语言理解 (MMLU)，其中包含 57 个涉及科学、技术、工程和数学 (STEM) 领域的问题，“这是非 GPT 架构首次显著优于基于 Transformer 的模型。”

这三款产品都旨在提供最先进的性能，同时优化内存效率，Liquid 的 LFM-3B 仅需要 16 GB 内存，而 Meta 的 Llama-3.2-3B 型号则需要超过 48 GB 内存（如上图所示）。

Liquid AI 后期训练主管 Maxime Labonne在 X 上表示， LFM 是“我职业生涯中最自豪的版本 :)”，并澄清了 LFM 的核心优势：它们能够超越基于 Transformer 的模型，同时占用更少的内存。

这些模型不仅在原始性能基准方面具有竞争力，而且在运营效率方面也具有竞争力，使其成为各种用例的理想选择，从金融服务、生物技术和消费电子领域的企业级应用程序到边缘设备上的部署。

然而，对于潜在用户和客户来说，重要的是，这些模型不是开源的。相反，用户需要通过Liquid 的推理游乐场、Lambda Chat或Perplexity AI来访问它们。

Liquid 如何“超越”生成式预训练转换器 (GPT)

在这种情况下，Liquid 表示它使用了“深深植根于动态系统、信号处理和数值线性代数理论的计算单元”的混合，结果是“可用于建模任何类型序列数据的通用 AI 模型，包括视频、音频、文本、时间序列和信号”来训练其新的 LFM。

去年报道了 Liquid训练后变换器 AI 模型的方法，当时指出它正在使用 Liquid 神经网络 (LNN)，这是 CSAIL 的架构开发商，旨在使用于转换数据的人工“神经元”或节点更加高效和适应性更强。

与需要数千个神经元来执行复杂任务的传统深度学习模型不同，LNN 证明，结合创新的数学公式，更少的神经元就可以实现相同的结果。

Liquid AI 的新模型保留了这种适应性的核心优势，允许在推理过程中进行实时调整，而无需与传统模型相关的计算开销，高效处理多达 100 万个标记，同时将内存使用量降至最低。

Liquid 博客中的一张图表显示，LFM-3B 模型在推理内存占用方面优于谷歌的 Gemma-2、微软的 Phi-3 和 Meta 的 Llama-3.2 等流行模型，尤其是在标记长度扩展方面。

虽然其他模型在长上下文处理中内存使用量急剧增加，但 LFM-3B 的占用空间却明显较小，因此非常适合需要大量顺序数据处理的应用程序，例如文档分析或聊天机器人。

Liquid AI 已经建立了其基础模型，可以灵活地处理多种数据模式，包括音频、视频和文本。

凭借这种多模式能力，Liquid 旨在解决从金融服务到生物技术和消费电子产品等广泛的行业特定挑战。

接受发布会邀请并着眼于未来的改进

Liquid AI 表示正在优化其模型，以便部署在 NVIDIA、AMD、Apple、Qualcomm 和 Cerebras 的硬件上。

虽然模型仍处于预览阶段，但 Liquid AI 邀请早期采用者和开发人员测试模型并提供反馈。

Labonne 指出，虽然事情“并不完美”，但在此阶段收到的反馈将有助于团队改进他们的产品，为 2024 年 10 月 23 日在马萨诸塞州剑桥市麻省理工学院克雷斯基礼堂举行的全面发布会做准备。该公司将在此处接受现场出席该活动的人员的回复。

作为对透明度和科学进步的承诺的一部分，Liquid 表示将在产品发布会前发布一系列技术博客文章。

该公司还计划开展红队行动，鼓励用户测试其模型的极限，以改进未来的迭代。

随着 Liquid Foundation 模型的推出，Liquid AI 将自己定位为基础模型领域的关键参与者。通过将最先进的性能与前所未有的内存效率相结合，LFM 为传统的基于 Transformer 的模型提供了引人注目的替代方案。

原创文章，作者：wang, jinchang，如若转载，请注明出处：https://www.dian8dian.com/ma-sheng-li-gong-xue-yuan-yan-sheng-gong-si-liquid-shou-ci

Like (0)

wang, jinchang作者

0 0

微软研究人员提出了构建数据增强型 LLM 应用程序的框架

Previous 2024年10月3日下午12:00

这款开源 AI 工具仅用一天时间就开发完成，即将用于 Google 的 NotebookLM

Next 2024年10月3日下午2:00

AI前沿

ElevenLabs推出新功能：作者可在平台上自创并发布有声书‌

近期，ElevenLabs宣布了一项重大更新，允许作者在其平台上直接创建并发布有声书。这一功能为众多内容创作者提供了一个全新的发布渠道，使得他们能够更加便捷地将文字作品转化为音频形…

王浩然
2025年2月28日
000
AI前沿

Fastn 使用 AI 代理促进复杂应用程序开发的数据集成

在数字化转型时代，可组合性或模块化组件的使用已成为新领域。许多企业正在寻求这种架构来开发与其技术堆栈相关的复杂系统。然而，将这样的系统付诸实践也相当困难，尤其是由于数据孤岛和分散的…

王浩然
2024年9月9日
000
AI前沿

超越基准：Gemini 2.5 Pro或成最强推理模型

在人工智能领域，新模型的推出总是伴随着各种期待与争议。近期，谷歌悄然发布了其最新的旗舰语言模型——Gemini 2.5 Pro。与业界其他AI实验室喜欢将新模型冠以“世界最强”不同…

王浩然
5天前
000
AI前沿

孤星与Phison数据中心基础设施将登陆月球‌

近日，孤星（Lonestar）与Phison宣布了一项令人瞩目的计划：他们将携手将数据中心基础设施送往月球。这一创举预示着太空技术在商业应用领域的又一重大突破。 ‌一、计划背景‌ …

王浩然
2025年3月1日
000
AI前沿

Google Cloud 将搜索和 YouTube 背后的技术引入企业 AI 应用

随着生成式人工智能的不断进步，对于许多企业来说，一个简单的聊天机器人可能已不再足够。云计算超大规模提供商正在竞相建立自己的数据库和工具，以帮助企业快速高效地部署运营数据，从而构建…

点点
2024年10月4日
000
AI前沿

Ubitium 推出新型通用处理器，解决边缘 AI 等问题

随着企业不断探索不同的方式来优化其在数据中心和边缘处理不同工作负载的方式，一家名为Ubitium 的新兴创业公司脱颖而出，提出了一种有趣的、节省成本的计算方法：通用处理。在半导体…

王浩然
2024年11月25日
000
AI前沿

谷歌推出人工智能编码助手“Jules”，承诺自动修复错误并加快开发周期

谷歌周三发布了人工智能编码助手“ Jules ”，它可以在开发人员睡觉时自主修复软件错误并准备代码更改，这标志着该公司在核心编程任务自动化方面取得了重大进展。该实验性的人工智能代…

王浩然
2024年12月12日
000
AI前沿

Treehouse 使用人工智能帮助电工更便宜地安装电动汽车充电器和热泵等技术

美国正面临电工短缺的问题，根据美国劳工统计局的数据，未来十年该领域的空缺职位预计将以每年 11% 的速度增长。但由于美国未来的电工通常需要工作8,000 小时才能获得执照，因此短缺…

王浩然
2024年10月17日
000
AI前沿

Cursor洽谈融资，估值或达100亿美元：AI编程领域蓬勃发展‌

随着AI编程行业的持续升温，创新企业Cursor正积极洽谈新一轮融资，旨在将公司估值推高至惊人的100亿美元。Cursor以其强大的AI技术为核心，致力于革新软件开发流程，提升编码…

王浩然
2025年3月10日
000
AI前沿

GPT-4o：OpenAI推出原生图像生成功能，惊艳用户

引言‌ 自OpenAI在2024年5月发布其首款“全能”或多模态模型GPT-4o以来，近一年的时间里，这款模型始终保持着强大的竞争力。而今，OpenAI再次为ChatGPT的Plu…

王浩然
2025年3月27日
000
AI前沿

蝙蝠侠：阿卡姆影的VR版《黑暗骑士》现在有发布日期

我们已经知道它将于今年10月上映，但《蝙蝠侠：阿卡姆之影》——Rocksteady广受好评的超级英雄系列的有前途的VR版本——现在有一个合适的发布日期。它将于今年10月22日为Me…

点点
2024年9月26日
000
AI前沿

Basecamp Research 斥资 6000 万美元打造“生物学 GPT”

就在 OpenAI 和 Anthropic 等公司继续推广使用普通语言向人工智能代理询问问题、撰写提案或绘制图片的想法时，一家名为Basecamp Research 的伦敦初创公司…

王浩然
2024年10月10日
000
AI前沿

Nvidia 完成收购 AI 基础设施初创公司 Run:ai

Nvidia 已完成对以色列初创公司 Run:ai 的收购，后者致力于管理和优化 AI 硬件基础设施。作为合并的一部分，Run:ai 表示其软件（目前仅适用于 Nvidia 产品…

王浩然
2024年12月31日
000
AI前沿

开源模型上下文协议（MCP）重大更新：AI互操作性迈入新纪元

重写并翻译的文章内容 ‌开源模型上下文协议（MCP）重大更新：AI互操作性迈入新纪元‌ 在人工智能领域，一项旨在提升AI代理与工具、数据及接口间无缝交互能力的开源标准——模型上下文…

王浩然
2025年3月29日
000
AI前沿

未来博物馆设计新范式：对话创意总监布兰登·麦吉特里克

在迪拜的沙漠天际线上，一座银色的环形建筑如同来自科幻电影中的太空站，吸引着全球目光——这便是被誉为“2071年时间胶囊”的迪拜未来博物馆。作为该项目创意总监的布兰登·麦吉特里克，在…

王浩然
3天前
000
AI前沿

ChatGPT 获得屏幕共享和实时视频分析功能，可与 Gemini 2 相媲美

OpenAI终于在其先进的语音模式中添加了期待已久的视频和屏幕共享功能，允许用户以不同的方式与聊天机器人进行交互。目前，ChatGPT Teams、Plus 和 Pro 用户的。…

王浩然
2024年12月13日
000
AI前沿

谷歌地图正在获得由 Gemini 提供支持的全新 AI 功能

Google 地图即将推出由Google 的生成式 AI 模型Gemini提供支持的新功能。周四，该公司宣布即将推出更新，让美国的 Google 地图用户能够利用 AI 帮助他们找…

王浩然
2024年11月2日
000
AI前沿

“这是一个游戏规则的改变者”：Runway 发布新的 AI 面部表情动作捕捉功能 Act-One

自2022 年底首批模型首次亮相以来，人工智能视频在过去几年中取得了令人难以置信的进步，其真实感、分辨率、保真度、提示依从性（与用户输入的文本提示或视频描述的匹配程度）和数量都有所…

王浩然
2024年10月25日
000
AI前沿

谷歌：人工智能代理、多模式人工智能、企业搜索将在 2025 年占据主导地位

根据 Google Cloud 今天发布的新趋势报告，如果说 2024 年是实验的一年，那么 2025 年将真正成为企业扩展AI 的一年。值得注意的是，复杂的多模式人工智能将支…

王浩然
2024年12月18日
000
AI前沿

苹果推出新 iOS 开发者测试版，可使用 AI 去除图片中的物体

苹果在其最新的 iOS 18.1、iPadOS 18.1 和 macOS 15.1 开发者测试版中添加了更多 AI 功能，这次我们可以从照片中删除物体。这项名为“清理”的功能可让…

王浩然
2024年8月31日
000