Liquid AI 的新 STAR 模型架构比 Transformer 效率更高

王浩然 • 2024年12月3日下午9:00 • AI前沿 • 108 views

随着有关顶级人工智能公司在开发更新、更强大的大型语言模型 (LLM) 方面面临困难的谣言和报道不断流传，人们的注意力越来越多地转向“Transformer”的替代架构——这是支撑当前生成式人工智能热潮的大部分技术，由谷歌研究人员在 2017 年的开创性论文“注意力就是你所需要的一切”中提出。

正如该论文及后续文章所描述的，Transformer 是一种处理序列数据（例如文本或时间序列信息）的深度学习神经网络架构。

现在，麻省理工学院诞生的初创公司 Liquid AI推出了 STAR（定制架构合成），这是一个旨在自动生成和优化 AI 模型架构的创新框架。

STAR 框架利用进化算法和数字编码系统来解决深度学习模型中平衡质量和效率的复杂挑战。

根据 Liquid AI 的研究团队（包括 Armin W. Thomas、Rom Parnichkun、Alexander Amini、Stefano Massaroli 和 Michael Poli）的说法，STAR 的方法代表着传统建筑设计方法的转变。

STAR 不依赖于手动调整或预定义模板，而是使用分层编码技术（称为“STAR 基因组”）来探索潜在架构的广阔设计空间。

这些基因组支持重组和突变等迭代优化过程，使得 STAR 能够合成和改进针对特定指标和硬件要求的架构。

与传统 ML Transformers 相比，缓存大小减少了 90%

Liquid AI 对 STAR 的最初关注点是自回归语言建模，而传统的 Transformer 架构长期以来一直占据主导地位。

在研究期间进行的测试中，Liquid AI 研究团队展示了 STAR 生成架构的能力，其性能始终优于高度优化的 Transformer++ 和混合模型。

例如，在优化质量和缓存大小时，STAR 演化架构与混合模型相比实现了高达 37% 的缓存大小减少，与 Transformers 相比则减少了 90%。尽管效率有所提高，但 STAR 生成的模型仍保持甚至超过了同类模型的预测性能。

类似地，在优化模型质量和大小时，STAR 将参数数量减少了多达 13%，同时仍提高了标准基准测试的性能。

该研究还强调了 STAR 扩展其设计的能力。STAR 演化模型的参数从 1.25 亿扩展到 10 亿，其结果与现有的 Transformer++ 和混合模型相当甚至更优，同时显著降低了推理缓存要求。

重新构建人工智能模型架构

Liquid AI 表示，STAR 植根于一种融合了动力系统、信号处理和数值线性代数原理的设计理论。

这种基础方法使团队能够为计算单元开发一个多功能的搜索空间，涵盖注意力机制、递归和卷积等组件。

STAR 的一大特色是其模块化，允许框架跨多个层次对架构进行编码和优化。此功能可深入了解重复出现的设计主题，并使研究人员能够确定架构组件的有效组合。

STAR 的下一步计划是什么？

STAR 能够合成高效、高性能的架构，其潜在应用范围远超语言建模。Liquid AI 设想利用该框架应对各个领域的挑战，在这些领域中，质量和计算效率之间的权衡至关重要。

虽然 Liquid AI 尚未公布具体的商业部署或定价计划，但研究结果标志着自动化架构设计领域的重大进步。对于希望优化 AI 系统的研究人员和开发人员来说，STAR 可能是一个强大的工具，可以突破模型性能和效率的界限。

Liquid AI 以其开放的研究方法，在同行评审的论文中发表了 STAR 的全部细节，鼓励合作和进一步创新。随着人工智能领域的不断发展，像 STAR 这样的框架将在塑造下一代智能系统中发挥关键作用。STAR 甚至可能预示着新的后 Transformer 架构热潮的诞生——这对机器学习和人工智能研究界来说是一个受欢迎的冬季节日礼物。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/liquid-ai-de-xin-star-mo-xing-jia-gou-bi-transformer-xiao

Like (0)

王浩然作者

0 0

Nous Research 正在使用分布在互联网上的机器训练人工智能模型

Previous 2024年12月3日

AWS 为 Bedrock 带来多代理编排功能

Next 2024年12月4日

AI前沿

开源模型上下文协议（MCP）重大更新：AI互操作性迈入新纪元

重写并翻译的文章内容 ‌开源模型上下文协议（MCP）重大更新：AI互操作性迈入新纪元‌ 在人工智能领域，一项旨在提升AI代理与工具、数据及接口间无缝交互能力的开源标准——模型上下文…

王浩然
2025年3月29日
000
AI前沿

OpenAI的GPT 4.5模型向更多ChatGPT用户开放‌

随着人工智能技术的不断进步，OpenAI再次引领行业潮流，宣布将其最新的GPT 4.5模型向更多的ChatGPT用户开放。这一消息无疑为人工智能爱好者及从业者带来了振奋人心的消息，…

王浩然
2025年3月8日
000
AI前沿

OpenAI 的先进“草莓计划”模型终于问世

经过数月的猜测和期待，OpenAI 发布了其高级推理模型Project Strawberry的生产版本，并将其更名为“o1”。它还附带一个“迷你”版本（就像 GPT-4o 一样），…

王浩然
2024年9月15日
000
AI前沿

引导人工智能投资：平衡创新与可持续性的 5 种策略

随着人工智能领域的快速发展，企业和技术领导者在平衡当前人工智能投资与长期可持续发展目标方面面临着越来越大的挑战。在急于采用人工智能的过程中，许多企业忽视了这种平衡，优先考虑短期收益…

点点
2024年10月5日
000
AI前沿

我让一群AI助手填写了NCAA疯狂三月锦标赛预测表，结果令人惊讶

想象一下，如果一支由200人组成的大型团队能够进行深思熟虑的实时对话，他们高效地集思广益、分享知识、辩论备选方案，并迅速达成共识，得出AI优化的解决方案。这真的可能吗？如果可能的话…

王浩然
2025年4月2日
000
AI前沿

AI 是销售的未来吗？Salesforce 的新模式可能会改变游戏规则

Salesforce是领先的云端客户关系管理软件提供商，它推出了两种先进的人工智能模型——xGen-Sales和xLAM，旨在帮助企业提高自动化程度和效率。今天发布的这一消息反映了…

王浩然
2024年9月9日
000
AI前沿

Google Cloud 将搜索和 YouTube 背后的技术引入企业 AI 应用

随着生成式人工智能的不断进步，对于许多企业来说，一个简单的聊天机器人可能已不再足够。云计算超大规模提供商正在竞相建立自己的数据库和工具，以帮助企业快速高效地部署运营数据，从而构建…

点点
2024年10月4日
000
AI前沿

Chain of Experts（COE）：低成本高效能的大型语言模型框架

引言在人工智能（AI）领域，大型语言模型（LLM）的应用日益广泛，但高昂的成本和复杂的部署流程一直是阻碍其普及的关键因素。近日，一种名为Chain of Experts（COE）…

王浩然
2025年3月19日
000
AI前沿

OpenAI 和 Anthropic 同意将模型送交美国政府进行安全评估

OpenAI和Anthropic与美国国家标准与技术研究所（NIST）下属的人工智能安全研究所签署协议，合作开展人工智能模型安全研究、测试和评估。该协议为人工智能安全…

王浩然
2024年9月2日
000
AI前沿

Pinterest 向广告商推出用于产品图像的 genAI 工具

图片灵感和购物网站Pinterest是最新一家向广告商推出生成式 AI 产品的科技公司，此前谷歌、亚马逊等公司也采取了类似举措。在周二的Pinterest Presents广告商活…

王浩然
2024年10月2日
000
AI前沿

用AI找客户，半年怒赚200万美元，AI销售是Agent的下一站

继搜索、抄写、写作、编程之后，销售成为AI Agent的下一个重要落地场景。根据字节跳动推出的《生成式AI商业落地白皮书》，经过590名企业中高层的票选，在“十大生成式AI最有价…

点点
2024年9月12日
000
AI前沿

这些 Planetly 前员工对离职感到不满，他们正在利用人工智能来完善碳核算

初创公司员工通常会继续创办有趣的企业，并将从零开始创办公司时获得的经验作为新工作的基础。但并非所有这些经验都是积极的，有时，不尽人意的退出比其他任何事情都更能激发创始人的热情。对…

王浩然
2024年10月10日
000
AI前沿

反对人工智能艺术的案例

无论生成式人工智能变得多么强大，作家特德姜说它都永远无法创造出真正的艺术。姜是当今最受推崇的科幻小说作家之一，最著名的作品是中篇小说《你一生的故事》（改编成电影《降临》）。但他也…

王浩然
2024年9月3日
000
AI前沿

TikTok 所有者字节跳动为电子阅读器疯狂的人工智能助手提供支持

Kindle 的一款热门电子阅读器竞争对手引发的轩然大波表明，美国产品中使用中国人工智能模型可能会在不知不觉中传播中国的宣传。根据 Reddit 上分享的有关该人工智能的截图，T…

王浩然
2025年1月16日
000
AI前沿

人工智能真的能与人类数据科学家竞争吗？OpenAI的新基准对它进行了测试

OpenAI推出了一种测量机器学习工程中人工智能能力的新工具。这个被称为MLE-bench的基准，通过来自机器学习竞赛的流行平台Kaggle的75场真实世界数据科学比赛来挑战人工智…

点点
2024年10月14日
000
AI前沿

苹果 iOS 18.2 公测版发布，带来全新 AI 功能，但仍有部分用户仍在等待

苹果已向其公开测试版用户发布了其最新移动操作系统 iOS 18.2 的 AI 版本。此次更新包括新功能，例如名为 Genmoji 的 AI 表情符号生成器应用程序、Image Pl…

王浩然
2024年11月8日
000
AI前沿

探讨人工智能对社会影响的非小说类书籍

人工智能 (AI) 是执行复杂计算的代码或技术，涵盖模拟、数据处理和分析。人工智能的重要性日益凸显，已成为医疗保健、教育和金融等许多行业的变革者。事实证明，人工智能的使用可使许多…

点点
2024年9月18日
000
AI前沿

Cloudflare 的新市场将允许网站向 AI 机器人收取抓取费用

Cloudflare周一宣布计划在明年推出一个市场，网站所有者可以向 AI 模型提供商出售抓取其网站内容的权限。该市场是 Cloudflare 首席执行官 Matthew Prin…

王浩然
2024年9月24日
000
AI前沿

前 iRobot 创始人打造人工智能家用机器人

iRobot 的前首席执行官兼联合创始人与另外两名 iRobot 校友合作创建了一家与健康和保健相关的新机器人初创公司。九个月前，科林·安格尔 (Colin Angle) 从 i…

王浩然
2024年12月2日
000
AI前沿

随着人工智能的进步，这对用户生成内容意味着什么？

创作者经济的崛起是互联网领域最具颠覆性的力量之一，为独立作家、艺术家、音乐家、播客、YouTube 博主和社交媒体影响者直接与观众联系并从中赚钱铺平了道路。创作者纷纷…

AI News
2024年8月28日
000