可区分自适应合并正在加速企业的 SLM

王浩然 • 2024年10月25日下午6:00 • AI前沿 • 90 views

模型合并是一个基本的人工智能过程，使组织能够重复使用和组合现有的训练模型来实现特定目标。

如今，企业可以使用各种方法进行模型合并，但许多方法都很复杂。一种称为可微分自适应合并(DAM) 的新方法可能是答案，它为当前模型合并的挑战提供了解决方案。DAM 提供了一种创新的解决方案，可以合并 AI 模型，同时潜在地降低计算成本。

Arcee AI是一家专注于高效、专业化小型语言模型的公司，在 DAM 研究领域处于领先地位。该公司于 2024 年 5 月获得融资，从提供模型训练工具发展成为一个成熟的模型交付平台，提供开源和商业产品。

DAM 如何为模型合并开辟新道路

合并可以帮助企业结合专门针对不同领域的模型，从而创建一个能够同时在两个领域发挥作用的新模型。

结构化数据和数据库的合并数据的基本概念很好理解。然而，合并模型比合并结构化数据更抽象，因为模型的内部表示不太容易解释。

Arcee AI 研究工程师、DAM 研究作者之一 Thomas Gauthier-Caron 向 VentureBeat 解释说，传统的模型合并通常依赖于进化算法。这种方法可能很慢且不可预测。DAM 通过利用成熟的机器学习 (ML) 优化技术采取了不同的方法。

Gauthier-Caron 解释说，DAM 旨在解决模型合并过程中的复杂性问题。该公司现有的库 MergeKit 对于合并不同的模型很有用，但由于涉及各种方法和参数，因此很复杂。

“我们在想，我们能否让这个过程变得更容易一些，能否让机器帮我们进行优化，而不是让我们费尽心思去调整所有这些参数？”Gauthier-Caron 说道。

DAM 不会直接混合模型，而是根据每个模型的贡献程度进行调整。DAM 对模型权重矩阵中的每一列使用缩放系数。它通过测试组合模型的表现、将输出与原始模型进行比较，然后调整系数以获得更好的结果，自动学习这些系数的最佳设置。

根据研究，DAM 的表现可与进化合并、DARE-TIES 和Model Soups等现有方法相媲美，甚至更胜一筹。Gauthier-Caron 表示，该技术与现有方法有很大不同。他将进化合并描述为一个缓慢的过程，在开始时并不完全清楚结果会有多好，或者合并过程应该持续多长时间。

合并不是专家混合的方法

数据科学家以多种不同的方式组合模型。其中一种越来越流行的方法是专家混合法 (MoE)。

Gauthier-Caron 强调，与 DAM 的模型融合与 MoE 截然不同。他解释说，MoE 是一种可用于训练语言模型的特定架构。

模型合并的基本概念是从组织已经训练好的模型开始。训练这些模型通常需要花费大量资金，因此工程师的目标是重复使用现有的训练模型。

DAM 对企业 AI 的实际应用和优势

DAM 的主要优势之一是它能够有效地组合专门的模型。

Gauthier-Caron 举的一个例子是，如果某个组织想将日语模型与数学模型结合起来。这种结合的目标是创建一个擅长日语数学的模型，而无需重新训练。这是 DAM 可能擅长的一个领域。

该技术对于企业采用生成式人工智能尤其重要，因为效率和成本考虑至关重要。帮助创造更高效、更低成本的运营方式是 Arcee 的总体目标。这就是为什么 DAM 研究对公司及其最终用户都很重要。

Arcee AI 联合创始人兼首席执行官马克·麦克奎德表示：“企业采用新一代人工智能归结为效率、可用性、可扩展性和成本。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/ke-qu-fen-zi-shi-ying-he-bing-zheng-zai-jia-su-qi-ye-de-slm

AI DAM MoE SLM 人工智能可微分自适应合并小型语言模型

Like (0)

王浩然作者

0 0

Nvidia 首席执行官吹捧印度在自主 AI 方面取得的进步，并培训了超过 10 万名 AI 开发人员

Previous 2024年10月25日

OpenAI 研究人员开发新模型，将媒体生成速度提高 50 倍

Next 2024年10月25日

AI前沿

DeepSeek 有助于加速威胁检测，但同时也引发了国家安全担忧

DeepSeek 及其 R1 模型不会浪费任何时间来实时重写网络安全 AI 规则，从初创公司到企业提供商等所有公司都在本月试行集成到他们的新模型中。 R1 是在中国开发的，基于纯强…

王浩然
2025年2月3日
000
AI前沿

据报道，前 OpenAI 首席技术官 Mira Murati 正在为一家新的 AI 初创公司筹集资金

据路透社报道，上个月宣布离职的OpenAI 首席技术官米拉·穆拉蒂 (Mira Murati)正在为一家新的人工智能初创公司筹集风险投资资金。据报道，这家初创公司将专注于构建基于…

王浩然
2024年10月20日
000
AI前沿

欧盟人工智能法案：通用人工智能指导草案为大型人工智能遵守规定迈出了第一步

根据欧盟《人工智能法案》，适用于通用人工智能模型提供商的行为准则初稿已经发布，同时还发布了反馈邀请——反馈截止日期为 11 月 28 日——起草过程将持续到明年，正式的合规期限将在…

王浩然
2024年11月16日
000
AI前沿

老美都要在太空建数据中心了，成本大降95%，英伟达强力支持

建数据中心，可能是各家AI大厂最重要的事情之一。这两年，科技巨头的年化资本支出，从1380亿美元同比增长到2290亿美元，这多花的910亿美元，有一大部分花在了AI数据中心建设上…

点点
2024年9月16日
000
AI前沿

Lambda 推出“推理即服务” API，宣称成本为人工智能行业最低

Lambda是一家成立 12 年的旧金山公司，以向机器学习研究人员以及 AI 模型构建者和训练人员按需提供图形处理单元 (GPU) 而闻名。但今天，该公司推出了Lambda In…

王浩然
2024年12月13日
000
AI前沿

Emily Popson，CallRail 增长营销副总裁 – 访谈系列

Emily Popson 是CallRail的增长营销副总裁，负责领导需求生成、网站优化、客户营销和内容营销团队。Popson 自己之前也是一家小企业主，她热衷于让即使是最小的团…

点点
2024年10月17日
000
AI前沿

OpenAI 的 DevDay 为 AI 应用开发者带来实时 API 和其他福利

对于 OpenAI 来说，这是动荡的一周，高管离职和重大融资进展频频，但这家初创公司又回到了正轨，试图说服开发人员在 2024 年 DevDay 上利用其 AI 模型构建工具。该公…

王浩然
2024年10月2日
000
AI前沿

解释：生成式人工智能对环境的影响

强大的生成式人工智能模型的快速开发和部署带来了环境后果，包括增加电力需求和水消耗。在由两部分组成的系列文章中，麻省理工学院新闻探讨了生成式人工智能对环境的影响。在本文…

王浩然
2025年1月27日
000
AI前沿

Fal.Con 2024：CrowdStrike 推出弹性设计框架以加强全球网络安全

CrowdStrike首席执行官乔治·库尔茨 (George Kurtz) 在Fal.Con 2024开幕式上向客户和合作伙伴表示感谢，他表示，如果没有他们的帮助，公司不可能度过今…

王浩然
2024年9月22日
000
AI前沿

Sakana AI 获 1 亿美元融资，挑战 OpenAI、Anthropic 成为“世界级”人工智能实验室

人工智能热潮席卷全球。中国阿里巴巴凭借 Qwen2-VL登上新闻头条仅几天后，由前谷歌研究员 David Ha 和 Llion Jones 以及前外交官 Ren Ito 创立的日本…

王浩然
2024年9月5日
000
AI前沿

意想不到的后果：美国大选结果预示着人工智能将不计后果地发展

虽然 2024 年美国大选的焦点是经济和移民等传统问题，但它对人工智能政策的悄无声息的影响可能会更具变革性。没有一个关于人工智能的辩论问题或重大竞选承诺，选民们无意中将天平倾向加速…

王浩然
2024年12月23日
000
AI前沿

网站无障碍性现状堪忧：监管加强下多数网站仍未达标‌

在当今这个数字化时代，互联网已经成为人们获取信息、交流互动和进行交易的关键平台。然而，随着各国政府对数字无障碍性的关注度日益提升，一系列旨在保障残障人士等特殊群体网络权益的法规相继…

王浩然
2025年3月29日
000
AI前沿

ChatGPT更聪明了：OpenAI引入内部数据引用功能‌

在人工智能领域，ChatGPT作为一款大型语言模型（LLM），自推出以来就以其强大的自然语言处理能力和广泛的应用场景而备受瞩目。为了进一步提升ChatGPT的智能化水平，OpenA…

王浩然
2025年3月31日
000
AI前沿

Augmented Intelligence 声称其 AI 可以让聊天机器人更有用

OpenAI 的 o1 等 AI 模型的核心是神经网络架构，而这种架构的替代方案正大行其道。这种方案被称为符号 AI，它使用与特定任务（如重写文本行）相关的规则来解决更大的问题。 …

wang, jinchang
2024年10月2日
000
AI前沿

加州禁止政治广告中使用 AI Deepfat

就在 11 月大选前几周，加州州长加文·纽瑟姆 (Gavin Newsom) 签署了三项法案，禁止在竞选广告中使用深度伪造和其他误导性的数字创建或修改内容。纽森说：“…

点点
2024年9月21日
000
AI前沿

如何利用冷硬数据科学来利用人工智能

有时很难区分技术的现实与每天轰炸我们收件箱的炒作和营销信息。例如，在过去五年里，我们可能听到了太多关于元宇宙、区块链和虚拟现实的信息。目前，我们正处于一场关于被滥用的术语“人工智能…

点点
2024年10月1日
000
AI前沿

Sam Altman 承认 OpenAI 在开源辩论中“站在了历史的错误一边”

OpenAI 首席执行官萨姆·奥特曼 (Sam Altman ) 周五做出惊人承认，他的公司在开源人工智能问题上“站在了历史的错误一边”，这表明，随着来自中国的竞争加剧和高效开放模…

王浩然
2025年2月2日
000
AI前沿

Jony Ive 正在与 OpenAI 合作创办一家 AI 设备初创公司

五年前离开苹果全职职位的传奇设计师乔纳森·艾维 (Jony Ive)正在与 OpenAI 及其首席执行官萨姆·奥特曼 (Sam Altman) 合作创办一家新的创业公司。此次合作…

点点
2024年9月23日
000
AI前沿

DuckDuckGo进一步拥抱GenAI，其AI聊天界面正式脱离测试阶段‌

在人工智能技术日新月异的今天，搜索引擎巨头DuckDuckGo宣布其基于GenAI（通用人工智能）技术打造的聊天界面已正式脱离测试阶段，迈向全面应用。这一重大进展标志着DuckDu…

王浩然
2025年3月7日
000
AI前沿

AI对抗AI：企业自动化网络安全的六种方式以应对AI驱动的攻击

引言在数字化时代，网络安全威胁日益复杂且多变，其中AI驱动的攻击尤为引人注目。为了应对这一挑战，企业正积极采用AI技术来增强自身的防御能力。本文将探讨企业如何通过六种方式自动化网…

王浩然
2025年3月19日
000