微软的 GRIN-MoE AI 模型采用编码和数学，在关键基准测试中击败竞争对手

王浩然 • 2024年9月22日下午2:00 • AI前沿 • 147 views

微软推出了一种突破性的人工智能模型GRIN-MoE（梯度知情混合专家模型），旨在提高编码和数学等复杂任务的可扩展性和性能。该模型有望通过一次选择性地激活一小部分参数来重塑企业应用程序，使其既高效又强大。

GRIN-MoE 在研究论文“ GRIN：基于梯度的 MoE ”中进行了详细介绍，它使用了一种新颖的混合专家 (MoE) 架构方法。通过将任务分配给模型中的专门“专家”，GRIN 实现了稀疏计算，使其能够利用更少的资源，同时提供高端性能。该模型的关键创新在于使用SparseMixer-v2来估计专家路由的梯度，这种方法大大改进了传统做法。

研究人员解释道：“该模型避开了 MoE 架构的主要挑战之一：由于专家路由的离散性，传统的基于梯度的优化非常困难。”GRIN MoE 的架构拥有 16×38 亿个参数，在推理过程中仅激活 66 亿个参数，从而实现了计算效率和任务性能之间的平衡。

GRIN-MoE 在 AI 基准测试中超越竞争对手

在基准测试中，微软的 GRIN MoE 表现出色，超越了类似或更大规模的模型。它在MMLU（大规模多任务语言理解）基准测试中获得了 79.4 分，在数学问题解决能力测试GSM-8K中获得了 90.4 分。值得注意的是，该模型在编码任务基准测试HumanEval中获得了 74.4 分，超过了GPT-3.5-turbo等热门模型。

GRIN MoE 的表现优于Mixtral (8x7B)和Phi-3.5-MoE (16×3.8B)等同类模型，后两者在 MMLU 上的得分分别为 70.5 和 78.9。论文指出：“GRIN MoE 的表现优于 7B 密集模型，并且可与在相同数据上训练的 14B 密集模型的性能相媲美。”

对于寻求在 AI 应用中平衡效率和功能的企业来说，这种性能水平尤为重要。GRIN 无需专家并行或令牌丢弃（两种用于管理大型模型的常用技术）即可扩展，这使其成为可能没有基础设施来支持更大模型（如 OpenAI 的GPT-4o或 Meta 的LLaMA 3.1）的组织更易于访问的选择。

企业 AI：GRIN-MoE 如何提高编码和数学效率

GRIN MoE 的多功能性使其非常适合需要强大推理能力的行业，例如金融服务、医疗保健和制造业。其架构旨在处理内存和计算限制，从而解决企业面临的一个关键挑战。

该模型能够“在不进行专家并行或丢弃令牌的情况下扩展 MoE 训练”，从而在数据中心容量受限的环境中更有效地利用资源。此外，它在编码任务上的表现也是一大亮点。GRIN MoE 在 HumanEval 编码基准测试中获得了 74.4 分，展示了其加速 AI 在企业工作流程中自动编码、代码审查和调试等任务中的应用的潜力。

GRIN-MoE 在多语言和对话式 AI 方面面临挑战

尽管 GRIN MoE 的表现令人印象深刻，但它也有局限性。该模型主要针对英语任务进行了优化，这意味着当应用于训练数据中代表性不足的其他语言或方言时，其有效性可能会降低。研究承认，“GRIN MoE 主要针对英语文本进行训练”，这可能会给在多语言环境中运营的组织带来挑战。

此外，虽然 GRIN MoE 在推理密集型任务中表现出色，但它在对话上下文或自然语言处理任务中可能表现不佳。研究人员承认，“我们观察到该模型在自然语言任务中的表现并不理想”，这归因于该模型的训练重点是推理和编码能力。

GRIN-MoE 转变企业 AI 应用的潜力

微软的 GRIN-MoE 代表着人工智能技术的重大进步，尤其是对于企业应用而言。它能够高效扩展，同时在编码和数学任务中保持卓越的性能，使其成为希望在不过度占用计算资源的情况下集成人工智能的企业的宝贵工具。

研究团队解释道：“该模型旨在加速语言和多模态模型的研究，以作为生成 AI 功能的基础。”随着 AI 在商业创新中发挥越来越重要的作用，GRIN MoE 等模型很可能在塑造企业 AI 应用的未来方面发挥重要作用。

随着微软不断突破人工智能研究的界限，GRIN-MoE 证明了该公司致力于提供满足各行业技术决策者不断变化的需求的尖端解决方案。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/wei-ruan-de-grinmoe-ai-mo-xing-cai-yong-bian-ma-he-shu-xue

AI ChatGPT GRIN GRIN-MoE LLaMA Meta MMLU OpenAI 人工智能微软

Like (0)

王浩然作者

0 0

针对人工智能模型的对抗性攻击日益增多：您现在应该怎么做？

Previous 2024年9月22日

为了在数字无障碍方面取得真正的进步，我们需要进行范式转变

Next 2024年9月22日

AI前沿

人工智能深度伪造如何威胁选举公正性——以及如何应对

竞选广告已经变得有点混乱和有争议。现在想象一下，你被一则竞选广告所吸引，其中一位候选人表达了强有力的立场，影响了你的投票——而这则广告甚至不是真的。这是一个深度伪造的广告。这不…

点点
2024年10月21日
000
AI前沿

微软推出 10 个新 AI 代理，增强其企业自动化领先地位

微软在 Ignite 2024 大会上宣布，10 个自主 AI 代理现已可供企业使用，引起轰动。微软有效地宣布，AI 代理已准备好迎接黄金时段——实现其他人尚未实现的目标。微软的…

王浩然
2024年11月27日
000
AI前沿

高通推出用于个人电脑、汽车、智能家居和企业的人工智能芯片

高通在2025 年消费电子展 (CES 2025)上发布了针对个人电脑、汽车、智能家居和企业的人工智能技术和合作。在拉斯维加斯举行的大型科技贸易展上，高通技术公司展示了如何利用其…

王浩然
2025年1月7日
000
AI前沿

微软声称其新工具可以纠正人工智能幻觉，但专家建议谨慎行事

人工智能是出了名的骗子，但微软现在表示已经解决了这个问题。可以理解的是，这会引起一些人的关注——而且有理由持怀疑态度。微软今天发布了一项服务，名为 Correction，旨在自动…

王浩然
2024年9月25日
000
AI前沿

亚马逊据传成立全新自主智能AI团队‌

近期，有消息称全球电商巨头亚马逊正悄然布局人工智能领域，秘密组建了一个专注于自主智能技术的新团队。这一举动标志着亚马逊在AI赛道上的又一次重要发力，旨在通过技术创新推动公司业务的多…

王浩然
2025年3月6日
000
AI前沿

OpenAI 数据抓取大获全胜，Raw Story 版权诉讼被纽约法院驳回

纽约南区法院驳回了另类左倾在线新闻机构Raw Story Media, Inc. 和AlterNet Media, Inc. 针对 OpenAI提起的版权侵权诉讼，有效地驳回了有关…

王浩然
2024年11月9日
000
AI前沿

X 正在测试 AI 聊天机器人 Grok 的免费版本

社交网络 X 迄今为止将其 AI 聊天机器人 Grok（由埃隆·马斯克的另一家公司 xAI 开发）限制给高级付费用户使用。不过，该平台似乎正准备向免费用户开放聊天机器人。上周末，…

王浩然
2024年11月12日
000
AI前沿

Cohere推出高效多语言Command A模型，瞄准全球企业市场

加拿大AI初创公司Cohere近期发布了其最新款面向企业应用的生成式AI模型——Command A。这款模型以其卓越的多语言能力、高效能以及仅需两台GPU即可运行的特性，迅速吸引了…

王浩然
2025年3月17日
000
AI前沿

特朗普的胜利将使埃隆·马斯克和 xAI 受益

共和党政治家、商人唐纳德·J·特朗普 (Donald J. Trump)以强势政治回归赢得了 2024 年美国总统大选，尽管各种选前民意调查显示，他与对手卡马拉·哈里斯 (Kama…

王浩然
2024年11月9日
000
AI前沿

YouTube Shorts 将整合谷歌的 AI 视频模型 Veo

YouTube 周三上午举办的 Made On YouTube 活动的主要亮点是人工智能。该公司宣布，将把 Google DeepMind 的 AI 视频生成模型Veo整合到 Yo…

王浩然
2024年9月19日
000
AI前沿

突破数据瓶颈：Salesforce 的 ProVision 利用图像场景图加速多模式 AI 训练

随着世界各地的企业加倍投入 AI 项目，高质量训练数据的可用性已成为一个主要瓶颈。虽然公共网络作为数据源已基本耗尽，但 OpenAI 和 Google 等主要参与者正在确保独家合作…

王浩然
2025年1月11日
000
AI前沿

用于训练 Stable Diffusion 的数据集背后的组织声称已经删除了 CSAM

德国研究机构LAION创建了用于训练Stable Diffusion和其他生成式 AI 模型的数据，该机构发布了一个新数据集，声称该数据集“已彻底清除已知的疑似儿童性虐待材料 (C…

王浩然
2024年8月31日
000
AI前沿

Squirrel AI Agent 旨在拯救濒临灭绝的物种

为了保护英国日益减少的红松鼠数量，环保人士已经采用一种新的人工智能工具来识别、追踪和治疗松鼠。自 19 世纪 70 年代引入灰松鼠以来，红松鼠数量急剧下降，从 350 万只减少到…

王浩然
2024年12月2日
000
AI前沿

Workday 收购人工智能文档平台 Evisort

Workday周二宣布，将收购人工智能合同管理平台Evisort ，收购金额未公开。 Workday集团总经理 Terrance Wampler 在一份声明中表示，Evisort …

王浩然
2024年9月19日
000
AI前沿

NVIDIA推出Llama Nemotron开放推理模型，加速自主AI发展

在人工智能（AI）领域，NVIDIA始终走在创新的前沿。近日，在NVIDIA GTC大会上，这家AI巨头宣布了一系列硬件和软件更新，其中最为引人注目的莫过于其全新推出的Llama …

王浩然
2025年3月22日
000
AI前沿

Anthropic 在最新的 Claude AI 更新中推出可视化 PDF 分析

在文档处理方面取得的一项重大进步中，Anthropic为其 Claude 3.5 Sonnet 模型推出了新的 PDF 支持功能。这一发展标志着在弥合传统文档格式与 AI 分析之间…

点点
2024年11月4日
000
AI前沿

AI 能否利用安全检查来破坏用户？是的，但效果不是很好 — 目前来说

人工智能公司声称已经实施了严格的安全检查，以确保模型不会说或做奇怪、非法或不安全的事情。但如果模型能够逃避这些检查，并出于某种原因试图破坏或误导用户，该怎么办？据 Anthropi…

点点
2024年10月21日
000
AI前沿

提高生产力：在组织中实施人工智能工具的实用指南

从销售和客户服务到内容创作，将生成式人工智能融入现代工作场所无疑是一种变革。它引发的连锁反应从根本上改变了各行业的角色、任务和战略重点。生成式人工智能不仅提高了生产力，还改变了我们…

王浩然
2024年12月11日
000
AI前沿

为什么人工智能开发人员对 Claude 3.5 的计算机使用功能赞不绝口

Anthropic 刚刚发布了 Claude 3.5，这是其 LLM 系列的一个功能强大的新版本。虽然这个模型带来了改进的推理和编码技能，但真正令人兴奋的是围绕一项名为“计算机使用…

点点
2024年11月5日
000
AI前沿

Meta在Instagram上测试AI生成评论

在社交媒体巨头Meta的不断探索中，人工智能（AI）的应用正逐渐渗透到其各个产品之中。近日，有消息称Meta正在其旗下热门图片和视频分享平台Instagram上测试AI生成的评论功…

王浩然
2025年3月25日
000