ServiceNow 开源 Fast-LLM，旨在帮助企业以 20% 的速度训练 AI 模型

王浩然 • 2024年12月11日下午9:00 • AI前沿 • 112 views

训练大型语言模型 (LLM) 是企业最昂贵且最耗时的练习之一。ServiceNow 今天发布的新开源模型可能会带来巨大的改变，有望将训练速度提高 20%，从而为企业节省时间和金钱。

Fast-LLM 技术已在公司内部开发，帮助 ServiceNow 加速其自身的 LLM 培训工作。Fast-LLM 帮助培训了 ServiceNow于今年早些时候发布的StarCoder 2 LLM。StarCoder本身也是一个开源项目，它受益于 Hugging Face、Nvidia 和其他公司的贡献。ServiceNow 还使用 Fast-LLM 从现有模型中进行大规模、万亿令牌的持续预训练，以及微调作业。

由于它是一项开源技术，任何人都可以使用 Fast-LLM 来帮助加速 AI 训练，包括微调操作。其目的是让它可以作为现有 AI 训练管道的替代品，只需进行最少的配置更改。这个新的开源项目旨在通过一系列数据并行和内存管理创新，与包括开源 PyTorch在内的常用 AI 训练框架区分开来。

ServiceNow 研究副总裁 Nicolas Chapados说：“当你处理价值数亿美元的计算集群和耗资数百万美元的训练运行时，20% 可以在金钱、时间以及总体二氧化碳排放量方面节省大量成本。”

使 Fast-LLM 能够加速 AI 训练的创新

人工智能行业非常了解更有效地训练人工智能的挑战。有一个小组专门讨论这个问题，详细介绍了扩展基础设施的选项。

Fast-LLM 方法不是关于扩展基础设施；而是关于优化现有培训资源的效率。

Chapados 解释说：“我们仔细研究了训练大型语言模型所需的所有操作，尤其是基于 Transformer 的大型语言模型。我们仔细优化了将计算分配到 GPU 中各个核心的方式，以及模型本身使用内存的方式。”

Fast-LLM 的竞争优势源于两项主要创新，这两项创新有助于使其脱颖而出。第一个是 Fast-LLM 的计算排序方法，它定义了 AI 训练运行中计算发生的顺序。Chapados 解释说，Fast-LLM 使用了一种新技术，ServiceNow 称之为“广度优先管道并行”。

Chapados 表示：“这是围绕计算调度方式的根本科学创新，包括单个 GPU 内部和多个 GPU 之间的调度。”

第二项重大创新涉及内存管理。在大型训练操作中，内存会随着时间的推移而碎片化。这意味着随着训练的进行，内存会随着时间的推移而破碎成碎片。碎片化会导致内存效率低下，从而阻止训练集群正确使用所有可用内存。

Chapados 表示：“我们在设计 Fast LLM 时非常谨慎，几乎完全消除了训练大型语言模型时出现的内存碎片问题。”

企业如何使用 Fast-LLM 来加速培训

Fast-LLM 框架旨在保持企业级功能的同时提高可访问性。它可以作为 PyTorch 环境的替代品，并与现有的分布式训练设置集成。

“对于任何模型开发人员或研究人员来说，它只是一个简单的配置文件，可让您指定所有重要的架构细节，”Chapados 说。

更快地运行训练操作具有多种好处，可以让企业进行更多实验。

“它降低了大规模训练的风险，”Chapados 说。“它让用户、研究人员和模型构建者更有雄心去进行更大规模的训练，因为他们不再担心成本太高了。”

展望未来，我们期望 Fast-LLM 作为一个开源项目能够更快地扩展，并受益于外部贡献。ServiceNow 已经通过 StarCoder 成功采用了这种方法。

“我们的目标是在使用这个框架方面非常透明，并对社区的贡献做出回应，”Chapados 说。“我们仍在收集早期反馈，了解人们喜欢什么，他们能用它做什么，我们的目标是真正扩大这个框架的规模。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/servicenow-kai-yuan-fastllm-zhi-zai-bang-zhu-qi-ye-yi-20-de

Like (0)

王浩然作者

0 0

新加坡初创公司 Sapient 凭借全新模型架构加入全球企业 AI 竞赛

Previous 2024年12月11日

Google Gemini 2.0：这会是真正自主人工智能的开始吗？

Next 2024年12月12日

AI前沿

iPhone 16 今日发布，但并未配备最受关注的功能：Apple Intelligence

iPhone 16将于本周五正式发售。但对于最早的采用者来说，这款手机在发售时就已经做出了根本性的妥协。简而言之，这不是他们承诺的 iPhone 16。苹果首席执行官蒂姆·库克表…

王浩然
2024年9月21日
000
AI前沿

这款人工智能发明机器可自动实现“尤里卡时刻”

在瑞士洛桑郊外，一间贴满专利图纸的会议室里，伊奥尼斯·伊里德斯 (Ioannis Ierides)面临着一个典型的销售挑战：在客户注意力集中的短暂时间内展示其产品的优势。伊里德斯是…

王浩然
2024年10月20日
000
AI前沿

消费者报告揭示：热门语音克隆工具缺乏安全保障‌

近日，一份消费者报告揭示了当前市场上热门语音克隆工具存在的安全隐患。这些工具虽然为用户提供了便捷的语音复制功能，但在安全保障方面却存在显著不足。报告中指出，多款主流语音克隆工具在…

王浩然
2025年3月12日
000
AI前沿

Google NotebookLM不断发展：IT 领导者需要了解其企业应用程序

谷歌的研究工具NotebookLM最近因一项新功能而引起轰动，该功能可让用户生成听起来很像播客的内容。不过，尽管该公司一直在添加新功能，但它也在企业领域看到了越来越多的用例。 N…

王浩然
2024年9月20日
000
AI前沿

通用人工智能：安永对短期未来的展望

通用人工智能（AGI）是一种人工智能，它有望通过匹配或超越人类的认知能力来颠覆多个行业并解决世界上一些最大的问题。尽管这一概念源自科幻小说，但 AGI 可能比我们想象的更接近现实…

王浩然
2025年1月26日
000
AI前沿

从 AI 代理到企业预算，20 家风险投资公司分享了他们对 2025 年企业技术的预测

尽管人工智能被一些人誉为工业革命以来最大的技术突破，但企业——可以说是该技术最大的潜在客户群——采用人工智能的速度却很慢。尽管一些投资者预测 2024 年将是企业开始采用更多 A…

王浩然
2024年12月31日
000
AI前沿

数千名创意人员签署请愿书，反对人工智能数据抓取

演员凯文·贝肯、小说家石黑一雄、音乐家罗伯特·史密斯、记者兼历史学家西德尼·布卢门撒尔有什么共同点？他们都是 11,500 名签署请愿书的人之一，反对未经许可使用创意作品进行人工智…

王浩然
2024年10月24日
000
AI前沿

Meta 的 Llama 3.2：利用设备端和多模式功能重新定义开源生成式 AI

Meta 最近推出了 Llama 3.2 ，这是其 Llama 系列大型语言模型的最新版本，是开源生成式 AI 生态系统发展的重要进展。此次升级在两个维度上扩展了 Llama 的功…

点点
2024年9月28日
000
AI前沿

人工智能的变革者：Tsetlin 机器在降低能源消耗方面发挥的作用

人工智能 (AI)的迅速崛起已经改变了众多行业，从医疗保健和金融到能源管理等。然而，人工智能应用的增长也导致了严重的能源消耗问题。现代人工智能模型，尤其是基于深度学习和神经网络的模…

点点
2024年10月27日
000
AI前沿

2024 年无法实现的人工智能智能手机

过去一年，我报道了美国每款主要手机的发布，每款手机都在大声宣告同一件事：人工智能已经到来，我们的手机就是你们期待已久的人工智能手机。每款手机都赢得了热烈掌声和利好消息。但当我拿到这…

王浩然
2024年12月28日
000
AI前沿

RapidCanvas 如何为 gen AI 项目自动执行 70% 的数据任务

自从 ChatGPT 出现以来，企业一直在关注人工智能及其如何帮助他们应对关键业务挑战。一切始于大型语言模型 (LLM) 驱动的聊天机器人和搜索工具，它们使用户能够快速找到答案和见…

王浩然
2024年12月13日
000
AI前沿

OpenAI 推出高级语音模式，提供更多声音和新外观

OpenAI于周二宣布，将向 ChatGPT 的更多付费客户推出高级语音模式 (AVM)。该音频功能使 ChatGPT 的对话更加自然，将首先向 ChatGPT 的 Plus 和 …

王浩然
2024年9月25日
000
AI前沿

以下是 2024 年融资金额达 1 亿美元或以上的 39 家美国 AI 初创公司的完整名单

对于某些人来说，人工智能疲劳是真实存在的，但显然风险投资者还没有厌倦这一类别。第三季度，人工智能交易继续主导风险投资。根据数据，人工智能公司在第三季度筹集了 189 亿美元。这一…

王浩然
2024年10月12日
000
AI前沿

这款“AI Granny”黑客利用无聊的闲聊浪费电话诈骗者的时间

电话诈骗并不是什么新鲜事，但随着人工智能的出现，人们比以往任何时候都更难知道他们正在通话的人是否是他们所说的那个人。但英国移动网络 O2 正在扭转局面，创造了所谓的“人工智能奶奶”…

王浩然
2024年11月17日
000
AI前沿

地缘政治和人工智能将在 2025 年影响芯片行业 | KPMG

人工智能技术让半导体领导者对2025年更加乐观，但阻力可能来自地缘政治和人才保留问题。这些是美国审计、税务和咨询公司毕马威 ( KPMG)和全球半导体联盟 (GSA) 发布的第 …

王浩然
2024年12月19日
000
AI前沿

通过模块化人工智能打造数字化劳动力

工作平台Monday.com的AI发展历程、战略及技术特点，展现其如何借助AI提升竞争力并推动企业软件开发模式的演进，具体内容如下： 1. **发展背景**：Monday.com致…

王浩然
2025年2月11日
000
AI前沿

这些 Planetly 前员工对离职感到不满，他们正在利用人工智能来完善碳核算

初创公司员工通常会继续创办有趣的企业，并将从零开始创办公司时获得的经验作为新工作的基础。但并非所有这些经验都是积极的，有时，不尽人意的退出比其他任何事情都更能激发创始人的热情。对…

王浩然
2024年10月10日
000
AI前沿

Hugging Face 上孕育出 100 万个 AI 模型

Hugging Face 引用社区驱动的定制作为多样化 AI 模型繁荣的动力。

点点
2024年10月1日
000
AI前沿

Demed L’Her，DigitalRoute 首席技术官 – 访谈系列

Demed L’Her担任 DigitalRoute 的首席技术官，是一名软件高管，在企业软件战略方面拥有丰富的经验。他不仅拥有深厚的学术背景，而且在领导和技术方面也采…

点点
2024年10月12日
000
AI前沿

亚马逊推出人工智能购物指南

亚马逊周三推出了一系列针对消费者的人工智能功能和产品中的最新产品：人工智能购物指南。该指南将于周四推出，涵盖亚马逊网站上的 100 多种产品类型，有助于整合消费者在购买前往往会研究…

王浩然
2024年10月10日
000