一种提高人工智能效率的流行技术也有缺点

王浩然 • 2024年12月29日下午12:00 • AI前沿 • 63 views

量化是提高人工智能模型效率的最广泛使用的技术之一，但它也存在局限性，而业界可能很快就会接近这些局限性。

在人工智能的背景下，量化是指降低表示信息所需的位数（计算机可以处理的最小单位）。考虑一下这个类比：当有人问时间时，你可能会说“中午”——而不是“哦，一千二百一秒四毫秒”。这就是量化；两个答案都是正确的，但其中一个稍微精确一些。你实际需要多少精度取决于具体情况。

AI 模型由几个可以量化的组件组成，特别是参数，即模型用于进行预测或决策的内部变量。考虑到模型在运行时要执行数百万次计算，这很方便。量化模型用较少的位来表示其参数，在数学上要求较低，因此在计算上要求也较低。（需要明确的是，这是一个不同于“提炼”的过程，后者是一种更复杂、更有选择性的参数修剪。）

但量化可能有比以前假设的更多的权衡。

不断缩小的模型

根据哈佛大学、斯坦福大学、麻省理工学院、Databricks 和卡内基梅隆大学的研究人员的一项研究，如果对原始的未量化模型版本进行长时间的大量数据训练，量化模型的表现会更差。换句话说，在某个时候，训练一个较小的模型可能比精简一个大模型更好。

对于那些训练极大模型（已知可以提高答案质量）并对其进行量化以降低服务成本的人工智能公司来说，这可能是个坏消息。

其影响已经显现。几个月前，开发人员和学者报告称，与其他模型相比，量化 Meta 的Llama 3模型往往“更具危害性”，这可能是由于其训练方式所致。

哈佛大学数学系学生、论文第一作者 Tanishq Kumar 向 TechCrunch 表示：“在我看来，人工智能领域每个人面临的最大成本现在是、将来也将继续是推理，而我们的工作表明，降低推理成本的一个重要方法不会永远有效。”

与普遍看法相反，人工智能模型推理（运行模型，例如ChatGPT回答问题时）通常比模型训练成本更高。例如，谷歌花费约1.91 亿美元来训练其旗舰Gemini模型之一——这无疑是一笔巨款。但如果该公司使用模型为一半的谷歌搜索查询生成 50 字答案，每年将花费约60 亿美元。

主要的人工智能实验室都采用了基于海量数据集的训练模型，认为“扩大规模”——增加训练中使用的数据量和计算量——将使人工智能的能力越来越强。

例如，Meta 用 15 万亿个 token 训练了 Llama 3。（Token代表原始数据位；100 万个 token 相当于约 75 万个单词。）上一代 Llama 2 仅用 2 万亿个 token 进行训练。12 月初，Meta 发布了一款新型号 Llama 3.3 70B，该公司称其“以显著降低的成本提高了核心性能”。

有证据表明，规模扩大最终会带来收益递减；据报道， Anthropic 和 Google最近训练了庞大的模型，但这些模型未能达到内部基准预期。但几乎没有迹象表明，该行业已准备好真正摆脱这些根深蒂固的规模化方法。

那么到底有多精确呢？

那么，如果实验室不愿意在较小的数据集上训练模型，有没有办法让模型更不容易退化呢？有可能。Kumar 说，他和合著者发现，以“低精度”训练模型可以使它们更加稳健。请耐心等待片刻，我们将深入探讨一下。

这里的“精度”是指数值数据类型可以准确表示的位数。数据类型是数据值的集合，通常由一组可能的值和允许的操作指定；例如，数据类型 FP8 仅使用 8 位来表示浮点数。

目前，大多数模型都是以 16 位或“半精度”进行训练，并在“训练后量化”为 8 位精度。某些模型组件（例如其参数）会转换为较低精度格式，但会牺牲一些精度。这就像将数学运算精确到小数点后几位，然后四舍五入到最接近的 10 位，这通常会让您兼得两全其美。

Nvidia 等硬件供应商正在推动量化模型推理的低精度化。该公司的新款 Blackwell 芯片支持 4 位精度，具体来说是一种称为 FP4 的数据类型；Nvidia 将其视为内存和功率受限的数据中心的福音。

但极低的量化精度可能并不理想。Kumar 表示，除非原始模型的参数数量非常大，否则低于 7 位或 8 位的精度可能会明显降低质量。

如果这一切看起来有点技术性，别担心——确实如此。但关键在于，人工智能模型尚未完全被理解，已知的捷径在多种计算中都行不通。如果有人问他们什么时候开始 100 米短跑，你不会说“中午”，对吧？当然，这并不那么明显，但想法是一样的：

“我们工作的关键点在于，有些限制是无法轻易绕过的，”Kumar 总结道。“我们希望我们的工作能够为经常寻求越来越低的训练和推理精度默认值的讨论增添一些细节。”

Kumar 承认，他和同事的研究规模相对较小——他们计划在未来用更多模型进行测试。但他相信至少有一个观点是成立的：在降低推理成本方面，没有免费的午餐。

“比特精度很重要，而且不是免费的，”他说。“你不能永远降低它，否则模型就会受到影响。模型的容量是有限的，所以我认为，与其试图将千万亿个标记放入一个小模型中，不如将更多的精力投入到细致的数据管理和过滤中，这样只有最高质量的数据才能放入较小的模型中。我乐观地认为，旨在使低精度训练稳定的新架构在未来将发挥重要作用。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/yi-zhong-ti-gao-ren-gong-zhi-neng-xiao-lyu-de-liu-xing-ji

Like (0)

王浩然作者

0 0

如何在不入侵任何东西的情况下窃取人工智能模型

Previous 2024年12月29日

先进的基础模型将如何扩展人工智能的功能

Next 2024年12月29日

AI前沿

OpenAI发布迄今最大AI模型GPT 4.5 Orion‌

全球领先的AI研究机构OpenAI，近日正式揭晓了其最新的研究成果——GPT 4.5 Orion。这款AI模型代表了OpenAI在人工智能领域的又一重大突破，是迄今为止规模最大、能…

王浩然
2025年3月2日
000
AI前沿

Anthropic 首席执行官发表 15,000 字赞颂人工智能，充满技术乐观主义

Anthropic 首席执行官 Dario Amodei 希望你知道，他并不是人工智能“末日论者”。至少，这是我对 Amodei 上周五晚间在其博客上发表的一篇约 15,000 …

点点
2024年10月13日
000
AI前沿

Verizon 以 200 亿美元收购 Frontier Communications

此次收购扩大了 Verizon 的覆盖范围，并扩展了其智能边缘网络，以实现包括人工智能和物联网在内的数字创新

点点
2024年9月7日
000
AI前沿

开源模型上下文协议（MCP）重大更新：AI互操作性迈入新纪元

重写并翻译的文章内容 ‌开源模型上下文协议（MCP）重大更新：AI互操作性迈入新纪元‌ 在人工智能领域，一项旨在提升AI代理与工具、数据及接口间无缝交互能力的开源标准——模型上下文…

王浩然
6天前
000
AI前沿

iPhone 16、Apple Intelligence 以及所有其他预期的“Glowtime”发布内容。

有时一个标题就足够了。苹果将在9 月 9 日的 “It’s Glowtime”活动上发布 iPhone 16 ；这一点我们可以肯定地告诉你。但苹果不会邀请我们为了一件产…

王浩然
2024年9月4日
000
AI前沿

DeepSeek：全面解析这款AI聊天机器人应用

在科技迅猛发展的时代，AI聊天机器人已成为我们生活中不可或缺的一部分。DeepSeek，作为这一领域的佼佼者，凭借其强大的功能和卓越的用户体验，正在吸引越来越多的关注。本文将为您深…

王浩然
2025年3月24日
000
AI前沿

ServiceNow斥资28.5亿美元收购Moveworks，拓展AI版图‌

近日，ServiceNow宣布了一项重大收购计划，以28.5亿美元的价格将人工智能解决方案提供商Moveworks纳入麾下。此举标志着ServiceNow在人工智能领域的又一重大布…

王浩然
2025年3月11日
000
AI前沿

量子处理单元：计算的未来

量子计算曾经是一个理论领域，如今正迅速转变为一项突破性的技术前沿。这场革命的核心是量子处理单元(QPU)，即驱动量子计算机的引擎。与依赖二进制逻辑（代表 0 或 1 的位）的传统处…

点点
2024年10月22日
000
AI前沿

从 2.2 亿个数据点到收入：人工智能如何改变体育娱乐投资回报率

超级碗是全球最大的体育娱乐赛事之一，吸引了超过一亿观众和十亿美元的收入。但对于 NFL 球队和体育娱乐活动总体而言，通往冠军的道路还很漫长，因为球队的目标是打造品牌、扩大粉丝群并…

王浩然
2025年2月9日
000
AI前沿

萨姆·奥特曼的世界币成为世界币，并展示新的虹膜扫描球来证明你的人类身份

世界币 (Worldcoin) 是 Sam Altman 共同创办的“人格证明”加密项目，该项目通过扫描人的眼球，周四宣布将“币”从其名称中删除，现在改名为“世界币”。世界币项目背…

点点
2024年10月18日
000
AI前沿

人形机器人在特斯拉 We Robot 活动上为客人提供饮料和聚会

伊隆·马斯克预测 Optimus 的最终售价将为 2 万至 3 万美元，低于一辆汽车的价格，这样每个家庭都可以买得起一辆

点点
2024年10月14日
011
AI前沿

亚马逊正在将生成式人工智能融入其购物体验

亚马逊推出了一批新的生成式人工智能工具，旨在改善平台上客户和卖家的零售体验。周四在亚马逊加速活动上宣布的一项最引人注目的功能将利用客户的偏好、搜索、浏览和购买历史在亚马逊主页上创建…

王浩然
2024年9月22日
000
AI前沿

OpenAI 推出具有图像上传和分析功能的完整 o1 模型，并首次推出 ChatGPT Pro

OpenAI 已正式推出其o1 模型，该模型已从预览版过渡到 ChatGPT 平台的核心功能。现在，它还可以分析图像——这是一项非常有用的功能升级，因为它使用户能够上传照片并让 A…

王浩然
2024年12月6日
000
AI前沿

改变我们在董事会中对 GenAI 的看法：把握短期和长期投资回报率

随着世界各地的领导团队开始规划 2025 年，每个人都在思考一个问题：他们在人工智能和/或生成式人工智能 (GenAI) 上的投资何时能获得回报。Google Cloud 的最新研…

点点
2024年10月11日
000
AI前沿

加密货币骗子入侵 OpenAI 在 X 上的新闻账号

OpenAI 在 X 上的官方新闻账号似乎也遭到了加密货币骗子的攻击，前几个月攻击该公司领导层的账号的也是同样的情况。周一下午晚些时候，OpenAI Newsroom（OpenA…

王浩然
2024年9月25日
000
AI前沿

OpenAI 未能在 2025 年之前提供其承诺的退出工具

早在5 月份，OpenAI 就表示正在开发一款工具，让创作者可以指定他们希望自己的作品如何纳入或排除在其 AI 训练数据中。但 7 个月过去了，这项功能仍未面世。 OpenAI 当…

王浩然
2025年1月2日
000
AI前沿

MetaScale利用自适应策略提升大型语言模型推理能力

重写与翻译后的内容 MetaScale利用自适应策略提升大型语言模型推理能力 ‌引言‌ 在人工智能领域，大型语言模型（LLM）的推理能力一直是研究者们关注的焦点。近期，MetaSc…

王浩然
2025年3月26日
000
AI前沿

谷歌的人工智能笔记应用程序 NotebookLM 现在可以大声向你解释复杂的主题

谷歌周三宣布，其人工智能笔记和研究应用NotebookLM将添加“音频概览”功能。音频概览将为用户提供另一种方式来消化和理解他们上传到该应用的文档中的信息，例如课程阅读材料或法律摘…

王浩然
2024年9月13日
000
AI前沿

将人工智能带入实践：LinkedIn 结合 LLM、LangChain 和 Jupyter Notebooks 来提高快速工程水平

对于企业来说，找出正确的提示以从生成式 AI 模型中获得最佳结果并不总是一件容易的事。在某些组织中，这已经落到了新出现的提示工程师的职位上，但LinkedIn的情况并非如此。该专…

王浩然
2025年2月14日
000
AI前沿

Runway 的全新 AI 图像生成器 Frames 现已推出，其画面效果非常具有电影感

AI 媒体技术提供商Runway宣布推出其最新的文本转图像生成模型 Frames，该模型因制作出极具电影感的视觉效果而赢得了用户的早期赞誉——鉴于 Runway 主要以 AI 视频…

王浩然
2025年1月18日
000

发表回复

Please Login to Comment

一种提高人工智能效率的流行技术也有缺点

不断缩小的模型

那么到底有多精确呢？

相关推荐

发表回复

Share To :