为 GPU 成本波动的动荡时代做好准备

王浩然 • 2024年9月9日下午1:00 • AI前沿 • 105 views

图形芯片（GPU）是人工智能革命的引擎，为聊天机器人和其他人工智能应用所依赖的大型语言模型（LLM）提供动力。由于这些芯片的价格在未来几年可能会大幅波动，许多企业将需要首次学习如何管理关键产品的变动成本。

一些行业已经熟悉了这一原则。采矿等能源密集型行业的公司习惯于管理能源成本波动，平衡不同的能源来源，以实现可用性和价格的正确组合。物流公司这样做是为了管理运输成本，由于苏伊士运河和巴拿马运河的中断，运输成本目前波动很大。

未来的波动：计算成本难题

计算成本波动有所不同，因为它会影响没有此类成本管理经验的行业。例如，金融服务和制药公司通常不从事能源或航运交易，但它们是有望从人工智能中受益匪浅的公司之一。他们需要快速学习。

Nvidia 是 GPU 的主要供应商，这也解释了为什么其估值今年飙升。GPU 之所以受到青睐，是因为它们可以并行处理许多计算，使其成为训练和部署 LLM 的理想选择。Nvidia 的芯片非常抢手，以至于有一家公司甚至用装甲车运送它们。

受到供需基本面的冲击，与 GPU 相关的成本可能会继续大幅波动，而且很难预测。

GPU 成本波动的驱动因素

随着企业继续快速构建 AI，需求几乎肯定会增加。投资公司瑞穗表示，随着企业争相部署新的 AI 应用程序，GPU 的总市场规模在未来五年内可能会增长十倍，达到 4000 多亿美元。

供应取决于几个难以预测的因素。其中包括制造能力（扩大规模的成本很高）以及地缘政治因素——许多 GPU 是在台湾制造的，而台湾的持续独立性受到中国的威胁。

供应已经很紧缺，据报道，一些公司等了六个月才拿到 Nvidia 强大的 H100 芯片。随着企业越来越依赖 GPU 来支持 AI 应用程序，这些动态意味着他们需要掌握管理可变成本的方法。

GPU 成本管理策略

为了控制成本，更多公司可能会选择自己管理 GPU 服务器，而不是从云提供商那里租用。这会产生额外的开销，但可以更好地控制，并可能在长期内降低成本。公司还可以出于防御目的购买 GPU：即使他们还不知道如何使用它们，这些防御性合同也可以确保他们能够在未来需要时使用 GPU，而他们的竞争对手则无法使用。

并非所有 GPU 都一样，因此公司应通过确保适合其预期用途的正确类型的 GPU 来优化成本。最强大的 GPU 最适合训练大型基础模型的少数组织，例如 OpenAI 的 GPT 和 Meta 的 LLama。大多数公司将进行要求较低、容量较大的推理工作，这涉及针对现有模型运行数据，因此，使用更多性能较低的 GPU 将是正确的策略。

地理位置是组织可以用来管理成本的另一个杠杆。GPU 耗电量很大，其单位经济效益的很大一部分是为其供电所用的电力成本。与电力成本通常较高的美国东部地区相比，将 GPU 服务器放置在电力充足、价格低廉的地区（如挪威）可以显著降低成本。

CIO 还应仔细考虑 AI 应用的成本和质量之间的权衡，以找到最有效的平衡点。例如，他们可以使用较少的计算能力来运行对准确性要求较低的应用模型，或者运行对业务没有那么重要应用模型。

在不同的云服务提供商和不同的 AI 模型之间切换为组织提供了另一种优化成本的方法，就像当今的物流公司使用不同的运输方式和运输路线来管理成本一样。他们还可以采用针对不同用例优化 LLM 模型运行成本的技术，从而提高 GPU 的使用效率。

需求预测的挑战

整个人工智能计算领域都在快速发展，这使得组织很难准确预测自己的 GPU 需求。供应商正在构建具有更高效架构的新型 LLM，例如 Mistral 的“混合专家”设计，该设计只需要将模型的一部分用于不同的任务。与此同时，包括 Nvidia 和 TitanML 在内的芯片制造商正在研究提高推理效率的技术。

与此同时，新的应用和用例不断涌现，增加了准确预测需求的挑战。即使是当今相对简单的用例，如 RAG 聊天机器人，其构建方式也可能会发生变化，从而推高或降低 GPU 需求。预测 GPU 需求对大多数公司来说都是未知领域，很难准确预测。

立即开始规划波动的 GPU 成本

人工智能发展的浪潮没有丝毫减弱的迹象。根据美国银行全球研究和 IDC 的数据，到 2026 年，与人工智能软件、硬件、服务和销售相关的全球收入将以每年 19% 的速度增长，达到 9000 亿美元。这对 Nvidia 等芯片制造商来说是个好消息，但对许多企业来说，这将需要学习一门全新的成本管理学科。他们现在应该开始规划了。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/wei-gpu-cheng-ben-bo-dong-de-dong-dang-shi-dai-zuo-hao-zhun

AI GPT GPU H100 IDC LLM Nvidia OpenAI 图形芯片大型语言模型计算能力

Like (0)

王浩然作者

0 0

人工智能编排：创造和谐还是创造依赖？

Previous 2024年9月9日

AI 是销售的未来吗？Salesforce 的新模式可能会改变游戏规则

Next 2024年9月9日

AI前沿

这是我见过的最奇怪的游戏笔记本电脑

宏碁在IFA 2024上推出了一些非常有趣的产品。该公司发布了 Project DualPlay，这是一款笔记本电脑概念产品，其中隐藏着一些有趣的技巧。合上盖子时，它是一种相对标准…

王浩然
2024年9月5日
000
AI前沿

通过智能数据映射和检索打破云备份“黑匣子”

自计算机诞生之初，企业就一直使用备份来保护其业务关键信息。成功建立的云备份态势可确保组织在自然灾害或系统故障等不可预见的事件中不受影响。然而，即使企业技术堆栈的规模和复杂性成倍增长…

王浩然
2024年11月28日
000
AI前沿

Cassette Group 首席执行官兼联合创始人 Ben Taylor – 访谈系列

Ben Taylor是Cassette Group的联合创始人兼首席执行官，该集团是一家沉浸式技术公司，专门为企业提供培训、教育和通信解决方案。该公司利用 3D 实时技术通过动画…

点点
2024年9月28日
000
AI前沿

CoreWeave与EcoDataCenter携手筹集5亿美元，打造AI可持续建筑‌

在人工智能领域不断发展的背景下，CoreWeave与EcoDataCenter宣布了一项雄心勃勃的合作计划。两家公司已共同筹集了5亿美元资金，旨在建设更加环保、高效的建筑，以支持A…

王浩然
2025年3月6日
000
AI前沿

AI 能否利用安全检查来破坏用户？是的，但效果不是很好 — 目前来说

人工智能公司声称已经实施了严格的安全检查，以确保模型不会说或做奇怪、非法或不安全的事情。但如果模型能够逃避这些检查，并出于某种原因试图破坏或误导用户，该怎么办？据 Anthropi…

点点
2024年10月21日
000
AI前沿

智能手机上有 AI？Hugging Face 的 SmolLM2 将强大的模型带到你的手掌上

Hugging Face今天发布了SmolLM2，这是一组新的紧凑型语言模型，它实现了令人印象深刻的性能，同时所需的计算资源比大型模型少得多。新模型采用 Apache 2.0 许…

王浩然
2024年11月3日
000
AI前沿

阿里云开源百余个AI模型

阿里云开源了100多个新发布的AI模型，统称为Qwen 2.5。该消息是在该公司的年度云栖大会上宣布的。阿里巴巴集团的云计算部门还推出了经过改进的全栈基础设施，旨在满足对强大人工…

点点
2024年9月21日
000
AI前沿

利用人工智能进行漏洞评估

根据Cybersecurity Ventures 2023 年的一份报告，到 2025 年，网络犯罪估计每年将给世界造成 10.5 万亿美元的损失。每年记录在案的网络犯罪数量都…

点点
2024年10月7日
000
AI前沿

生成式人工智能热潮背后的风险：为何人们越来越谨慎

在不久的将来，硅谷可能会回顾最近发生的事件，认为这是生成式人工智能热潮走得太远的标志。今年夏天，投资者质疑顶级人工智能股票能否维持其高估值，因为大规模人工智能支出缺乏回报。随着秋…

点点
2024年10月11日
000
AI前沿

上海杀出超级独角兽公司，一次融了5个亿

又一个师生联手创业的案例。

点点
2024年9月3日
000
AI前沿

AI副驾驶：减轻过劳安全运营中心（SOC）的误报与人员疲惫

随着AI技术的飞速发展，安全运营中心（SOC）正经历着一场深刻的变革。最新的AI副驾驶技术不仅显著降低了误报率，还极大地缓解了SOC人员的工作压力，提高了整体运营效率。 ‌一、AI…

王浩然
2025年3月25日
000
AI前沿

Midjourney 表示正在“进军硬件领域”

据报道，人工智能图像生成平台 Midjourney在未获得任何风险投资的情况下就获得了超过 2 亿美元的收入，目前该平台正在进军硬件领域。该公司周三在 X 上的一篇帖子中宣布了这…

王浩然
2024年8月29日
000
AI前沿

DeepMind 的 Genie 2 可以生成类似视频游戏的交互式世界

谷歌的人工智能研究机构 DeepMind 推出了一个可以生成“无限”可玩 3D 世界的模型。该模型名为 Genie 2，是今年早些时候发布的 DeepMind Genie 的继任…

王浩然
2024年12月5日
000
AI前沿

苹果刚刚将九款Mac机型标记为“过时”

你的“过时”Mac可能仍然工作正常。消费技术正变得非常好——事实上，如此之好，以至于升级到新事物的理由越来越少。我们中的许多人在设备上坚持的时间比以往任何时候都长，Mac也不例外…

free
2024年9月28日
000
AI前沿

日本最有趣的独角兽

尽管日本的创业行业是世界上最大的行业之一，但就独角兽企业数量和风险投资规模而言，日本仍落后于美国、中国和英国等其他地区。多年来，人口老龄化、整体经济通缩以及工薪阶层倾向于在传统的大…

点点
2024年10月13日
000
AI前沿

波士顿动力人形机器人将获得新功能

机器人与人工智能研究所合作旨在在过去研究的基础上推进包括 Atlas 在内的人形机器人的发展波士顿动力公司与机器人与人工智能研究所（前身为人工智能研究所）合作，通过强化学习推…

王浩然
2025年2月19日
000
AI前沿

Adobe 展示用于平面绘图的 3D 旋转工具

目前，我们已经习惯了使用人工智能图像工具，这些工具可以立即完成以前需要大量精力才能完成的编辑，例如填充场景中缺失的部分或删除照片中不需要的部分而不影响背景。但在本周的 Adob…

点点
2024年10月21日
000
AI前沿

这是你永远不应该外包给人工智能模型的事情

在这个效率至上、颠覆性技术一夜之间创造出数十亿美元市场的世界里，企业不可避免地将生成式人工智能视为强大的盟友。从 OpenAI 的 ChatGPT 生成类似人类的文本，到 DALL…

王浩然
2024年12月8日
000
AI前沿

无形的、自主的且可被攻击的：无人预见的AI代理困境

随着人工智能（AI）技术的飞速发展，一种新型的网络安全威胁正在悄然兴起——无形的、自主的AI代理。这些AI代理在后台默默运行，能够自我学习、自我决策，并在不被察觉的情况下执行恶意任…

王浩然
2025年2月23日
000
AI前沿

Devin 2.0震撼发布：Cognition将AI软件工程师价格从每月500美元大幅降至20美元‌

在科技创新日新月异的今天，由知名风投机构Founders Fund支持的旧金山初创公司Cognition AI（亦称Cognition Labs），自2024年初凭借Devin——…

王浩然
5天前
000