‌Google发布新一代Ironwood芯片：性能超世界最快超级计算机24倍‌

王浩然 • 4天前 • AI前沿 • 59 views

Google Cloud于近日正式推出了其第七代张量处理单元（Tensor Processing Unit，简称TPU）——Ironwood。这款专为人工智能（AI）推理工作负载设计的定制AI加速器，据Google声称，在大规模部署时，能提供超过当前世界最快超级计算机24倍的计算能力。Ironwood的发布标志着Google在长达十年的AI芯片开发战略上的一次重大转变。

在Google Cloud Next ’25大会上宣布的这一新芯片，无疑为Google的AI芯片发展之路树立了新的里程碑。以往各代的TPU主要针对训练和推理工作负载进行了双重设计，而Ironwood则是首个专为推理而生的芯片——即部署经过训练的AI模型以进行预测或生成响应的过程。

“Ironwood旨在支持AI生成的下一阶段及其巨大的计算和通信需求，”Google机器学习、系统和云AI部门的副总裁兼总经理Amin Vahdat在活动前的虚拟新闻发布会上表示，“我们称之为‘推理时代’，在这个时代，AI智能体将主动检索和生成数据，以协同提供见解和答案，而不仅仅是数据。”

‌Ironwood：打破计算壁垒‌

Ironwood的技术规格令人瞩目。当每个pod部署9,216个芯片时，它能提供42.5百亿亿次浮点运算（exaflops）的计算能力，远远超过了目前世界最快的超级计算机El Capitan的1.7百亿亿次浮点运算能力。每个Ironwood芯片都能达到4,614万亿次浮点运算的峰值计算能力。

此外，Ironwood在内存和带宽方面也实现了显著提升。每个芯片配备了192GB的高带宽内存（HBM），是Google去年宣布的前代TPU——Trillium的六倍。其内存带宽也达到了每芯片7.2太比特每秒（terabits per second），相比Trillium提升了4.5倍。

在电力受限的数据中心时代，Ironwood的性能功耗比也达到了新的高度。与Trillium相比，Ironwood的每瓦性能提升了两倍，而相比Google 2018年推出的首款云TPU，其能效更是提高了近30倍。“在当前电力供应成为提供AI能力约束之一的背景下，我们为客户工作负载提供了每瓦显著更多的容量，”Vahdat解释道。

‌从模型构建到“思考机器”‌

从训练转向推理的重点转移，标志着AI发展时间线上的一个重要转折点。多年来，业界一直专注于构建越来越大的基础模型，公司间主要在参数数量和训练能力上展开竞争。Google对推理优化的重视表明，我们正在进入一个以部署效率和推理能力为中心的新阶段。这一转变是合理的，因为训练只需进行一次，而推理操作在用户与AI系统交互时会每日发生数十亿次。

随着模型变得越来越复杂和计算密集，AI的经济性日益与推理成本挂钩。在新闻发布会上，Vahdat透露，Google观察到过去八年来，对AI计算的需求每年增长了10倍——总体增长了惊人的1亿倍。没有像Ironwood这样的专业架构，摩尔定律的进步也无法满足这一增长曲线。

特别值得注意的是，Google正专注于能够执行复杂推理任务的“思考模型”，而不仅仅是简单的模式识别。这表明，Google认为AI的未来不仅在于更大的模型，更在于能够分解问题、通过多个步骤进行推理并模拟人类思维过程的模型。

‌Gemini的思考引擎：Google下一代模型利用先进硬件‌

Google将Ironwood定位为其最先进AI模型的基础，包括具有“原生内置思考能力”的Gemini 2.5。在大会上，Google还宣布了Gemini 2.5 Flash，一个基于提示复杂性调整推理深度的更具成本效益的版本。Gemini 2.5 Pro旨在为药物发现和金融建模等复杂用例而设计，而Gemini 2.5 Flash则针对响应时间至关重要的日常应用。

此外，Google还展示了其完整的生成式媒体模型套件，包括文本到图像、文本到视频，以及新宣布的文本到音乐功能Lyria。一项演示展示了这些工具如何协同工作，以创建完整的音乐会宣传视频。

‌超越硅芯片：Google的全面基础设施战略涵盖网络和软件‌

Ironwood只是Google更广泛的AI基础设施战略的一部分。该公司还宣布了Cloud WAN，这是一种托管广域网服务，可为企业提供访问Google全球级私有网络基础设施的能力。“Cloud WAN是一个完全托管、可行且安全的企业网络主干，可提供高达40%的网络性能提升，同时降低同等比例的总拥有成本，”Vahdat说。

Google还在扩展其针对AI工作负载的软件产品，包括Pathways，这是由Google DeepMind开发的机器学习运行时。Pathways on Google Cloud允许客户在数百个TPU上扩展模型服务。

‌AI经济学：Google 120亿美元的云业务计划赢得效率之战‌

这些硬件和软件公告对Google Cloud而言至关重要，该公司在最新的收益报告中公布了2024年第四季度120亿美元的营收，同比增长30%。在云计算领域的战争中，AI部署的经济性正日益成为一个区分因素。

Google面临着来自Microsoft Azure和Amazon Web Services的激烈竞争。Azure通过与OpenAI的合作伙伴关系获得了强大的市场地位，而AWS则继续扩展其Trainium和Inferentia芯片产品。

Google方法的不同之处在于其垂直整合。竞争对手要么与芯片制造商合作，要么收购初创企业，而Google则十多年来一直在内部开发TPU。这赋予了Google对其AI堆栈从硅芯片到软件再到服务的无与伦比的控制。

通过将这项技术带给企业客户，Google押注其在搜索、Gmail和YouTube方面构建芯片的经验将转化为在企业市场上的竞争优势。其战略很明确：向任何愿意付费的人提供支持Google自身AI的基础设施，而且规模庞大。

‌多智能体生态系统：Google打造协同工作的AI系统大胆计划‌

除了硬件之外，Google还概述了一个以多智能体系统为中心的AI愿景。该公司宣布了Agent Development Kit（ADK），允许开发者构建多个AI智能体可以协同工作的系统。最重要的是，Google宣布了一个“智能体间互操作性协议”（A2A），使由不同框架和不同供应商构建的AI智能体能够相互通信。

“2025年将是过渡的一年，在这一年，生成式AI将从回答单个问题转变为通过智能体系统解决复杂问题，”Vahdat预测道。Google正在与包括Salesforce、ServiceNow和SAP在内的50多个行业领导者合作，以推进这一互操作性标准。

‌企业现实检验：Ironwood的功耗和效率对您的AI战略意味着什么‌

对于企业部署AI而言，这些公告可能会显著降低运行复杂AI模型的成本和复杂性。Ironwood的能效提升可能使运行高级推理模型更具经济性，而智能体互操作性协议可能有助于企业避免供应商锁定。

这些进步的实际影响不容忽视。许多组织一直因高昂的基础设施成本和能源消耗而不愿部署先进的AI模型。如果Google能够兑现其每瓦性能承诺，我们可能会看到在迄今为止仍处于观望状态的行业中出现新一轮AI采用浪潮。

多智能体方法对于被跨系统和供应商部署AI的复杂性所困扰的企业来说同样重要。通过标准化AI系统的通信方式，Google正试图打破限制AI在企业中发挥作用的壁垒。在新闻发布会上，Google强调，Next ’25上将分享超过400个客户故事，展示其AI创新的真实业务影响。

‌硅芯片军备竞赛：Google的定制芯片和开放标准将重塑AI的未来吗？‌

随着AI的发展，其基础设施将变得越来越关键。Google在Ironwood等专用硬件和智能体互操作性计划上的投资表明，该公司正在为AI变得更加分布式、更复杂和更深入融入业务运营的未来做准备。

“像Gemini 2.5和获得诺贝尔奖的AlphaFold这样的领先思考模型今天都运行在TPU上，”Vahdat指出，“有了Ironwood，我们迫不及待地想看到我们的开发人员和Google Cloud客户在它推出后能实现哪些AI突破。”

这些战略影响的范围超出了Google自身的业务。在推动智能体通信的开放标准的同时，Google在硬件方面保持专有优势，正试图在保持竞争优势的同时促进更广泛的生态系统繁荣（以Google基础设施为基础）。

在未来几个月里，关键因素将包括竞争对手对Google硬件进步的响应速度，以及行业是否会围绕提议的智能体互操作性标准联合起来。如果历史有迹可循，我们可以预计Microsoft和Amazon将推出自己的推理优化策略，可能会形成一场三方竞赛，以构建最高效的AI基础设施堆栈。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/google-fa-bu-xin-yi-dai-ironwood-xin-pian-xing-neng-chao

Like (0)

王浩然作者

0 0

Google发布Agent2Agent互操作性协议，旨在标准化智能体通信‌

Previous 5天前

字节跳动发布Seed-Thinking-v1.5，进军推理AI领域

Next 4天前

AI前沿

Veriff 首席执行官兼创始人 Kaarel Kotkas – 访谈系列

Kaarel Kotkas 是 Veriff 的首席执行官兼创始人，也是公司的战略思想家和远见卓识者。他带领 Veriff 团队在快速变化的在线身份识别领域保持领先地位，防范欺诈和…

点点
2024年11月5日
000
AI前沿

一种新的时间一致稳定扩散视频特征系统

阿里巴巴集团的一项新举措提供了我所见过的最佳方法之一，即通过基于稳定扩散的基础模型生成全身人体化身。该系统名为MIMO（MIM icking with O bject Inter…

点点
2024年9月27日
000
AI前沿

IBM为五家城市可持续发展非营利组织提供人工智能支持

IBM最近宣布了一项与城市可持续发展相关的非营利组织开展的开创性合作。通过这些非营利组织参与的IBM可持续发展计划，它们将获得人工智能（AI）支持，以扩大其援助世界上最脆弱社区的使…

王浩然
2025年2月22日
000
AI前沿

Shutterstock 与 Lightricks 合作率先推出“研究许可”模式，降低 AI 训练数据的门槛

Shutterstock正在通过一种新颖的“研究许可”方法重塑 AI 公司访问训练数据的方式，并率先与 AI 创意技术公司Lightricks合作。今天宣布的合作允许 Lightr…

王浩然
2024年12月16日
000
AI前沿

科技领袖对 DeepSeek 的快速崛起做出回应

如果你还没听说过，那么现在城里出现了一颗新的人工智能明星：DeepSeek，香港量化分析公司 High-Flyer Capital Management 的子公司，本周早些时候发布…

王浩然
2025年1月25日
000
AI前沿

为医生配备人工智能副驾驶

大多数医生从医是因为他们想帮助患者。但当今的医疗保健系统要求医生每天花费数小时处理其他工作——搜索电子健康记录 (EHR)、编写文档、编码和计费、事先授权和使用管理——通常超过他们…

王浩然
2024年10月20日
000
AI前沿

ChatGPT 的资源需求正在失控

众所周知，生成式人工智能的发展需要越来越多的水和电，但《华盛顿邮报》和加州大学河滨分校研究人员的一项新研究表明，OpenAI 的聊天机器人需要多少资源才能执行其最基本的功能。在…

王浩然
2024年9月24日
000
AI前沿

这是你永远不应该外包给人工智能模型的事情

在这个效率至上、颠覆性技术一夜之间创造出数十亿美元市场的世界里，企业不可避免地将生成式人工智能视为强大的盟友。从 OpenAI 的 ChatGPT 生成类似人类的文本，到 DALL…

王浩然
2024年12月8日
000
AI前沿

aiOla 推出开源AI 音频转录模型，可实时隐藏敏感信息

希望使用人工智能模型来转录高管、员工和客户的音频（特别是人类语音）的企业可能会对人工智能程序监听和记录敏感信息的想法持谨慎态度。然而，以色列音频 AI 初创公司aiOla有一个新…

王浩然
2024年11月23日
000
AI前沿

从 Atari 到 Doom：谷歌如何利用人工智能重新定义视频游戏

电子游戏产业目前市值3470 亿美元，已发展成为娱乐界的重要参与者，全球有 30 多亿人参与其中。最初只是Pong和Space Invaders等简单游戏，后来演变为 Doom 等…

点点
2024年9月10日
000
AI前沿

Crogl携3000万美元资金，推出面向安全分析师的AI版“钢铁侠”战衣‌

近日，Crogl公司凭借其获得的3000万美元资金支持，正式揭晓了一款专为安全分析师打造的全新AI辅助系统，形象地被称为“AI版钢铁侠战衣”。这款创新产品的推出，标志着Crogl在…

王浩然
2025年3月7日
000
AI前沿

毫秒级突破：补丁自动化如何堵住攻击者的最快漏洞

在当今的数字世界中，拖延打补丁已成为导致网络崩溃和公司受损的主要原因，其危害甚至超过了零日漏洞利用或高级网络攻击。忽视补丁管理，就如同敞开了网络的大门，让攻击者轻易得逞。无论是数据…

王浩然
2025年2月23日
000
AI前沿

微软在 Windows 召回系统重新发布前详细介绍了其安全/隐私方面的改进

微软正在对其备受争议的 Copilot+ Windows PC 的 Recall 功能进行另一次调整，此前该功能的原始版本在夏季安全研究人员和测试人员的严格审查下崩溃并烧毁。Rec…

点点
2024年9月30日
000
AI前沿

苹果针对性别语言翻译的解决方案

苹果公司刚刚与南加州大学合作发表了一篇论文，探讨了用于让 iOS18 操作系统用户在翻译时拥有更多性别选择权的机器学习方法。在 iOS18 中，用户可以在原生翻译应用中为翻译的单…

点点
2024年10月9日
000
AI前沿

Stable Diffusion 3.5：文本到图像 AI 的架构进步

Stability AI发布了 Stable Diffusion 3.5，标志着文本转图像 AI 模型的又一次进步。此版本代表了一次全面改革，由宝贵的社区反馈和对突破生成式 AI …

点点
2024年10月25日
000
AI前沿

Insilico Medicine 成功完成 IIa 期治疗肺纤维化研究，人工智能药物研发取得里程碑式进展

在人工智能药物研发方面取得突破性进展的Insilico Medicine宣布其新药 ISM001-055 的IIa 期研究结果呈阳性，该药物旨在治疗特发性肺纤维化(IPF)。这种小…

点点
2024年9月27日
000
AI前沿

商业基础设施 AI 的未来：为何 Apple Silicon 驱动的私有裸机解决方案是 IT 部门的理想选择

随着企业（尤其是中小型 IT 部门）寻求将 AI 纳入其运营，他们面临着一个复杂且不断变化的市场。尽管 AI 的前景令人兴奋，但前景充满不确定性。公共 AI 聊天机器人广泛可用，但…

王浩然
2025年1月13日
000
AI前沿

谷歌称其下一代人工智能代理最早要到 2025 年才会推出

谷歌最早要到明年才会推出Project Astra的技术。Project Astra 是谷歌为实现实时、多模式理解而开展的一项广泛努力，旨在构建人工智能应用程序和“代理”。谷歌首…

王浩然
2024年10月30日
000
AI前沿

波士顿动力公司的电动 Atlas 机器人可自动挑选汽车零件

波士顿动力公司的新机器人一直在幕后悄然飞速发展。该公司于 4 月宣布推出这款机器人，8 月我们通过一段机器人做俯卧撑的视频简要了解了电动 Atlas 的实力。周三发布的最新视频展示…

王浩然
2024年10月31日
000
AI前沿

苹果推出新 iOS 开发者测试版，可使用 AI 去除图片中的物体

苹果在其最新的 iOS 18.1、iPadOS 18.1 和 macOS 15.1 开发者测试版中添加了更多 AI 功能，这次我们可以从照片中删除物体。这项名为“清理”的功能可让…

王浩然
2024年8月31日
000

发表回复

Please Login to Comment

‌Google发布新一代Ironwood芯片：性能超世界最快超级计算机24倍‌

相关推荐

发表回复

Share To :