谷歌新款 Trillium AI 芯片速度提升 4 倍，为 Gemini 2.0 提供支持

王浩然 • 2024年12月12日下午2:00 • AI前沿 • 100 views

谷歌刚刚发布了其第六代人工智能加速器芯片Trillium，声称其性能改进可能会从根本上改变人工智能开发的经济性，同时突破机器学习的极限。

这款定制处理器为谷歌新发布的Gemini 2.0 AI 模型的训练提供了动力，其训练性能是前代产品的四倍，同时功耗却大大降低。这一突破来得正是时候，因为科技公司竞相构建越来越复杂的 AI 系统，而这些系统需要大量的计算资源。

谷歌首席执行官 Sundar Pichai 在一篇公告中解释说：“TPU 为 Gemini 2.0 的训练和推理提供了 100% 的支持”，并强调了该芯片在公司 AI 战略中的核心作用。部署规模是前所未有的：谷歌已将超过 100,000 个 Trillium 芯片连接到一个网络结构中，创造了相当于世界上最强大的 AI 超级计算机之一。

Trillium 的 4 倍性能提升如何改变 AI 开发

Trillium 的规格代表了多个维度上的重大进步。与上一代产品相比，该芯片的峰值计算性能提高了 4.7 倍，同时高带宽内存容量和芯片间互连带宽也增加了一倍。或许最重要的是，它的能源效率提高了 67%——这是数据中心应对 AI 训练巨大电力需求的关键指标。

Google Cloud 计算和 AI 基础设施副总裁 Mark Lohmeyer 表示：“在训练 Llama-2-70B 模型时，我们的测试表明 Trillium 实现了从 4 片 Trillium-256 芯片组到 36 片 Trillium-256 芯片组的近乎线性的扩展，扩展效率高达 99%。”考虑到这种规模的分布式计算通常面临的挑战，这种扩展效率水平尤其令人瞩目。

创新经济学：Trillium 为何能改变 AI 初创企业的游戏规则

Trillium 的商业意义不仅限于原始性能指标。谷歌声称，与上一代芯片相比，该芯片每美元的训练性能提高了 2.5 倍，有可能重塑人工智能开发的经济性。

这种成本效益对于开发大型语言模型的企业和初创公司来说可能特别重要。Trillium 的早期客户 AI21 Labs 已经报告了显著的改进。AI21 Labs首席技术官Barak Lenz在公告中指出： “规模、速度和成本效益方面的进步非常显著。”

攀登新高峰：谷歌的 100,000 芯片 AI 超级网络

谷歌在其 AI 超级计算机架构中部署 Trillium 展示了该公司对 AI 基础设施的综合方法。该系统将超过 100,000 个 Trillium 芯片与每秒 13 PB 带宽的 Jupiter 网络结构相结合，使单个分布式训练作业能够扩展到数十万个加速器上。

谷歌人工智能工作室产品经理 Logan Kilpatrick 在开发者大会上表示：“闪存使用量的增长已经超过 900%，这是令人难以置信的。”这凸显了人工智能计算资源需求的快速增长。

超越英伟达：谷歌在人工智能芯片战争中的大胆举动

Trillium 的发布加剧了人工智能硬件领域的竞争，而Nvidia凭借其基于 GPU 的解决方案在该领域占据主导地位。虽然 Nvidia 的芯片仍然是许多人工智能应用的行业标准，但谷歌的定制硅片方法可以为特定工作负载带来优势，特别是在训练非常大的模型方面。

行业分析师认为，谷歌对定制芯片开发的大规模投资反映了对人工智能基础设施日益增长的重要性的战略押注。该公司决定向云客户提供 Trillium，表明其希望在云人工智能市场上展开更积极的竞争，而该公司在该市场上面临着来自Microsoft Azure和Amazon Web Services的激烈竞争。

驱动未来：Trillium 对未来 AI 意味着什么

Trillium 的功能意义远不止直接的性能提升。该芯片能够高效处理混合工作负载（从训练大量模型到为生产应用程序运行推理），这预示着未来 AI 计算将变得更加便捷且更具成本效益。

对于更广泛的科技行业来说，Trillium 的发布标志着人工智能硬件霸主地位的竞争进入了一个新阶段。随着各家公司不断突破人工智能的极限，大规模设计和部署专用硬件的能力可能成为越来越重要的竞争优势。

谷歌 DeepMind 首席执行官 Demis Hassabis 在公司博客文章中写道：“我们仍处于人工智能发展的早期阶段。拥有合适的基础设施（包括硬件和软件）对于我们继续突破人工智能的界限至关重要。”

随着行业向更复杂的 AI 模型发展，这些模型可以自主行动并跨多种信息模式进行推理，对底层硬件的需求只会增加。借助 Trillium，Google 已表明其打算继续走在这一变革的前沿，投资于将为下一代 AI 进步提供动力的基础设施。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/gu-ge-xin-kuan-trillium-ai-xin-pian-su-du-ti-sheng-4-bei

Like (0)

王浩然作者

0 0

谷歌推出人工智能编码助手“Jules”，承诺自动修复错误并加快开发周期

Previous 2024年12月12日

OpenAI 推出适用于 iPhone 的 ChatGPT，与 Apple 实现具有里程碑意义的 AI 整合

Next 2024年12月12日

AI前沿

Nvidia 赢得关键设计大奖，将 AI 引入自动驾驶汽车车队

Nvidia宣布已赢得丰田、Aurora 和大陆等汽车制造商的自动驾驶汽车关键设计订单。这些合作伙伴是 Nvidia 不断增长的合作伙伴名单的一部分，他们正在推出下一代高度自动化…

王浩然
2025年1月8日
000
AI前沿

谷歌推出新款AI视频模型Veo 2，每秒使用成本仅需50美分

近日，谷歌公司正式推出了一款全新的AI视频模型——Veo 2。据悉，该模型每秒的使用成本仅为50美分，极大地降低了AI视频制作与应用的门槛。 Veo 2基于谷歌先进的人工智能技术，…

王浩然
2025年2月26日
000
AI前沿

模组制作者正在利用人工智能在《天际》和《星露谷物语》中创造聊天伙伴

在《星露谷物语》中，玩家通常每天只能与角色对话几次。这一限制导致了许多模组的出现，这些模组增加了角色的对话内容，以便玩家可以花更多时间与虚拟伙伴相处。但与许多游戏一样，《星露谷物语…

王浩然
2024年10月19日
000
AI前沿

超级马里奥成AI新基准测试工具‌

近年来，人工智能（AI）领域的发展日新月异，各类基准测试工具层出不穷，用于评估AI模型的性能。而近日，一个令人意想不到的角色——超级马里奥，竟也加入了这一行列，成为衡量AI能力的新…

王浩然
2025年3月5日
000
AI前沿

OpenAI 称其商业用户已达 100 万

OpenAI 的付费商业产品达到了一个里程碑，ChatGPT Enterprise、Team 和 Edu 产品的付费商业用户达到一百万。 100 万用户大关较该公司今年 4 月公…

王浩然
2024年9月9日
000
AI前沿

Gemini 2.0 闪亮登场：闪思（Flash Thinking）融入记忆与Google应用集成

几个月前，Google为其Gemini AI聊天机器人增添了推理模式功能。如今，Gemini 2.0闪思（Flash Thinking）实验性功能进一步扩展，为聊天体验带来了更多特…

王浩然
2025年3月17日
000
AI前沿

微软的 TorchGeo 如何为机器学习专家简化地理空间数据

在当今数据驱动的世界中，地理空间信息对于洞察气候变化、城市发展、灾害管理和全球安全至关重要。尽管地理空间数据潜力巨大，但由于其规模、复杂性和缺乏标准化，处理地理空间数据面临着重大挑…

点点
2024年10月5日
000
AI前沿

振动编码在企业级AI工具中的应用：全面覆盖开发全生命周期

随着人工智能技术的飞速发展，振动编码（Vibe Coding）现象正逐渐从一个小众概念演变为主流开发方法。开发者们日益依赖AI来生成和辅助编写代码，GitHub Copilot等工…

王浩然
8小时前
000
AI前沿

谷歌云安全主管警告：网络防御必须不断发展以应对人工智能滥用

虽然许多现有的风险和控制可以应用于生成人工智能，但这项突破性的技术也有许多细微差别，需要新的策略。模型容易产生幻觉或产生不准确的内容。其他风险包括通过模型输出泄露敏感数据、模型…

王浩然
2024年11月3日
000
AI前沿

从自动驾驶到机器人，群体智能将掀开AI下一篇章？

在近期的2024 Inclusion·上海外滩大会上，Kevin Kelly对未来世界做出了新的假想：全球主义正在迅速推进，正在共同构建一个基于技术的“超级计算机”。每一台手机、笔…

点点
2024年9月13日
000
AI前沿

Regal 声称其客户服务聊天机器人比大多数聊天机器人都要好

人们通常对客服聊天机器人持怀疑态度，许多人甚至直接鄙视它们。在最近的 Gartner调查中，64% 的消费者表示，他们更希望公司在客户服务中不使用任何类型的人工智能（包括聊天机器人…

王浩然
2024年10月31日
000
AI前沿

xAI 以每月价值 25 美元的 API 积分吸引开发者，并支持 OpenAI、Anthropic SDK

我们已经知道这一点有一段时间了，但现在我们可以确定的是：生成式人工智能竞赛对于开发人员来说就像对于最终用户来说一样是一场竞赛。举个例子：今天，埃隆·马斯克的 xAI（社交网络 X…

王浩然
2024年11月6日
000
AI前沿

谷歌推出全新 AI 视频生成器 Veo 2，观众评分高于 Sora

谷歌将推出其最新版本的视频生成模型 Veo 2，与OpenAI的 Sora展开正面交锋，据称，Veo 2可以制作出更加逼真的视频。该公司还更新了其图像生成模型 Imagen 3，…

王浩然
2024年12月19日
000
AI前沿

马克·贝尼奥夫警告称，人工智能虽然有用，但被夸大了，并将部分责任归咎于微软

科技行业最热衷炒作的人之一、Salesforce 首席执行官马克·贝尼奥夫 (Marc Benioff) 想让你知道，他对生成式人工智能充满期待，但即便如此，他也不认为它能做到其最…

点点
2024年10月18日
000
AI前沿

人工智能如何改变零售业：视频分析的作用

人工智能已成为重塑全球行业不可或缺的工具，零售业也不例外。从增强客户体验到优化运营，人工智能驱动的技术正在对整个零售生态系统产生深远影响。最引人注目的创新之一是视频分析，它通过使用…

王浩然
2025年1月12日
000
AI前沿

WP Engine 申请禁令以恢复其 WordPress.org 访问权限

网络托管服务提供商 WP Engine 已向北加州一家法院提交了禁令，要求其介入并恢复其对WordPress.org 开源存储库的访问权限。上个月， WP Engine 对 Wo…

王浩然
2024年10月23日
000
AI前沿

Midjourney结束了必须使用Discord来生成AI图片的时代

Midjourney是否因竞争对手数量激增而感到压力？随着越来越多的公司进入AI图像生成领域，竞争自然会加剧，用户也会有更多选择。因此，Midjourney可能会感到一些压力，并…

王浩然
2024年8月23日
000
AI前沿

长期政策研究员 Miles Brundage 离开 OpenAI

OpenAI 长期政策研究员、公司 AGI 准备团队高级顾问 Miles Brundage 已离职。布伦戴奇在周三 X 上的一篇文章以及他的时事通讯中的一篇文章中表示，他认为作为…

王浩然
2024年10月25日
000
AI前沿

DataStax 首席执行官：2025 年将是我们真正看到人工智能转型的一年

当企业领导者努力应对实施生成式人工智能的复杂性时，DataStax 首席执行官 Chet Kapoor 提出了一个令人放心的观点：当前的挑战是技术革命的正常组成部分，2025 年将…

王浩然
2024年9月22日
000
AI前沿

为什么我的iPhone没有充电？

当您插入iPhone或将其放在无线充电器上为电池充电时，可是它还没有立即充电。发生了什么？很多事情都可能出错。让我们来看看一些最常见的iPhone充电问题，以及您可以做些什么。使…

free
2024年9月26日
000