建数据中心,可能是各家AI大厂最重要的事情之一。
这两年,科技巨头的年化资本支出,从1380亿美元同比增长到2290亿美元,这多花的910亿美元,有一大部分花在了AI数据中心建设上。比如,OpenAI、微软、xAI和Meta等大型Al Labs都准备建设10万GPU集群。
但你可能不知道,建数据中心不是一个简单的事情。不仅需要购买足够的土地、钢铁,还需要配套足够的电力和水资源,不仅建设难度大,周期还相当漫长。
所以,红杉美国合伙人David Cahn曾提出过一个观点:“基建效率”可能比“研究突破”更重要。
当然,为了更好地解决科技巨头们的算力焦虑,也有很多人开始另辟蹊径。既然陆地上的数据中心不好建,为什么不去太空建呢?
年初,美国初创公司Lumen Orbit就提出了一个在太空建设AI数据中心的项目。目前,这个项目已经获得了英伟达的支持。
明年5月,Lumen Orbit第一颗搭载数据中心的卫星将由SpaceX火箭发射上太空。
太空数据中心,会成为美国这一轮算力竞争的最终答案吗?
01 数据中心,成美国AI最大“拦路虎”
很多人可能不太理解,建个数据中心为什么难度这么大?
原因其实很简单,由于AI数据中心计算量极为庞大,对相应的电力、水、土地等配套资源也提出了很高的要求。
就拿电力来说,AI数据中心可是名副其实的耗电怪兽,巨能吃。为了保证数据中心的设备(服务器、交换机等)每天24小时正常运行,需要每天24小时持续不间断供电。
以全球最大AI训练集群Memphis Supercluster为例,其拥有的10万GPU集群一年消耗16亿度电,相当于15万个家庭一年的用电量。据IEA笼统计算,2022年全球数据中心消耗约460太瓦时(4600亿度电)的电量,而这一数字到2026年可能膨胀至620至1050太瓦时。
▲全球数据中心电力需求趋势和预测(来源:Semianalysis)
除了缺电,AI数据中心也很缺水。
机房里成千上万台服务器在运行过程中会发热,为了服务器、交换机等IT设备的安全,需要给它们降温。
目前,大多数数据中心使用风扇循环空气以降低温度。但由于AI芯片性能过于强大,产生的热量更多,会超过目前这种冷却系统的极限。
所以,只能配套更高效的冷却方法,于是很多AI数据中心开始选择液冷系统。顾名思义,这种方法就相当于把服务器做到防水,然后通过水流带走热量。
这个方法唯一的不足就是,要用大量的水。比如,光谷歌数据中心在2022年的耗水量达到了2110万立方米,相当于一个山西晋阳湖全年的蓄水量。按照这种趋势,到2030年,数据中心每天就要消耗17亿升水,相当于一年抽干一个日内瓦湖。
即使AI厂商搞定了水电,土地也是另一个大问题。
一个数据中心需要的规模远远超过你的想象。就拿美国盐湖城园区的大型数据中心为例,整个数据中心占地约40.5万平方米,面积相当于57个标准足球场,园区内只放了3000个机柜。
以上还只是建设数据中心看得见的困难,这还没算上,大型基建所需要面临的各种许可要求和环境审查等隐形成本。
也正因为陆地建设数据中心的难度越来越大,于是更多的解决方案开始出现,太空数据中心就是其中之一。
02 获英伟达强力支撑,数据中心运营成本大降95%
比起陆地建数据中心,太空数据中心的好处大致可以总结为:成本低、部署快。
首先,让GPU在太空中完成运算,全程利用7*24h的太阳能供电。由于太阳能电池的价格非常低,在太空中部署的发电量也数倍于地球,据Lumen Orbit估算,太空数据中心的能源成本比地球的价格低22倍。
▲在晴朗天气下,蓝线为地球表面的太阳辐照度,黄线为太空中的太阳辐照度,后者的太空数据中心可以获得比前者高40%的日照度。(来源:ieeexplore)
而且太空,非常冷!太空的背景温度只有-270℃,接近绝对零度(-273.15℃)。极低温度对于GPU卫星来说就是“液冷装置”。
Lumen Orbit部署的卫星会卡在晨昏线上,为的就是一边享受太阳能,一边让GPU集群在地球背面的黑夜里低温运作。
▲meme图:多数人误解了太空中没有办法产生冷却,认为数据中心不应该放在太空中
以工作10年来算,维系一个地球数据中心的日常运作,需要花费1.67亿美金,一个与之规模相同的太空数据中心只需要820万美金,省下了95%的成本。
▲Lumen Orbit估算在太空和地面上建设数据中心的成本比较(来源:Lumen Orbit)
除了成本很低,太空数据中心的优势还有可扩展性。太空数据中心可以在原来的卫星集群基础上,叠加卫星,不受土地规划限制、物理空间限制。
对比地面上的数据中心,太空数据中心的部署速度可能会快得多。一个微型太空数据中心的部署过程可能不到一年的时间。另外,这种在太空中的模块化部署方式,因为不受用电许可证、用地许可证的限制,可以顺利、快速地扩展来满足商业需求。
一些公司正在把数据中心上太空变成现实。今年1月刚刚成立的Lumen Orbit就是其中之一。
自太空数据中心计划提出以来,已有20多家投资者争相出手支持,其中不乏英伟达、YC这样的科技巨头和投资风向标。
3月,Lumen Orbit获得了240万美元种子前融资(Pre-seed funding),投资者包括Nebular、Caffeinated Capital、Plug & Play、Everywhere Ventures、Tiny、Sterling Road、Pareto Holdings和Foreword Ventures等8家公司,以及10+名天使投资者,连红杉资本的“侦察兵计划”也看中了Lumen Orbit。
“这轮融资超额认购了3倍”,公司CEO透露道。
这个太空项目目前获得了价值超3000万美元的谅解备忘录(不正式书面约定),据了解,一颗卫星的发射成本约为500万美元。
不出意外的话,Lumen Orbit将成为第一个成功在太空建设数据中心的公司。
▲Lumen Orbit的GPU高性能卫星的内部架构(来源:Lumen Orbit)
按照Lumen Orbit CEO今年3月份的说法,公司在今年9月将发射第一架由8颗卫星组成的轨道飞机。明年3月之前,公司将发射5个轨道环(如下图所示)。
值得注意的是,这种轨道环是三维架构的,对比地球上二维架构的GPU集群,连接更紧密,能实现数据传输的更低延迟。
▲Lumen Orbit建设轨道环过程的概念图(来源:Lumen Orbit)
明年5月,Lumen Orbit第一颗AI数据中心演示卫星(重60kg)将被SpaceX猎鹰9号火箭送上太空。据称,该卫星将拥有比当前太空中运行的所有GPU强大100倍的板载GPU。
2026年,在xAI旗下的Starship(星链)投入商业服务后,Lumen Orbit便可以建造一个5GW数据中心,几年间,GPU集群卫星的数量就会扩大到300颗。
▲Lumen Orbit的5GW太空数据数据中心概念图(来源:Lumen Orbit)
Lumen Orbit最终目标是建立一个千兆瓦级的轨道超算中心,规模超过地表上任何一座数据中心。9月11日消息,甲骨文宣布正在设计一个1千兆瓦的核电数据中心。
到时候看看“地球派”和“太空派”,谁会竞速成功吧!
03 曾参与NASA项目,团队技术实力硬
当然,这个备受关注的项目,也离不开强大的技术团队支持。
目前,Lumen Orbit公司联创分别是Philip Johnston(CEO)、Ezra Feilden(CTO)和Adi Oltean(CE),他们参与过NASA(美国航空局)“月球探路者”等卫星项目,还有一位曾任SpaceX-Starlink工厂首席软件工程师。
▲从左到右依次为首席执行官Philip Johnston、首席技术官Ezra Feilden和首席工程师Adi Oltean
带头人Philip Johnston在麦肯锡公司工作期间,负责美国航天局的卫星项目。他拿下了三个世界顶府学历:哈佛大学MPA in NST(国家安全与技术专业公共管理硕士)、沃顿商学院MBA(工商管理硕士)、哥伦比亚学MAMTP(应用数学与理论物理硕士)。
10年卫星设计经验的老兵Ezra Feilden曾负责美国宇航局的“月球探路者”项目,他有Oxford Space Systems(牛津太空系统)和SSTL(空中客车防务与航天)公司的工程经验,专攻应用于太空探索、卫星通信等方面的DSA/LDS(可展开太阳能电池阵列/大型可展开结构,前者通常在航天器上使用)技术。
Adi Oltean帮助Lumen Orbit实现GPU训练集群在太空中的计算。他有卫星和GPU集群训练的双重技术背景,在公司中负责卫星星座软件、硬件和工程设计方面。他曾在SpaceX的Starlink(一项通过低轨卫星网提供高速互联网接入服务的项目)项目中负责射频波束成形的工作。
总得来说,Lumen Orbit提出的太空数据中心计划,为解决数据中心建设难题带来了新的思路和可能性。
这个项目不仅代表着技术创新的前沿,更是对传统数据中心模式的一次革命性挑战。更关键的是,它可能彻底改变我们对计算资源的获取和利用方式。
原创文章,作者:点点,如若转载,请注明出处:https://www.dian8dian.com/lao-mei-dou-yao-zai-tai-kong-jian-shu-ju-zhong-xin-le-cheng