如果说我们从人工智能时代学到了什么,那就是这个行业正在努力应对巨大的能源挑战。这些挑战既是字面意义上的挑战——比如如何找到满足人工智能数据中心巨大能源需求的方法——也是比喻意义上的挑战——比如基于狭隘的商业利益而非更广泛的社会利益,人工智能财富集中在少数人手中。
人工智能权力悖论:高成本、集中控制
要想让人工智能取得成功并造福人类,它必须无处不在。要变得无处不在,它必须在经济和环境上都是可持续的。这不是我们现在走的道路。对更大、更快的人工智能的狂热争夺更多的是出于短期性能提升和市场主导地位,而不是为了实现可持续和负担得起的人工智能的最佳利益。
打造更强大的人工智能系统的竞争正在加速,但这也付出了巨大的环境代价。尖端人工智能芯片,如 Nvidia 的 H100(高达 700 瓦),已经消耗了大量能源。这一趋势预计将持续下去,业内人士预测,Nvidia 的下一代 Blackwell 架构可能会将每块芯片的功耗推高到千瓦级,可能超过 1,200 瓦。行业领导者预计全球数据中心将部署数百万个此类芯片,人工智能的能源需求将大幅增加。
人工智能军备竞赛的环境成本
让我们将其放在日常生活中。为整个房子供电的电力可以同时全速运行所有电器——没有人会这样做。现在想象一下,仅一个 120kw 的 Nvidia 机架就需要同样的电量——尤其是当大型数据中心可能有数百或数千台 Nvidia 机架时!现在,1,200 瓦等于 1.2 千瓦。所以实际上,我们谈论的是一个中等规模的社区。一个 120kW 的 Nvidia 机架(基本上是 100 个耗电芯片)需要的电力足以为大约 100 个家庭供电。
鉴于许多社区面临的能源限制,这种趋势令人担忧。数据中心专家预测,未来五到七年,美国将需要 18 至 30 千兆瓦的新容量,这使得各家公司争相寻找应对这一激增的方法。与此同时,我的行业却不断创造更多耗电的生成式人工智能应用,这些应用所消耗的能源远远超出了该应用理论上所需的能源或大多数企业的可行性,更不用说地球所希望的能源了。
平衡安全性和可访问性:混合数据中心解决方案
这种痴迷于速度和能力的人工智能专制和“军备竞赛”忽视了现实世界数据中心的实际需求——即降低市场壁垒的经济实惠的解决方案,而这些市场壁垒对 75% 尚未采用人工智能的美国组织来说至关重要。让我们面对现实吧,随着越来越多的人工智能法规围绕隐私、安全和环境保护出台,越来越多的组织将要求采用混合数据中心方法,将他们最宝贵、最私密和最敏感的数据安全地存放在高度受保护的现场区域,远离人工智能和最近的网络攻击。无论是医疗记录、财务数据、国防机密还是选举诚信,企业人工智能的未来都需要在现场安全性和云敏捷性之间取得平衡。
这是一项重大的系统性挑战,需要高度合作而非高度竞争。由于过度关注 GPU 和其他具有原始能力、速度和性能指标的 AI 加速器芯片,我们未能充分考虑政府和企业采用 AI 功能所需的经济实惠且可持续的基础设施。这就像建造一艘无处发射的宇宙飞船,或者在乡间小路上停放一辆兰博基尼。
人工智能民主化:行业合作
虽然令人欣慰的是,政府开始考虑制定监管措施,确保人工智能惠及所有人,而不仅仅是精英阶层,但我们的行业需要的不仅仅是政府规则。
例如,英国正在利用人工智能来提高执法能力,通过加强执法机构之间的数据共享来改善人工智能驱动的犯罪预测和预防。他们注重人工智能在警务中的透明度、问责制和公平性,确保公众信任和遵守人权——使用面部识别和预测警务等工具来协助犯罪侦查和管理。
在生物技术和医疗保健等受到严格监管的行业中,值得注意的合作包括强生医疗科技公司和 Nvidia 合作增强外科手术中的 AI。他们的合作旨在开发手术室中实时的、由 AI 驱动的分析和决策能力。此次合作利用 NVIDIA 的 AI 平台,在医疗保健环境中实现可扩展、安全且高效的 AI 应用程序部署。
与此同时,在德国,默克公司与 Exscientia 和 BenevolentAI 结成战略联盟,以推进人工智能驱动的药物发现。他们正在利用人工智能加速新药候选物的开发,特别是在肿瘤学、神经病学和免疫学领域。目标是通过人工智能强大的设计和发现能力提高药物开发的成功率和速度。
第一步是降低大型制药公司和科技巨头以外的企业部署人工智能的成本,特别是在人工智能推理阶段——企业每天在真实数据中心安装和运行经过训练的人工智能模型,如 Chat GPT、Llama 3 或 Claude。最近的估计表明,开发这些下一代系统中最大的系统的成本可能约为 10 亿美元,推理成本可能高出 8-10 倍。
在日常生产中实施人工智能的成本飙升,使许多公司无法全面采用人工智能,即“一无所有”的公司。最近的一项调查发现,在过去 12 个月中,只有四分之一的公司成功启动了人工智能计划,42% 的公司尚未从生成式人工智能计划中获得显著收益。
要真正实现人工智能的民主化并使其无处不在(即广泛采用),我们的人工智能行业必须转移重点。我们不应该争相开发最大、最快的模型和人工智能芯片,而是需要更多的协作努力来提高价格承受能力、降低功耗并开放人工智能市场,以更广泛地分享其全部和积极的潜力。系统性变革将使人工智能对所有人都更有利可图,并为消费者带来巨大利益,从而使所有企业受益。
有迹象表明,削减人工智能的成本是可行的——降低财务门槛,以支持大规模的国家和全球人工智能计划。我的公司 NeuReality 正在与高通合作,将各种人工智能应用的成本降低 90%,能源效率提高 15 倍,这些应用涉及文本、语言、声音和图像——人工智能的基本组成部分。你知道那些行业流行语中的人工智能模型,比如计算机视觉、对话式人工智能、语音识别、自然语言处理、生成式人工智能和大型语言模型。通过与更多软件和服务提供商合作,我们可以在实践中不断定制人工智能,以提高性能并降低成本。
事实上,与目前所有 AI 加速器芯片(包括 Nvidia GPU)都依赖的传统以 CPU 为中心的基础设施相比,我们已成功降低了每个 AI 查询的成本和功耗。我们的 NR1-S AI 推理设备于今年夏天开始出货,搭载了与 NR1 NAPU 配对的 Qualcomm Cloud AI 100 Ultra 加速器。其结果是,一种替代的 NeuReality 架构取代了 AI 数据中心中的传统 CPU——这是当今 AI 数据处理的最大瓶颈。这种革命性的变化意义深远,而且非常必要。
超越炒作:构建经济且可持续的人工智能未来
让我们摆脱人工智能的炒作,认真应对系统性挑战。系统层面的艰苦工作需要我们整个人工智能行业共同努力,而不是相互对抗。通过关注可负担性、可持续性和可及性,我们可以创建一个人工智能行业和更广泛的客户群,以更大的方式造福社会。这意味着提供可持续的基础设施选择,而不是将人工智能财富集中在少数人手中,即所谓的七大巨头。
人工智能的未来取决于我们今天的共同努力。通过优先考虑能源效率和可及性,我们可以避免未来由耗电的人工智能基础设施和专注于原始性能而牺牲广泛利益的人工智能寡头统治。同时,我们必须解决不可持续的能源消耗问题,因为这些问题阻碍了人工智能彻底改变公共安全、医疗保健和客户服务的潜力。
通过这样做,我们创建了一个由广泛创新推动的强大的人工智能投资和盈利周期。
原创文章,作者:点点,如若转载,请注明出处:https://www.dian8dian.com/wei-shen-me-bi-xu-tiao-zhan-ren-gong-zhi-neng-du-cai-zhe