2025 年为何将重新定义数据基础设施:11 位专家对主权云、爆炸式增长的数据、PaaS 等的见解

2025 年为何将重新定义数据基础设施:11 位专家对主权云、爆炸式增长的数据、PaaS 等的见解

如果说 2023 年是关于生成式人工智能聊天机器人和搜索,那么2024 年则引入了代理式人工智能——能够在数字环境中规划和执行多步骤操作的工具。从Devin 的工程突破到微软对Copilot Vision的早期试验,创新多种多样,但有一点是不变的:需要保持数据基础设施的有序性和可靠性。

随着企业逐渐转向先进的 AI 计划,一些趋势重塑了数据的管理、保护和使用方式。企业越来越多地采用多云、开放数据和开放治理策略,以避免供应商锁定并获得更大的灵活性。他们还专注于非结构化数据,将数据市场转变为提供预训练 AI 模型和专有数据集和应用程序的中心。同时,矢量和图形数据库的进步增加了新的可能性,为下一步奠定了基础。

现在,随着人工智能故事的不断展开,行业领导者分享了他们对 2025 年支撑人工智能的数据基础设施将如何发展的预测。

1.实时多模式数据将推动智能数据飞轮

“2025 年,企业将全面拥抱多模式数据和人工智能,改变其运营方式并创造价值。这一转变的核心是‘智能数据飞轮’——一个动态循环,实时数据为人工智能驱动的洞察力提供动力,推动持续创新和改进。当今的暗数据——图像、视频、音频和传感器输出——将成为解锁更精确预测、更智能自动化和实时适应性的核心,最终带来对商业现实更丰富、更细致入微的理解。

“有了实时数据飞轮,人工智能将自主诊断问题、优化流程并生成创新解决方案。企业将依靠人工智能代理来确保数据质量、发现见解和制定战略,使人才能够专注于更高级别的任务。这将重新定义效率、加速创新并将企业转变为更具活力和智能的组织。”

– Yasmeen Ahmad,Google Cloud 数据、分析和 AI 战略和外向产品管理总监

2.冷却因素:液冷数据中心

“随着 AI 工作负载继续推动增长,先驱组织将过渡到液体冷却,以最大限度地提高性能和能源效率。超大规模云提供商和大型企业将引领潮流,在容纳数十万个 AI 加速器、网络和软件的新 AI 数据中心中使用液体冷却。

“企业将越来越多地选择在主机托管设施中部署 AI 基础设施,而不是自行构建基础设施 — 部分原因是为了减轻大规模设计、部署和运营智能制造的财务负担。或者,他们将根据需要租用容量。这些部署将帮助企业利用最新的基础设施,而无需自行安装和运营。这种转变将加速行业更广泛地采用液体冷却作为 AI 数据中心的主流解决方案。”

– Nvidia DGX 平台副总裁 Charlie Boyle

3.全球数据爆炸导致存储短缺 

“世界正在以前所未有的速度生成数据。到 2028 年,将生成多达 400 ZB 的数据,复合年增长率 (CAGR) 为 24%。但是,存储安装基数的复合年增长率预计为 17%,因此 [增长] 速度明显低于生成的数据的增长速度。而且构建一个硬盘需要整整一年的时间。这种增长率的差异将破坏全球存储的供需平衡。随着组织在使用 AI 方面变得不那么实验性,而更具战略性,他们将需要构建更大的物理数据中心空间和容量计划,以确保存储供应,并充分实现对 AI 和数据基础设施的投资货币化——同时平衡财务、监管和环境问题。”

– BS Teh,希捷科技执行副总裁兼首席商务官  

4. AI工厂将向PaaS发展

“到 2025 年,人工智能工厂将超越其提供基础设施即服务、提供计算、网络和存储服务的初始阶段,转向提供平台即服务功能。虽然基础服务对于推动人工智能的采用至关重要,但下一波人工智能工厂将优先考虑推动数据亲和力并提供持久价值的平台。这一转变将是使人工智能工厂长期可持续发展和具有竞争力的关键。”

– DataPelago 联合创始人兼首席执行官 Rajan Goyal 

5.公司将使用其海量数据集,但要求可靠性

“大多数情况下,早期的人工智能应用只是使用基于大量公共数据训练的基础模型。随着复杂的 RAG 应用成为主流,以及产品快速成熟以生成结构化数据,利用大量私有企业数据的应用将开始创造真正的价值。但这些应用的门槛很高:企业将要求人工智能应用具有可靠性,而不仅仅是炫酷的演示。

“此外,提供这些模型的人工智能公司必须与出版商和内容提供商保持良好关系,以保障人工智能发展的未来。他们需要与内容提供商签订许可协议,以确保他们能因提供极其有价值的数据而获得补偿。这必须尽快实现,否则就会陷入诉讼和封锁人工智能爬虫的泥潭。”

– Snowflake 首席执行官 Sridhar Ramaswamy

6.企业代理将吞噬通信数据

“到 2025 年,企业将使用提供分析见解、仪表板和可操作的决策支持工具的代理,挖掘数 TB 的通信数据,例如电子邮件、Slack 消息和 Zoom 记录。

“这将推动各行业生产力的大幅提高。”

– Nikolaos Vasiloglou,RelationalAI 研究和机器学习副总裁

7.数据治理和质量将成为成功和合乎道德地采用人工智能的最大障碍

“2025 年,数据治理、准确性和隐私将成为有效采用 AI 的最大障碍。随着组织寻求扩展 AI,人们将意识到成功的 AI 成果完全取决于可靠的数据。管理和准备大量数据、确保合规性和保持准确性将带来复杂的挑战。企业需要通过投资基础数据平台来克服这些障碍,这些平台可实现跨不同数据源的统一管理。 

“因此,我们将看到更加重视与人工智能计划相一致的数据管理角色和治理框架,因为企业认识到不可靠的数据会直接影响人工智能的有效性。”

– EDB 分析、数据和 AI 工程副总裁 Jeremy Kelway

8.统一数据可观察性平台将成为必不可少的工具

“2025 年,统一数据可观测性平台将成为大型企业必不可少的工具,能够全面了解数据基础设施的性能、质量、管道健康状况、成本管理和用户行为,以应对复杂的治理和集成挑战。通过自动检测异常并实现实时洞察,这些平台将支持数据可靠性并简化跨行业的合规工作。”

– Acceldata 联合创始人兼首席技术官 Ashwin Rajeeva

9.向主权云致敬

“到 2025 年,我们将看到主权云和私有云的真正发展。我们已经看到最大的超大规模企业投入数十亿美元在世界各地建设数据中心,以提供这些功能。这种容量需要一段时间才能上线;与此同时,需求将受到一波立法浪潮的推动,这些立法主要来自欧盟。那些拥有灵活、可扩展和弹性云基础设施的企业将能够快速采用主权或私有方法。那些拥有单一、僵化基础设施的企业将落后于时代。”

– Kevin Cochrane,Vultr 首席营销官

10.边缘数据处理的兴起

“我密切关注边缘计算的潜在扩张,这种扩张是由 5G 的普及推动的,5G 让数据处理更接近源头并减少延迟。这可能有助于实现人工智能的民主化。问题是,我们能否构建在移动设备上运行的高效人工智能应用程序,而无需依赖云资源? 

“如果现场技术人员可以使用5G,他们就可以利用人工智能来协助他们的工作——无论是在有5G但没有Wi-Fi的灾区提供诊断和治疗的医疗专业人员,还是利用人工智能辅助研究和实时计算做出现场决策的工程师和科学家。”

– CData 高级技术推广者 Jerod Johnson

11.非结构化数据的保护将变得更加紧迫

“传统上,数据保护侧重于任务关键型数据,因为这些数据需要更快的恢复。然而,形势已经发生了变化,非结构化数据增长到占过去 10 年生成的所有数据的 90%。PB 级的非结构化数据规模巨大,加上其广泛使用和快速增长,使其极易受到勒索软件攻击。网络犯罪分子可以使用非结构化数据作为特洛伊木马来感染企业。以经济高效的方式保护非结构化数据免受勒索软件攻击将成为一项关键的防御策略,首先是将冷的、非活动的数据移动到无法修改的不可变对象存储中。

“为此,IT 和存储主管将寻求非结构化数据管理解决方案,这些解决方案提供自动化功能来保护、细分和审计 AI 中的敏感数据和内部数据使用情况——随着 AI 的成熟,这一用例必将扩大。此外,他们需要为用户创建系统化的方法,以便在公司数据存储中进行搜索、整理正确的数据、检查敏感数据并通过审计报告将数据移动到 AI。”

– Komprise 联合创始人 Krishna Subramanian

总而言之,2025 年有望在企业数据基础设施方面取得重大进展,从多模式数据飞轮到主权云。然而,数据治理和存储短缺等挑战仍将持续存在。在这个充满活力的领域取得成功将取决于在创新与信任和可持续性之间取得平衡,将数据转化为持久的竞争优势。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/2025-nian-wei-he-jiang-chong-xin-ding-yi-shu-ju-ji-chu-she

Like (0)
王 浩然的头像王 浩然作者
Previous 5天前
Next 4天前

相关推荐

发表回复

Please Login to Comment