今天,亚马逊网络服务 (AWS) 在其年度大型会议re:Invent 2024上宣布了其下一代基于云的机器学习 (ML) 开发平台 SageMaker,将其转变为一个统一的中心,使企业不仅可以整合他们的所有数据资产——跨越 Lakehouse 架构中的不同数据湖和来源——还可以整合一整套 AWS 生态系统分析和以前分散的 ML 工具。
换句话说:Sagemaker 不再只是一个构建 AI 和机器学习应用程序的地方——现在您还可以链接您的数据并从中获取分析结果。
此举响应了分析和人工智能融合的总体趋势,企业用户以互联的方式使用他们的数据,从支持历史分析到支持机器学习模型训练和针对不同用例的生成式人工智能应用程序。
尤其是微软,它一直在努力将其所有数据产品整合到其 Fabric 产品中,并在上个月宣布其更多运营数据库将以原生方式集成。这一切都使客户能够更轻松地开发 AI 应用程序——因为原生数据访问可以使 AI 更快、更高效。微软一直被认为是这一领域的领导者,现在亚马逊正在迎头赶上。
AWS 数据和AI 副总裁 Swami Sivasubramanian 在一份声明中表示:“许多客户已经使用我们专门构建的分析和 ML 工具的组合(单独使用),例如 Amazon SageMaker(处理数据和构建 ML 模型的事实标准)、Amazon EMR、Amazon Redshift、Amazon S3数据湖和 AWS Glue。下一代 SageMaker 将这些功能与一些令人兴奋的新功能结合在一起,为客户提供直接在 SageMaker 中进行数据处理、SQL 分析、ML 模型开发和训练以及生成 AI 所需的所有工具。”
SageMaker Unified Studio 和 Lakehouse 是核心
长期以来,Amazon SageMaker 一直是开发人员和数据科学家的重要工具,为他们提供完全托管的服务来部署生产级 ML 模型。
该平台的集成开发环境 SageMaker Studio 为团队提供了一个基于 Web 的单一可视化界面,可以执行所有机器学习开发步骤,包括数据准备、模型构建、训练、调整和部署。
然而,随着企业需求的不断发展,AWS 意识到将 SageMaker 限制在 ML 部署上是没有意义的。企业还需要专门构建的分析服务(支持 SQL 分析、搜索分析、大数据处理和流分析等工作负载)与现有的 SageMaker ML 功能相结合,并轻松访问所有数据,以推动洞察力并为下游用户提供新体验。
两项新功能:SageMaker Lakehouse 和 Unified Studio
为了弥补这一差距,该公司现已升级 SageMaker,增加两项关键功能:Amazon SageMaker Lakehouse和 Unified Studio。
该公司解释称,Lakehouse 产品提供了对建立在亚马逊简单存储服务 (S3)、Redshift 数据仓库和其他联合数据源之上的数据湖中存储的所有数据的统一访问,打破了数据孤岛并使其易于查询,无论信息最初存储在何处。
该公司在一份新闻稿中指出:“如今,已有超过一百万个数据湖建立在亚马逊简单存储服务上……允许客户集中他们的数据资产,并利用 AWS 分析、AI 和 ML 工具获取价值……客户的数据可能分布在多个数据湖以及数据仓库中,而通过一种简单的方式将所有这些数据统一起来将大有裨益。”
一旦所有数据与 Lakehouse 产品统一,企业就可以访问它并将其与另一项关键功能 SageMaker Unified Studio 一起使用。
从本质上讲,该工作室充当统一的环境,将亚马逊独立工作室、查询编辑器和可视化工具的所有现有人工智能和分析功能串联在一起 – 涵盖 Amazon Bedrock、Amazon EMR、Amazon Redshift、AWS Glue 和现有的 SageMaker Studio。
这避免了单独使用不同工具的耗时麻烦,并为用户提供了一个可以利用这些功能来发现和准备数据、编写查询或代码、处理数据和构建 ML 模型的地方。他们甚至可以在同一环境中调出Amazon Q Developer Assistant 并要求其处理数据集成、发现、编码或 SQL 生成等任务。
因此,简而言之,用户可以在一个地方获得所有数据、所有分析和 ML 工具来支持下游应用程序,包括数据工程、SQL 分析和即席查询到数据科学、ML 和生成式 AI。
Sagemaker 中的 Bedrock
例如,借助 SageMaker Studio 中的 Bedrock 功能,用户可以将他们喜欢的高性能基础模型和工具(如 Agents、Guardrails 和 Knowledge Bases)与他们的 Lakehouse 数据资产连接起来,以快速构建和部署 gen AI 应用程序。
项目执行后,Lakehouse 和 Studio 产品还允许团队发布和与团队成员共享数据、模型、应用程序和其他工件,同时使用具有细粒度安全控制的单一权限模型保持一致的访问策略。这加快了资源的可发现性和重用性,避免了重复劳动。
兼容开放标准
值得注意的是,SageMaker Lakehouse 与 Apache Iceberg 兼容,这意味着它还可以与熟悉的 AI 和 ML 工具以及与 Apache Iceberg 开放标准兼容的查询引擎配合使用。此外,它还包括 Amazon Aurora MySQL 和 PostgreSQL、Amazon RDS for MySQL、Amazon DynamoDB 与 Amazon Redshift 以及 Zendesk 和 SAP 等 SaaS 应用程序的零 ETL 集成。
“SageMaker 产品强调了 AWS 的战略,即以受监管的统一方式展示其先进、全面的功能,因此可以快速构建、测试和使用 ML 和 AI 工作负载。AWS 率先提出了 Zero-ETL 一词,现在它已成为行业标准。很高兴看到 Zero-ETL 已经超越数据库并进入应用程序。通过治理控制和对结构化和非结构化数据的支持,数据科学家现在可以轻松构建 ML 应用程序,”行业分析师 Sanjeev Mohan表示。
新版 SageMaker 现已推出
新的 SageMaker 从今天开始向 AWS 客户开放。不过,Unified Studio 仍处于预览阶段。AWS 尚未公布具体时间表,但表示预计该工作室将很快全面上市。
罗氏和 Natwast Group 等公司将成为新功能的首批用户,后者预计 Unified Studio 将使其数据用户访问分析和 AI 功能所需的时间减少 50%。与此同时,罗氏预计使用 SageMaker Lakehouse 可将数据处理时间缩短 40%。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/aws-sagemaker-zheng-zai-zhuan-xing-wei-shu-ju-he-ai-de-zong