随着生成式人工智能的不断进步,对于许多企业来说,一个简单的聊天机器人可能已不再足够。
云计算超大规模提供商正在竞相建立自己的数据库和工具,以帮助企业快速高效地部署运营数据,从而构建既智能又具有情境感知的应用程序。
举个例子:Google Cloud最近对多个数据库产品进行了一系列更新,首先是AlloyDB。
根据该公司的一篇博客文章,完全托管的 PostgreSQL 兼容数据库现在全面支持ScaNN(可扩展最近邻)矢量索引。该技术为其搜索和 YouTube 服务提供支持,并为更快的索引创建和矢量查询铺平了道路,同时消耗更少的内存。
此外,该公司还宣布与 Aiven 合作,托管部署 AlloyDB 以及为 Valkey和Firebase提供 Memorystore 的更新。
了解 ScaNN 对 AlloyDB 的价值
向量数据库对于支持高级 AI 工作负载(从 RAG 聊天机器人到推荐系统)至关重要。
这些系统的核心是关键功能,例如存储和管理向量嵌入(数据的数值表示)以及进行目标应用程序所需的相似性搜索。
由于世界上大多数开发人员都喜欢使用 PostgreSQL 作为首选操作数据库,因此其用于向量搜索的扩展 pgvector 已变得非常流行。Google Cloud 已经在 AlloyDB for PostgreSQL 上支持它,并使用一种称为分层可导航小世界 (HNSW) 的最先进的基于图形的算法来处理向量作业。
然而,当向量工作负载过大时,算法的性能可能会下降,导致应用程序延迟和高内存使用率。
为了解决这一问题,Google Cloud 正在全面推出 AlloyDB 中的 ScaNN 矢量索引。此新索引使用与 Google 搜索和 YouTube 相同的技术,可将矢量查询速度提高 4 倍,将索引构建时间提高 8 倍,同时内存占用量比标准 PostgreSQL 中的 HNSW 索引小 3-4 倍。
谷歌云数据库工程总经理兼副总裁 Andi Gutmans 在一篇博文中写道:“ScaNN 索引是第一个与PostgreSQL兼容的索引,它可以扩展以支持超过 10 亿个向量,同时保持最先进的查询性能——为每个企业提供高性能工作负载。 ”
Gutmans 还宣布与 Aiven 合作,使 AlloyDB Omni(AlloyDB 的可下载版本)可作为托管服务在任何地方运行,包括本地或云端。
“您现在可以在单一平台上跨云运行事务、分析和矢量工作负载,并轻松开始构建新一代 AI 应用程序,而且也可以在任何云上构建。这是首次为 AlloyDB Omni 添加管理和管理层的合作,”他补充道。
Memorystore 适用于 Valkey 和 Firebase 吗?
除了 AlloyDB,Google Cloud 还宣布了对 Memorystore for Valkey、Valkey 内存数据库的完全托管集群和 Firebase 应用程序开发平台的增强功能。
对于 Valkey 产品,该公司表示正在添加向量搜索功能。Gutmans 指出,单个 Memorystore for Valkey 实例现在可以在超过十亿个向量上以个位数毫秒的延迟执行相似性搜索,召回率超过 99%。
他还补充说,Memorystore for Valkey 的下一个版本 8.0 现已公开预览,与 Memorystore for Redist Cluster 相比,其查询速度提高了 2 倍,并采用了新的复制方案、网络增强功能以及对性能和资源使用情况的详细可见性。
至于 Firebase,Google Cloud 正在添加 Data Connect,这是一项新的后端即服务,它将与由Cloud SQL提供支持的完全托管的 PostgreSQL 数据库集成。它将于今年晚些时候进入公开预览阶段。
借助这些发展,Google Cloud 希望开发人员能够拥有更广泛的基础设施和数据库功能选择,以及强大的语言模型,以便为他们的组织构建智能应用程序。这些新进展如何部署到实际用例中还有待观察,但总体趋势表明,预计新一代人工智能应用程序的数量将大幅飙升。
Omdia估计,生成式人工智能应用的市场规模将从 2023 年的 62 亿美元增长到 2028 年的 585 亿美元,复合年增长率为 56%。
原创文章,作者:点点,如若转载,请注明出处:https://www.dian8dian.com/google-cloud-jiang-sou-suo-he-youtube-bei-hou-de-ji-shu-yin