随着生成式人工智能的应用在过去几年中急剧增长,矢量数据库已经从尖端技术发展成为必不可少的企业基础设施。
随着矢量数据库变得越来越重要,企业越来越关注性能和成本。开源Milvus矢量数据库背后的公司Zilliz宣布推出新功能,旨在大幅降低生产部署的成本和复杂性,满足已从初始实验转向全面实施 AI 的企业用户日益增长的需求。
鉴于自 2022 年底以来矢量数据库的采用呈爆炸式增长,OpenAI 的 ChatGPT 激发了人们对 AI 应用的广泛兴趣,这一时机尤为重要。新功能专门针对那些难以应对不断增长的部署规模和在生产环境中管理矢量数据库的复杂性的企业。在短短两年内,部署规模已从数百万个矢量增长到数十亿个矢量。Zilliz 最大的实现现在管理着 1000 亿个矢量。该技术现已部署在各种用例中,包括多模式应用程序、推荐系统、自动驾驶、药物发现、欺诈检测和网络安全。
Zilliz 创始人兼首席执行官 Charles Xie 表示:“在过去的两年里,我们确实看到矢量数据库正在从一种尖端技术转变为一种更主流的技术。
企业 AI 矢量数据库在拥挤市场中的差异化
2024 年,向量数据库技术已成为企业部署 AI 的必备条件。几乎每个数据库供应商都提供某种形式的向量实现,其中包括Oracle、Microsoft、Google、DataStax和MongoDB等。
然而,Milvus 有点不同,因为它是一个专门构建的矢量数据库。在这一类别中,竞争对手包括Pinecone等供应商。虽然肯定还有其他开源矢量数据库技术,但 Milvus 拥有独特的优势,因为它是唯一一个参与 Linux 基金会LF AI & DATA计划的技术。
Milvus 托管在 Linux 基金会的 AI & Data Foundation 之下,这使得它能够从广泛的参与机构和组织生态系统中获得贡献。谢指出,为 Milvus 开源项目贡献代码的组织包括 IBM、Nvidia、Apple、Salesforce 和 Intel。
谢先生表示,开源基础、原生矢量数据库重点以及最重要的专业功能相结合,有助于其公司在拥挤的市场中脱颖而出。谢先生认为,专注于矢量数据库技术使其能够提供比仅将矢量作为另一种数据类型的供应商更全面、更优化的解决方案。
这种专业化使 Zilliz 能够开发专门针对企业向量搜索需求的功能,包括生产环境所需的合规性、安全性和高可用性功能。
Zilliz 如何改进其矢量数据库以满足企业 AI 生产需求
Zillliz Cloud 产品建立在开源 Milvus 数据库之上。该产品为数据库提供管理服务,使组织更容易使用和使用。
作为 Zilliz Cloud 最新更新的一部分,该公司添加了一个自动索引系统,无需手动调整参数。新功能会自动选择最佳索引算法以提供最佳性能,而无需用户手动配置索引。
谢先生说:“开箱即用,您可以获得最佳性能。”
自动索引功能是 Zilix Cloud 为矢量数据库提供“自动驾驶模式”的努力的一部分,使用机器学习算法在后台优化性能。这有助于降低客户的总拥有成本,因为他们无需花费时间和资源进行手动索引调整。
算法优化有助于改善特定的企业 AI 用例
更进一步的是,Zilliz 现在还集成了算法优化器。
该优化适用于 IVF(倒排文件)以及基于图形的矢量检索算法。内存分配和计算性能也针对快速执行进行了优化,该公司声称与未优化的实现相比,速度提高了 3 倍
算法优化器适用于不同的用例,无论组织运行的是文档搜索系统、推荐引擎、欺诈检测还是任何其他基于向量的应用程序。
混合搜索和存储创新有助于降低企业AI成本
新版本还引入了混合搜索功能,将向量相似性搜索与传统的基于关键字的搜索结合在一个系统中。
此次整合使公司能够整合其搜索基础设施并降低运营复杂性。谢解释说,基于关键字的搜索组件利用了行业标准的 BM25 算法以及稀疏索引。
为了解决日益增长的存储成本问题,Zilliz 实施了分层存储系统,使其服务比传统内存矢量数据库更具成本效益。谢先生表示,多层存储层次结构允许大多数数据存储在本地磁盘和对象存储中,这比纯内存解决方案更便宜。
谢先生声称,通过性能和存储方面的新创新,Zilliz 将能够为用户降低矢量数据库的消费成本。
展望未来,Zilliz 对进一步优化成本有着雄心勃勃的计划。
“我在这里做一个非常大胆的预测,未来五年,矢量数据库解决方案的总成本应该会再降低 100 倍。”谢先生说。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/kai-yuan-shi-liang-shu-ju-ku-gong-ying-shang-tong-guo-yun