数据是人工智能的圣杯。从敏捷的初创公司到全球企业集团,世界各地的组织都在投入数十亿美元来调动数据集,以打造高性能的人工智能应用程序和系统。
但即使付出了这么多努力,现实情况是,访问和利用来自不同来源和各种形式(无论是文本、视频还是音频)的数据仍远非无缝。这项工作涉及不同层次的工作和集成,这通常会导致延误和错失商机。
总部位于加州的ApertureData就是个例子。为了应对这一挑战,这家初创公司开发了一个统一的数据层 ApertureDB,将图形和矢量数据库的强大功能与多模式数据管理相结合。这有助于 AI 和数据团队以比传统方式更快的速度将他们的应用程序推向市场。今天,ApertureData 宣布获得 825 万美元的种子资金,同时推出了其图形矢量数据库的云原生版本。
ApertureData 创始人兼首席执行官 Vishakha Gupta说:“ApertureDB 可以将数据基础设施和数据集准备时间缩短 6-12 个月,为首席技术官和首席数据官提供巨大的价值,他们现在需要制定一项战略,以便在数据需求相互冲突的极不稳定环境中成功部署 AI。”她指出,该产品可以使构建多模式 AI的数据科学和机器学习团队的生产力平均提高十倍。
ApertureData 带来了什么?
许多组织发现,管理不断增长的多模式数据(每天数以 TB 计的文本、图像、音频和视频)成为利用人工智能提高性能的瓶颈。
问题不在于缺乏数据(非结构化数据的数量一直在增长),而在于将其投入高级人工智能所需的工具生态系统分散。
目前,团队必须从不同来源获取数据并将其存储在云存储桶中,文件或数据库中的元数据不断变化。然后,他们必须编写定制脚本来搜索、获取或对信息进行一些预处理。
完成初始工作后,他们必须加入图形数据库和矢量搜索和分类功能,以提供计划中的生成式 AI 体验。这使设置变得复杂,导致团队难以完成大量的集成和管理任务,最终导致项目延迟数月。
“企业希望他们的数据层能够让他们管理不同模式的数据,轻松为机器学习准备数据,便于数据集管理,管理注释,跟踪模型信息,并让他们使用多模式搜索来搜索和可视化数据。遗憾的是,他们目前为满足这些要求而选择的解决方案是手动集成解决方案,他们必须将云存储、数据库、各种格式的标签、复杂的(视觉)处理库和矢量数据库整合在一起,以将多模式数据输入转换为有意义的人工智能或分析输出,”Gupta 解释说,他在英特尔处理视觉数据时首次看到了这个问题的端倪。
在这一挑战的推动下,她与英特尔实验室的研究员 Luis Remis 合作,创立了 ApertureData,构建了一个数据层,可以在一个地方处理与多模式 AI 相关的所有数据任务。
由此产生的产品 ApertureDB 如今允许企业集中所有相关数据集(包括大型图像、视频、文档、嵌入及其相关元数据),以便高效检索和处理查询。它存储数据,为用户提供统一的架构视图,然后提供知识图谱和向量搜索功能,供整个 AI 管道的下游使用,无论是用于构建聊天机器人还是搜索系统。
“通过数百次对话,我们了解到我们需要一个不仅了解多模式数据管理的复杂性,而且了解 AI 要求的数据库,以便 AI 团队轻松采用并在生产中部署。这就是我们用 ApertureDB 构建的,”Gupta 补充道。
它和市场上的有什么不同?
虽然市场上有大量专注于人工智能的数据库,但 ApertureData 希望通过提供统一的产品来为自己创造一个利基市场,该产品可以本地存储和识别多模态数据,并轻松将知识图谱的强大功能与快速多模态向量搜索相结合,用于人工智能用例。用户可以轻松存储和深入研究其数据集之间的关系,然后使用 AI 框架和工具来针对目标应用程序进行选择。
“我们真正的竞争对手是内部构建的数据平台,该平台结合了关系/图形数据库、云存储、数据处理库、矢量数据库等数据工具以及内部脚本或可视化工具,用于将不同模式的数据转化为有用的见解。我们通常会取代现有的数据库,如 Postgres、Weaviate、Qdrant、Milvus、Pinecone、MongoDB或Neo4j——但在多模式或生成式 AI 用例的背景下,”Gupta 强调道。
ApertureData 声称,其当前版本的数据库可以轻松将数据科学和 AI 团队的生产力平均提高 10 倍。事实证明,在调动多模态数据集方面,它比其他解决方案快 35 倍。同时,在矢量搜索和分类方面,它比市场上现有的开源矢量数据库快 2-4 倍。
这位首席执行官没有透露客户的具体名称,但指出他们已经获得了部分财富 100 强客户的部署,其中包括一家大型家居用品零售商、一家大型制造商以及一些生物技术、零售和新兴人工智能初创公司。
“在我们的整个部署过程中,我们从客户那里听到的共同好处是生产力、可扩展性和性能,”她说,并指出该公司为其中一位客户节省了 200 万美元。
下一步,该公司计划继续这项工作,扩展新的云平台以适应新兴的人工智能应用,专注于生态系统整合,为用户提供无缝体验,并扩展合作伙伴部署。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/aperturedata-shi-yong-duo-mo-shi-shu-ju-wei-qi-ye-ti-gong