Nvidia和DataStax今天推出了一项新技术,可大幅降低部署生成式 AI 系统的公司的存储要求,同时实现跨多种语言的更快、更准确的信息检索。
新的Nvidia NeMo Retriever 微服务与DataStax 的 AI 平台相结合,与传统方法相比,将数据存储量减少了 35 倍——这是一项至关重要的功能,因为预计到 2027 年企业数据将达到 20 ZB 以上。
Nvidia 人工智能产品管理副总裁 Kari Briski 在接受采访时表示:“如今企业的非结构化数据达到 11 ZB,大约相当于 80 万份美国国会图书馆的藏书,其中 83% 是非结构化数据,50% 是音频和视频。大幅降低这些存储成本,同时让企业能够有效地嵌入和检索信息,将成为改变游戏规则的关键。”
维基媒体将处理时间从 30 天缩短至 3 天
这项技术已经为维基媒体基金会带来了变革,该基金会利用集成解决方案将 1000 万条维基百科条目的处理时间从 30 天缩短至 3 天以内。该系统每天处理由 24,000 名全球志愿者编辑的数十万条条目的实时更新。
DataStax 首席执行官 Chet Kapoor 解释道:“你不能只依赖大型语言模型来获取内容,你需要从现有企业数据中获取背景信息。这就是我们的混合搜索功能发挥作用的地方,它将语义搜索和传统文本搜索相结合,然后使用 Nvidia 的重新排序技术在全球范围内实时提供最相关的结果。”
企业数据安全与人工智能可访问性相结合
此次合作解决了企业面临的一个关键挑战:如何让人工智能系统可以访问其大量的私人数据,而不会将敏感信息暴露给外部语言模型。
“以联邦快递为例,60% 的数据都存储在我们的产品中,包括过去 20 年的所有包裹递送信息和个人信息。Gemini 或 OpenAI 近期或将来都不会获得这些数据,”卡普尔解释道。
该技术正在各个行业得到早期采用,尽管存在监管限制,但金融服务公司仍处于领先地位。“金融服务公司现在的领先优势让我震惊,”卡普尔以澳大利亚联邦银行和Capital One为例说道。
人工智能的下一个前沿:多模式文档处理
展望未来,Nvidia 计划扩展该技术的功能,以处理更复杂的文档格式。“我们在多模式 PDF 处理方面取得了很好的成果——理解表格、图形、图表和图像以及它们在各个页面之间的关系,”Brisk 透露。“这是一个非常困难的问题,我们很高兴能够解决它。”
对于在尝试负责任地部署 AI 的同时却被非结构化数据淹没的企业,新产品提供了一种途径,使其信息资产能够为 AI 做好准备,同时又不会损害安全性或花费大量存储成本。该解决方案可通过Nvidia API 目录立即获得,并提供 90 天免费试用许可证。
该公告强调,随着企业从实验转向大规模部署,企业对企业人工智能基础设施的关注度日益提高,数据管理和成本效率成为关键的成功因素。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/nvidia-he-datastax-rang-sheng-cheng-shi-ren-gong-zhi-neng