Pinecone 通过级联检索扩展矢量数据库，将企业 AI 准确率提高高达 48%

王浩然 • 2024年12月3日下午3:00 • AI前沿 • 122 views

近年来，Pinecone 已成为领先的原生矢量数据库平台之一。Pinecone 凭借新功能继续在竞争日益激烈的市场中脱颖而出，帮助解决企业 AI 挑战

今天，Pinecone 宣布了其同名向量数据库平台的一系列更新。这些更新包括一种新的级联检索方法，该方法结合了密集和稀疏向量检索的优点。Pinecone 还部署了一套新的重新排名技术，旨在帮助提高向量嵌入的准确性和效率。该公司声称，这些新创新将帮助企业构建准确率提高 48% 的企业 AI 应用程序。

Pinecone 的员工产品经理 Gareth Jones 表示：“我们正尝试扩展我们的核心矢量数据库，以从根本上解决更广泛的检索挑战。”

理解密集向量和稀疏向量之间的区别

到目前为止，Pinecone 与许多其他矢量数据库技术一样，依赖于密集矢量。

琼斯解释说，密集文本嵌入模型会产生固定长度的向量，用于捕捉语义和上下文含义。它们对于保持上下文非常有用，但对于关键字搜索或实体查找则不那么有效。他指出，密集模型有时会难以处理电话号码、零件编号和其他特定实体等概念，除非进行重大微调。

相比之下，稀疏索引可以实现更灵活的关键字搜索和实体查找。Pinecone 正在添加稀疏索引，以解决单独使用密集向量搜索的局限性。总体目标是提供更全面的检索解决方案。

将关键词类型搜索与向量相结合的想法并不新鲜。这个概念通常被归类为“混合搜索”。琼斯将新的 Pinecone 方法称为级联检索。他认为，它不同于一般的混合搜索。

Jones 表示，级联检索不仅仅是一种并行运行密集和稀疏索引的简单混合方法。该方法涉及在密集和稀疏检索的基础上添加一组级联改进，例如重新排序模型。级联方法结合了不同技术的优势，而不仅仅是对结果进行基于分数的基本融合。

重新排序如何进一步提高 Pinecone 矢量数据库的准确性

Pinecone 还通过整合一系列新的重新排序技术来提高结果的准确性。

AI 重新排序器是企业 AI 堆栈中的关键工具，用于优化查询结果的顺序或“排名”。Pinecone 的更新包括多个重新排序选项，包括 Cohere 最新的 Rerank 3.5 模型和 Pinecone 自己的高性能重新排序器。

通过构建自己的重排序技术，Pinecone 旨在进一步在拥挤的矢量数据库市场中脱颖而出。新的 Pinecone 重排序是该公司开发的第一批重排序，旨在提供最佳结果，尽管会有一些延迟影响。根据 Pinecone 自己的分析，在使用 Benchmarking-IR (BEIR) 基准的评估中，其新的 pinecone-rerank-v0 本身可以将搜索准确率提高高达 60%。新的 pinecone-sparse-english-v0 重排序模型有可能将基于关键字的查询的性能提高高达 44%。

这些重新排序组件的主要优势在于，它们允许 Pinecone 通过结合密集和稀疏索引的输出来提供优化的检索结果。这对企业来说很重要，因为它允许他们整合检索堆栈并获得更好的性能，而无需管理多个供应商或模型。Pinecone 的目标是提供一个紧密集成的堆栈，用户只需发送文本即可获得重新排序的结果，而无需管理底层组件的开销。

除了平台内有更多功能外，琼斯还强调，它是一款无服务器产品，可帮助企业优化成本。该平台的无服务器架构可根据实际使用模式自动处理扩展。

“我们采用无服务器付费模式，”琼斯表示。“人们在特定日期访问其应用程序的流量看起来非常不同，无论是查询还是将文档写入索引……我们处理所有这些，因此他们不会在任何特定时间过度配置。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/pinecone-tong-guo-ji-lian-jian-suo-kuo-zhan-shi-liang-shu

AI Cohere Pinecone Rerank 3.5 矢量数据库级联检索

Like (0)

王浩然作者

0 0

Hume 推出语音控制功能，让用户和开发者可以发出自定义 AI 声音

Previous 2024年12月3日

Cohere 的 Rerank 3.5 现已发布，它将彻底改变企业搜索

Next 2024年12月3日

AI前沿

有没有想过拍广告？这家航空公司将利用人工智能的力量实现这一目标

你可以成为一部浪漫电影的主角，宣传一家航空公司和全球旅行，或者至少你的脸可以成为主角，这要感谢卡塔尔航空的新活动。该航空公司推出了一项新的人工智能冒险活动，将短片和深度伪造工具结合…

王浩然
2024年9月9日
000
AI前沿

Gemini 现在可以判断你的手机屏幕上是否有 PDF

据Android Police报道，在最新版本的 Files by Google 应用中，在查看 PDF 时召唤 Gemini 可让你选择询问文件。不过，据 Mishaal Rah…

王浩然
2024年12月28日
000
AI前沿

呼吁人工智能平台适度引入拟人化

观点：在虚构的《星球大战》宇宙中，没有人认真对待人工智能。在乔治·卢卡斯 47 年前的科幻系列电影中，人类历史时间轴上不存在来自奇点和机器学习意识的威胁，人工智能仅限于自主移动机器…

点点
2024年10月15日
000
AI前沿

Arize AI：期望在AI可观测性领域抢占先机

Arize AI，一家专注于人工智能可观测性的创新企业，近期表达了其对于在AI可观测性领域取得先发优势的热切期望。该企业深知，在AI技术日新月异的当下，如何有效监测、评估和优化AI…

王浩然
2025年2月24日
000
AI前沿

D-ID 推出可进行实时对话的全新高质量虚拟形象

AI 视频平台 D-ID 今天宣布推出两种用于内容创作的新类型化身——Express 和 Premium+。各家公司都在追逐创造更像人类的人工智能形象的金蛋，这些形象可能会减轻企…

王浩然
2024年11月2日
000
AI前沿

信用之光：Experian AI框架如何改变金融准入

在当今这个快速变化的世界，人工智能（AI）正逐渐成为各行各业的核心驱动力。而在信用评分和金融服务领域，Experian，这家全球领先的信用局，正以其独特的AI框架引领一场变革，为无…

王浩然
2025年3月31日
000
AI前沿

GPT-4o 如何保护你的身份免受人工智能生成的深度伪造攻击

2024 年，深度伪造事件激增，预计今年将增加 60% 或更多，全球案件将达到15 万起或更多。这使得人工智能驱动的深度伪造攻击成为当今增长最快的对抗性人工智能类型。德勤预测，到 …

王浩然
2024年10月6日
000
AI前沿

谷歌的 NotebookLM 现在可让你指导 AI 播客的主持人

Google 的 NotebookLM 现在允许您自定义其类似播客的音频概览。在使用笔记应用发起讨论之前，您可以向 AI 主持人发出指示，告诉他们您希望他们关注什么主题，甚至可以针…

王浩然
2024年10月20日
000
AI前沿

人工智能中的幻觉：葛兰素史克如何解决药物开发中的关键问题

生成式人工智能已成为许多行业的关键基础设施，医疗保健也不例外。然而，随着葛兰素史克等组织不断突破生成式人工智能所能实现的界限，它们面临着重大挑战——尤其是在可靠性方面。幻觉，即人工…

王浩然
2025年1月15日
000
AI前沿

Meta 的 AI 负责人表示，世界模型是实现“人类水平的 AI”的关键，但可能还需要 10 年时间

当今的人工智能模型真的能像人脑一样记忆、思考、规划和推理吗？一些人工智能实验室会让你相信它们是的，但根据 Meta 首席人工智能科学家 Yann LeCun 的说法，答案是否定的。…

点点
2024年10月19日
000
AI前沿

微软希望与 OpenAI 建立开放关系

微软和 OpenAI 之间有着某种共生关系，前者向一家初创的人工智能实验室投入了数十亿美元的资金，作为回报，微软获得了尖端模型的早期使用权，这些模型现已融入微软的生产力软件套件中。…

王浩然
2024年12月25日
000
AI前沿

字节跳动发布Seed-Thinking-v1.5，进军推理AI领域

在AI技术日新月异的今天，各大科技巨头纷纷在推理AI领域展开激烈角逐。近日，字节跳动，这家以TikTok闻名的中国互联网巨头，也正式宣布推出其最新的大型语言模型——Seed-Thi…

王浩然
1天前
000
AI前沿

谷歌的 AlphaChip 如何重新定义计算机芯片设计

人工智能 (AI) 的发展正在迅速改变我们的工作、学习和联系方式，从而改变全球各行各业。这种转变主要由 AI 从更大的数据集中学习的高级能力推动。虽然更大的模型可以提高 AI 的数…

王浩然
2024年11月10日
000
AI前沿

数据新时代的交易枢纽：Carbon Arc打造授权交易数据市场，赋能LLMs与企业应用

在数据被誉为“新石油”的当今时代，数据的重要性不言而喻。然而，尽管数据被视为一种宝贵的资源，但其交易与流通却远不如石油那样顺畅。数据的获取往往伴随着法律纠纷与版权问题，使得企业在追…

王浩然
2025年3月24日
000
AI前沿

加州否决人工智能法案可能会让规模较小的开发者和模型“蓬勃发展”

加州州长加文·纽瑟姆否决了 SB 1047法案，许多人认为该法案将改变加州乃至整个国家的人工智能发展格局。周日公布的否决结果可能会让人工智能公司有机会证明他们能够主动保护用户免受人…

大龄程序员
2024年10月3日
000
AI前沿

如何将 RAG 与流数据库相结合来改变实时数据交互

虽然GPT-3和Llama等大型语言模型 (LLM) 的功能令人印象深刻，但它们通常需要更多信息和更多特定领域数据的访问权限。检索增强生成(RAG) 通过将 LLM 与信息检索相结…

点点
2024年10月12日
000
AI前沿

DataStax 首席执行官：2025 年将是我们真正看到人工智能转型的一年

当企业领导者努力应对实施生成式人工智能的复杂性时，DataStax 首席执行官 Chet Kapoor 提出了一个令人放心的观点：当前的挑战是技术革命的正常组成部分，2025 年将…

王浩然
2024年9月22日
000
AI前沿

OpenAI 科学家 Noam Brown 震惊 TED AI 大会：“20 秒思考价值 100,000 倍以上数据”

OpenAI首席研究科学家Noam Brown周二在旧金山举行的TED AI 大会上发表了一场关于人工智能未来的有力演讲，特别关注OpenAI 的新 o1 模型及其通过战略推理、高…

王浩然
2024年10月25日
000
AI前沿

谷歌Gemini新功能：现在可通过视频或屏幕内容提问‌

在不断创新与进步的科技浪潮中，谷歌再次引领潮流，为其Gemini搜索平台带来了革命性的新功能。近日，谷歌宣布Gemini已支持用户通过上传视频或利用屏幕截图中的内容来提问，这一变革…

王浩然
2025年3月4日
000
AI前沿

Zyphra 的新 Zyda-2 数据集可让企业以高精度训练小型 LLM

Zyphra Technologies是一家致力于开发多模式代理系统的公司，该系统结合了下一代状态空间模型架构、长期记忆和强化学习方面的先进研究，该公司刚刚发布了 Zyda-2，这…

王浩然
2024年10月19日
000