Cohere 为其 RAG 搜索功能添加了视觉功能

王浩然 • 2024年10月25日下午9:00 • AI前沿 • 116 views

Cohere在其搜索模型中添加了多模式嵌入，允许用户将图像部署到 RAG 风格的企业搜索中。

去年推出的Embed 3使用嵌入模型将数据转换为数字表示。嵌入在检索增强生成 (RAG) 中变得至关重要，因为企业可以对其文档进行嵌入，然后模型可以对其进行比较以获取提示所请求的信息。

新的多模态版本可以生成图像和文本中的嵌入。Cohere 声称 Embed 3“现在是市场上最通用的多模态嵌入模型”。Cohere 联合创始人兼首席执行官 Aidan Gomez 在 X 上发布了一张图表，展示了使用 Embed 3 在图像搜索方面的性能改进。

Cohere 在一篇博客文章中表示：“这一进步使企业能够从存储在图像中的大量数据中释放出真正的价值。” “企业现在可以构建系统，准确、快速地搜索重要的多模式资产，如复杂的报告、产品目录和设计文件，以提高劳动力生产率。”

Cohere 表示，更加注重多模式扩展了企业通过 RAG 搜索可以访问的数据量。许多组织通常将RAG 搜索限制在结构化和非结构化文本上，尽管其数据库中有多种文件格式。客户现在可以引入更多图表、图形、产品图像和设计模板。

性能改进

Cohere 表示，Embed 3 中的编码器“共享统一的潜在空间”，允许用户将图像和文本都包含在数据库中。一些图像嵌入方法通常需要为图像和文本维护单独的数据库。该公司表示，这种方法可以实现更好的混合模态搜索。

该公司表示：“其他模型倾向于将文本和图像数据聚类到不同的区域，这会导致搜索结果偏向纯文本数据。另一方面，Embed 3 优先考虑数据背后的含义，而不会偏向特定的模态。”

Embed 3 支持 100 多种语言。

Cohere 表示，多模式 Embed 3 现已在其平台和 Amazon SageMaker 上使用。

奋起直追

由于 Google 等平台和 ChatGPT 等聊天界面引入了基于图片的搜索功能，许多消费者很快就熟悉了多模式搜索。随着个人用户习惯于通过图片查找信息，他们希望在工作生活中获得同样的体验也是合情合理的。

企业也开始看到这种好处，因为其他提供嵌入模型的公司也提供了一些多模态选项。一些模型开发商，如谷歌和OpenAI，提供了某种类型的多模态嵌入。其他开源模型也可以促进图像和其他模态的嵌入。现在的竞争集中在能够以企业要求的速度、准确性和安全性执行的多模态嵌入模型上。

Cohere 是由 Transformer 模型的部分研究人员创建的（Gomez 是著名论文《注意力就是一切》的作者之一），它一直努力成为企业领域许多人关注的焦点。该公司于 9 月更新了 API，允许客户轻松地从竞争对手的模型切换到 Cohere 的模型。当时，Cohere 表示此举是为了与行业标准保持一致，因为客户经常在模型之间切换。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/cohere-wei-qi-rag-sou-suo-gong-neng-tian-jia-le-shi-jue

Like (0)

王浩然作者

0 0

OpenAI 科学家 Noam Brown 震惊 TED AI 大会：“20 秒思考价值 100,000 倍以上数据”

Previous 2024年10月25日

“这是一个游戏规则的改变者”：Runway 发布新的 AI 面部表情动作捕捉功能 Act-One

Next 2024年10月25日

AI前沿

为什么微服务可能会随着单体应用的强势回归而终结

随着科技公司认识到单片架构的局限性，向微服务的转变在 2010 年代初开始获得发展势头。然而，亚马逊 (Prime Video)、Invision、Istio 和 Segment等…

王浩然
2024年12月1日
000
AI前沿

Gemini 2.0 Flash 开启实时多模态 AI 新时代

谷歌本周发布了Gemini 2.0 Flash ，为用户提供了一种与周围环境视频进行实时互动的方式，这为企业和消费者使用技术方式的重大转变奠定了基础。此次发布以及 OpenAI、…

王浩然
2024年12月17日
000
AI前沿

先进的基础模型将如何扩展人工智能的功能

为什么要阅读非 Sam-Altman 和非 AI 博士对AI 的预测？因为早期风险投资家每天都在与比我们聪明得多的人一起工作，这些人将 AI 运用到最前沿。这让我们看到了未来可能发…

王浩然
2024年12月29日
000
AI前沿

Google的Gemini 2.0 Flash：原生多模态AI图像生成引领快速编辑与风格转换潮流

Google近期推出的Gemini 2.0 Flash模型，以其原生多模态AI图像生成能力，在AI界掀起了新一轮的创新风暴。这款模型不仅将文本与图像生成功能融为一体，还实现了快速的…

王浩然
2025年3月17日
000
AI前沿

Fal.ai 是一家提供媒体生成 AI 模型的公司，从 a16z 和其他公司筹集了 2300 万美元

Fal.ai是一个专注于 AI 生成音频、视频和图像开发的平台，今天该公司透露，它已经从 Andreessen Horowitz (a16z)、Black Forest Labs联…

王浩然
2024年9月19日
000
AI前沿

英国签署人工智能安全条约保护人权与民主

英国签署了具有里程碑意义的人工智能安全条约，旨在保护人权、民主和法治免受人工智能可能带来的威胁。大法官沙巴纳·马哈茂德 (Shabana Mahmood) 今天签署了欧洲委员会的…

AI News
2024年9月6日
000
AI前沿

Napkin AI 的人工智能代理“设计机构”正在改变专业人士创作图形的方式

平面设计公司Napkin AI正在垂直 AI 代理应用这一令人兴奋的前沿领域开辟一条独特的道路。用户可以在 Napkin AI 的网站上输入文本，其模型会在五秒内生成代表文本的图…

王浩然
2025年2月12日
000
AI前沿

Meta 的 AI 图像生成器遇到了与其他 AI 艺术生成器相同的障碍

无论你是否喜欢，世界已经决定全面拥抱人工智能。这意味着人工智能融入了一切，甚至你最喜欢的消息应用程序。其中一个应用程序可能是 Meta 的资产之一：WhatsApp、Faceboo…

王浩然
2024年9月30日
000
AI前沿

Anthropic的低调企业政变：Claude 3.7如何成为首选编码代理

引言在人工智能领域，一场静悄悄的革命正在发生。Anthropic，这家相对低调的人工智能公司，凭借其最新的Claude 3.7模型，正在编码代理市场上掀起波澜。Claude 3.…

王浩然
2025年3月19日
000
AI前沿

Agentic AI：重塑企业会议的新篇章

一、引言：超越转录的智能会议助手在数字化转型的浪潮中，企业会议作为沟通协作的核心环节，正经历着前所未有的变革。Agentic AI，作为一种新兴的人工智能技术，正逐步超越传统的语…

王浩然
2025年3月28日
000
AI前沿

AWS 将数据库价格降低近 50%，并增加了分布式扩展功能

AWS正在扩展其云数据库产品组合的功能，同时降低企业成本。在今天的AWS re:invent 2024会议上，这家云计算巨头概述了一系列云数据库创新。其中包括新的 Amazon …

王浩然
2024年12月6日
000
AI前沿

Atlassian 的 Rovo AI 现已正式发布

六个月前， Atlassian首次展示了 Rovo。Rovo是该公司所谓的“AI 队友”，它将更智能的搜索和基于聊天的 AI 工具与代理相结合，可以帮助用户在 Jira 和 Con…

王浩然
2024年10月10日
000
AI前沿

人工智能通过改变行为帮助预防皮肤癌

在过去的一年里，随着越来越多的临床医生在日常实践中测试、使用和整合人工智能伴侣，我们看到了人工智能辅助癌症诊断方面取得的显著成就。皮肤癌也不例外，我们预计未来 AI 诊断工具将广…

点点
2024年9月14日
000
AI前沿

Google NotebookLM 负责人表示，AI 生成的播客将拥有更多控制权

谷歌的NotebookLM是“笔记本语言模型”的缩写，这是一个独立的基于云的 AI 工作区，用户可以在其中上传文档和链接，并通过聊天机器人风格的文本界面向他们提问。最近，它因推出一…

free
2024年10月3日
000
AI前沿

OpenAI 计划从非营利组织转型为营利组织，并向 Altman 提供股权

路透社报道称，OpenAI 正在制定一项计划，将其核心业务重组为一家营利性福利公司，摆脱非营利董事会的控制。这一转变标志着ChatGPT背后的人工智能公司发生了巨大变化，可能会使其…

点点
2024年10月1日
000
AI前沿

AlphaProteo：谷歌DeepMind的蛋白质设计革命

AlphaProteo的出现，意味着我们对蛋白质结构和功能的理解和设计能力，又迈出了一大步。DeepMind团队通过这个系统，展示了他们在蛋白质折叠预测领域的最新进展。

点点
2024年9月7日
000
AI前沿

网站无障碍性现状堪忧：监管加强下多数网站仍未达标‌

在当今这个数字化时代，互联网已经成为人们获取信息、交流互动和进行交易的关键平台。然而，随着各国政府对数字无障碍性的关注度日益提升，一系列旨在保障残障人士等特殊群体网络权益的法规相继…

王浩然
2025年3月29日
000
AI前沿

Vision Pro将在4月融入苹果智能技术

自2021年11月1日起，Yahoo服务在中国大陆地区已无法访问，但这并不妨碍我们关注全球科技领域的最新动态。近日，有消息称，苹果公司的Vision Pro将在4月迎来一次重大更新…

王浩然
2025年2月25日
000
AI前沿

OpenAI已开始组建其机器人团队

OpenAI 以其人工智能模型而闻名，迄今为止，这些模型主要存在于云服务器、其网站以及适用于 PC 和移动设备的应用程序中。不过，该公司的雄心并不局限于软件领域：今天在 X 上，…

王浩然
2025年1月11日
000
AI前沿

代理人工智能与空间计算的融合是否会在人工智能革命中增强人类能动性？

随着人工智能竞赛的起起伏伏继续吸引着商界领袖、投资者和媒体的注意力，最令人兴奋的新兴创新之一是代理人工智能和空间计算，它们将重新定义我们与数字系统和物理环境的互动方式。Gartne…

王浩然
2025年1月14日
000

发表回复

Please Login to Comment

Cohere 为其 RAG 搜索功能添加了视觉功能

性能改进

奋起直追

相关推荐

发表回复

Share To :