人工智能往往会编造事实。这对于几乎所有经常使用人工智能的人来说都是不具吸引力的,尤其是对于企业来说,错误的结果可能会损害企业的利润。在 Salesforce 最近的一项调查中,半数员工表示,他们担心公司生成的人工智能系统给出的答案不准确。
虽然没有技术可以解决这些“幻觉”,但有些技术可以提供帮助。例如,检索增强生成 (RAG ) 将 AI 模型与知识库配对,在模型回答之前为其提供补充信息,作为一种事实核查机制。
由于对更可靠的人工智能的需求极高,整个企业都建立在 RAG 之上。Voyage AI 就是其中之一。Voyage 由斯坦福大学教授马腾宇于 2023 年创立,为 Harvey、Vanta、Replit 和 SK Telecom 等公司的 RAG 系统提供支持。
马云在接受采访时表示:“Voyage 的使命是提高企业 AI 搜索和检索的准确性和效率。Voyage 的解决方案针对特定领域量身定制,例如编码、金融、法律和多语言应用,并针对公司的数据量身定制。”
为了启动 RAG 系统,Voyage 训练 AI 模型将文本、文档、PDF 和其他形式的数据转换为数字表示形式(称为矢量嵌入)。矢量嵌入以紧凑的格式捕获不同数据点之间的含义和关系,使其适用于与搜索相关的应用程序(如 RAG)。
Voyage 使用一种称为上下文嵌入的特殊嵌入类型,它不仅可以捕获数据的语义含义,还可以捕获数据出现的上下文。例如,给定句子“我坐在河岸上”和“我把钱存入银行”中的“银行”一词,Voyage 的嵌入模型将为每个“银行”实例生成不同的向量 – 反映上下文所暗示的不同含义。
Voyage 托管并授权其模型用于本地、私有云或公共云,并为选择付费的客户微调其模型。该公司在这方面并不是独一无二的——OpenAI 也有一个可定制的嵌入服务——但 Ma 声称 Voyage 的模型以更低的成本提供了更好的性能。
“在 RAG 中,当提出问题或查询时,我们首先从非结构化知识库中检索相关信息,就像图书管理员在图书馆中搜索书籍一样,”他解释道。“传统的 RAG 方法在信息编码过程中经常会遇到上下文丢失的问题,导致无法检索相关信息。Voyage 的嵌入模型具有一流的检索精度,这转化为 RAG 系统的端到端响应质量。”
OpenAI 主要竞争对手 Anthropic 的认可为这些大胆声明提供了依据;Anthropic 的一份支持文件将 Voyage 的模型描述为“最先进的”。
马云表示:“Voyage 的方法使用经过公司数据训练的矢量嵌入来提供上下文感知检索,这显著提高了检索准确性。”
马云表示,总部位于帕洛阿尔托的 Voyage 拥有 250 多名客户。他拒绝回答有关收入的问题。
9 月,拥有约 12 名员工的 Voyage 完成了由 CRV 领投的 2000 万美元 A 轮融资,其他参投方包括 Wing VC、Conviction、Snowflake 和 Databricks。马云表示,这笔资金将使 Voyage 的总融资额达到 2800 万美元,用于支持新嵌入模型的推出,并使公司规模扩大一倍。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/voyage-ai-zheng-zai-gou-jian-rag-gong-ju-yi-jian-shao-ai