Cohere 最小、最快的 R 系列模型在 RAG 方面表现出色，能够推理 23 种语言

王浩然 • 2024年12月16日下午3:00 • AI前沿 • 182 views

人工智能初创公司Cohere发布了 Command R7B，这是其 R 模型系列中最小、最快的模型，以证明其支持广泛企业用例的意图，包括那些不需要昂贵、资源密集型的大型语言模型(LLM)的用例。

Command R7B 旨在支持快速原型设计和迭代，并使用检索增强生成 (RAG) 来提高其准确性。该模型的上下文长度为 128K，支持 23 种语言。Cohere 表示，它在数学和编码等任务中的表现优于同类开放权重模型中的其他模型——谷歌的 Gemma、Meta 的 Llama、Mistral 的 Ministral。

为您的组织做好生成式人工智能成功的准备 – 2024 年人工智能影响力之旅Preparing Your Organization for Generative AI Success – AI Impact Tour 2024

Cohere 联合创始人兼首席执行官艾丹·戈麦斯 (Aidan Gomez) 在宣布新模型的博客文章中写道： “该模型是为需要优化其用例的速度、成本效益和计算资源的开发人员和企业设计的。”

在数学、编码、RAG 方面超越竞争对手

Cohere 一直战略性地专注于企业及其独特的用例。该公司于 3 月推出了 Command-R，并于 4 月推出了功能强大的Command R+ ，并全年进行了升级以支持速度和效率。该公司称 Command R7B 是其 R 系列的“最终”型号，并表示将向 AI 研究界发布模型权重。

科赫尔指出，开发 Command R7B 时的一个关键重点领域是提高数学、推理、代码和翻译的性能。该公司似乎在这些领域取得了成功，新款小型模型在HuggingFace Open LLM 排行榜上名列前茅，击败了 Gemma 2 9B、Ministral 8B 和 Llama 3.1 8B 等类似尺寸的开放式重量模型。

此外，R 系列中最小的模型在 AI 代理、工具使用和 RAG 等领域的表现优于竞争模型，这有助于通过将模型输出基于外部数据来提高准确性。Cohere 表示，Command R7B 擅长对话任务，包括技术工作场所和企业风险管理 (ERM) 协助；技术事实；媒体工作场所和客户服务支持；人力资源常见问题解答；以及总结。Cohere 还指出，该模型在金融环境中检索和处理数字信息方面“非常出色”。

总体而言，Command R7B 在重要基准测试中平均排名第一，包括指令跟踪评估 (IFeval)、大型硬核测试 (BBH)、研究生级 Google 防护问答 (GPQA)、多步骤软推理(MuSR) 和大规模多任务语言理解(MMLU)。

删除不必要的通话功能

Command R7B 可以使用包括搜索引擎、API 和矢量数据库在内的工具来扩展其功能。Cohere 报告称，该模型的工具使用在伯克利函数调用排行榜上的表现优于竞争对手，该排行榜评估模型在函数调用（连接到外部数据和系统）方面的准确性。

戈麦斯指出，这证明了它在“现实世界、多样化和动态环境”中的有效性，并消除了对不必要的呼叫功能的需求。这可以使其成为构建“快速而有能力”的人工智能代理的不错选择。例如，Cohere 指出，当作为互联网增强搜索代理时，Command R7B 可以将复杂的问题分解为子目标，同时在高级推理和信息检索方面也表现出色。

由于体积小，Command R7B 可以部署在低端和消费级 CPU、GPU 和 MacBook 上，从而实现设备上的推理。该模型现已在 Cohere 平台和 HuggingFace 上提供。定价为每 100 万个输入令牌 0.0375 美元，每 100 万个输出令牌 0.15 美元。

戈麦斯写道：“对于寻求以内部文档和数据为基础的经济高效模型的企业来说，这是一个理想的选择。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/cohere-zui-xiao-zui-kuai-de-r-xi-lie-mo-xing-zai-rag-fang

Like (0)

王浩然作者

0 0

合成数据有其局限性——为什么人类来源的数据可以帮助防止人工智能模型崩溃

Previous 2024年12月16日

OpenAI 启动 ChatGPT 项目，让你可以组织文件、分组聊天

Next 2024年12月16日

AI前沿

微软和 a16z 搁置分歧，联手反对人工智能监管

两个深度交织的科技生态系统中的两大力量——大型既有企业和初创公司——停止数钱，联合恳求政府停止甚至放弃考虑可能影响他们的经济利益（或者用他们喜欢的话说，创新）的监管。 “我们两家公…

王浩然
2024年11月2日
000
AI前沿

模拟理论筹集 200 万美元，以便计算机不再浪费计算资源

Simulation Theory是一家致力于通过优化计算资源来减少浪费的初创公司，该公司已成功筹集 200 万美元的种子前资金。 Simulation Theory 的技术使企业…

王浩然
2024年12月22日
000
AI前沿

Manus或许并非中国的第二个“DeepSeek时刻”‌

近期，有关Manus的热烈讨论在中国科技界掀起了波澜，许多人将其视为继DeepSeek之后的又一里程碑事件。然而，深入剖析后不难发现，Manus可能并未达到DeepSeek那样的高…

王浩然
2025年3月11日
000
AI前沿

科学家设计分子级记忆状态，超越传统计算限制

利默里克大学的一组研究人员公布了一种用于计算目的的分子设计创新方法。这种方法从人脑功能中汲取灵感，有望大幅提高人工智能系统的速度和能源效率。由伯纳尔研究所的 Damien Tho…

点点
2024年9月17日
000
AI前沿

Salesforce 的 AgentForce：想要管理你整个业务的 AI 助手

Salesforce周四推出了Agentforce，这是一套由人工智能驱动的自主代理，旨在增强各个业务职能领域的人类员工的能力。该公司将其定位为人工智能的“第三次浪潮”，超越预测模…

王浩然
2024年9月15日
000
AI前沿

小而强大：H2O.ai 的新 AI 模型在文档分析领域挑战科技巨头

开源 AI 平台提供商H2O.ai今天宣布了两种新的视觉语言模型，旨在改进文档分析和光学字符识别 (OCR) 任务。这两个模型名为H2OVL Mississippi-2B和H2OV…

王浩然
2024年10月19日
000
AI前沿

MIPS 发布用于自动驾驶汽车的 RISC-V CPU

MIPS发布了基于 RISC-V 计算架构的 P8700 CPU，针对驾驶辅助和自动驾驶汽车应用。这家总部位于加利福尼亚州圣何塞的公司专注于开发高效且可配置的知识产权计算，并将其…

王浩然
2024年11月9日
000
AI前沿

Basil Faruqui，BMC Software：如何制定数据和 AI 战略

BMC Software 的解决方案营销总监 Basil Faruqui 讨论了 DataOps、数据编排的重要性以及 AI 在优化复杂工作流自动化以实现业务成功方面的作用。 BM…

点点
2024年9月28日
000
AI前沿

OpenAI Stargate 是一笔 5000 亿美元的赌注：美国的人工智能曼哈顿计划还是代价高昂的死胡同？

本周，特朗普总统重返白宫开始第二任期，白宫发布了一系列行政命令，如果你错过了，昨天下午刚刚宣布了对人工智能基础设施的最大一笔投资。该项目被称为“星际之门项目”，由 OpenAI、软…

王浩然
2025年1月23日
000
AI前沿

Adobe 提出了一种保护艺术家免遭 AI 剽窃的方法

作为驱动全球数字艺术家的引擎，Adobe肩负着重大责任，以减轻人工智能驱动的深度伪造、虚假信息和内容盗窃的兴起。2025 年第一季度，Adobe 将推出其内容真实性网络应用程序的测…

王浩然
2024年10月10日
000
AI前沿

谷歌推出免费AI编程助手，使用上限极高‌

近日，谷歌公司正式推出了一款免费的AI编程助手，旨在帮助开发者更加高效地进行代码编写和调试。这款AI编程助手不仅功能强大，而且使用上限极高，能够满足大量开发者的需求。这款AI编程…

王浩然
2025年2月27日
000
AI前沿

Pegasystems 首席技术官 Don Schuerman – 访谈系列

Don Schuerman 是 Pegasystems 的首席技术官兼产品营销副总裁，负责 Pega 的平台和客户关系管理 (CRM) 应用程序。他拥有 20 年为财富 500 …

点点
2024年10月16日
000
AI前沿

ServiceNow 开源 Fast-LLM，旨在帮助企业以 20% 的速度训练 AI 模型

训练大型语言模型 (LLM) 是企业最昂贵且最耗时的练习之一。ServiceNow 今天发布的新开源模型可能会带来巨大的改变，有望将训练速度提高 20%，从而为企业节省时间和金钱。…

王浩然
2024年12月11日
000
AI前沿

OpenAI 资助杜克大学 100 万美元研究人工智能与道德

OpenAI 向杜克大学的一个研究团队提供 100 万美元的资助，用于研究人工智能如何预测人类的道德判断。该倡议强调了人们对技术与道德交叉问题的日益关注，并提出了关键问题：人工智…

王浩然
2024年12月24日
000
AI前沿

LlamaIndex 超越了 RAG，因此代理可以做出复杂的决策

流行的 AI 编排框架LlamaIndex引入了代理文档工作流 (ADW)，这是一种新架构，该公司表示，它超越了检索增强生成 (RAG) 流程并提高了代理的工作效率。随着编排框…

王浩然
2025年1月10日
000
AI前沿

OpenAI震撼发布里程碑式模型，代号o1：更强了，也更贵了

传闻已久、拖了又拖的OpenAI模型项目“草莓”，终于现身了。北京时间9月13日凌晨，Open AI正式发布了其首款具有推理能力的模型，代号为OpenAI o1，包括无所不能的大…

点点
2024年9月13日
000
AI前沿

Noma 为企业 AI 解决方案提供从数据存储到部署的安全保障

随着 2024 年接近尾声，企业技术的现状是，各种规模和领域的公司都热衷于利用生成性 AI 应用程序中的数据来改善内部（面向员工）或外部（面向客户/合作伙伴）流程。然而，确保安全…

王浩然
2024年11月3日
000
AI前沿

萨姆·奥特曼的世界币成为世界币，并展示新的虹膜扫描球来证明你的人类身份

世界币 (Worldcoin) 是 Sam Altman 共同创办的“人格证明”加密项目，该项目通过扫描人的眼球，周四宣布将“币”从其名称中删除，现在改名为“世界币”。世界币项目背…

点点
2024年10月18日
000
AI前沿

Nvidia的Cosmos-Transfer1：让机器人训练变得异常真实，彻底改变行业格局

在AI与机器人技术的融合日益紧密的今天，Nvidia推出了一项革命性的技术——Cosmos-Transfer1，这款创新的AI模型为开发者提供了一个前所未有的平台，用于创建高度逼真…

王浩然
2025年3月22日
000
AI前沿

在建立真正的业务关系的同时探索人工智能世界

人工智能 (AI) 的发展速度超乎人们的想象。从提高生产力到改善决策能力和创造力，工作场所中的人工智能不再是一个未来概念，而是我们日常生活中不可或缺的一部分。根据微软的 2024 …

点点
2024年9月21日
000