Cohere 推出全新 AI 模型，旨在弥合全球语言鸿沟

王浩然 • 2024年10月26日下午10:00 • AI前沿 • 119 views

Cohere今天在其 Aya 项目中发布了两个新的开放权重模型，以缩小基础模型中的语言差距。

Aya Expanse 8B 和 35B 现已在Hugging Face上推出，扩展了 23 种语言的性能提升。Cohere 在一篇博客文章中表示，8B 参数模型“让世界各地的研究人员更容易获得突破性进展”，而 32B 参数模型则提供了最先进的多语言功能。

Aya 项目旨在扩大除英语之外的更多全球语言的基础模型的使用范围。该公司的研究部门 Cohere for AI 去年启动了 Aya 计划。今年 2 月，它发布了 Aya 101 大型语言模型 (LLM )，这是一个涵盖 101 种语言的 130 亿参数模型。Cohere for AI 还发布了 Aya 数据集，以帮助扩大对其他语言的模型训练的使用范围。

Aya Expanse 采用与制造 Aya 101 相同的配方。

“Aya Expanse 的改进是我们持续关注如何通过重新思考机器学习突破的核心构建模块来扩展人工智能服务世界各地语言的结果，”Cohere 表示。“过去几年，我们的研究议程包括专注于弥合语言差距，其中有几项突破对当前的方案至关重要：数据套利、针对一般性能和安全性的偏好训练，以及最终的模型合并。”

Aya 表现优异

Cohere 表示，两款 Aya Expanse 模型的表现始终优于谷歌、Mistral 和 Meta 等同类规模的 AI 模型。

Aya Expanse 32B 在基准多语言测试中的表现优于 Gemma 2 27B、Mistral 8x22B 甚至比尺寸大得多的 Llama 3.1 70B 更好。尺寸较小的 8B 也比 Gemma 2 9B、Llama 3.1 8B 和 Ministral 8B 表现更好。

Cohere 使用一种称为数据套利的数据采样方法开发了 Aya 模型，以避免模型依赖合成数据时产生乱码。许多模型使用由“教师”模型创建的合成数据进行训练。然而，由于很难为其他语言（尤其是资源匮乏的语言）找到好的教师模型。

它还专注于引导模型适应“全球偏好”，并考虑到不同的文化和语言观点。Cohere 表示，它找到了一种在引导模型偏好的同时提高性能和安全性的方法。

该公司表示：“我们认为这是训练 AI 模型的‘最后一道亮光’。然而，偏好训练和安全措施往往过度拟合以西方为中心的数据集中普遍存在的危害。问题是，这些安全协议经常无法扩展到多语言环境。我们的工作是首批将偏好训练扩展到大规模多语言环境、考虑到不同文化和语言观点的工作之一。”

不同语言的模型

Aya 计划的重点是确保法学硕士 (LLM) 研究在英语以外的语言中也能取得良好表现。

许多法学硕士课程最终都以其他语言提供，尤其是广泛使用的语言，但很难找到数据来训练不同语言的模型。毕竟，英语往往是政府、金融、网络对话和商业的官方语言，因此找到英语数据要容易得多。

由于翻译质量的原因，准确对不同语言模型的性能进行基准测试也很困难。

其他开发人员也发布了自己的语言数据集，以进一步研究非英语 LLM。例如，OpenAI 上个月在 Hugging Face 上制作了多语言大规模多任务语言理解数据集。该数据集旨在帮助更好地测试 14 种语言（包括阿拉伯语、德语、斯瓦希里语和孟加拉语）的 LLM 性能。

Cohere 最近几周一直很忙。本周，该公司为其用于检索增强生成 (RAG) 系统的企业嵌入产品Embed 3 添加了图像搜索功能。本月，该公司还增强了对其 Command R 08-2024 模型的微调。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/cohere-tui-chu-quan-xin-ai-mo-xing-zhi-zai-mi-he-quan-qiu

Aya 项目 Cohere Embed Mistral OpenAI 大型语言模型谷歌

Like (0)

王浩然作者

0 0

ServiceNow 提倡使用“隐形”人工智能代理来简化工人的采用

Previous 2024年10月26日

Anthropic 的代理计算机使用正在赋予人们“超能力”

Next 2024年10月27日

AI前沿

大型语言模型中的灾难性过度训练：研究人员的警告

在人工智能领域，大型语言模型（LLM）正逐渐成为研究和应用的核心。然而，随着这些模型规模的不断扩大和能力的不断增强，一个潜在的问题也逐渐浮出水面——灾难性过度训练。近日，研究人员纷…

王浩然
2025年3月31日
000
AI前沿

ZipRecruiter 的新工具将快速匹配潜在候选人并安排介绍电话

招聘平台ZipRecruiter正在推出一款名为 ZipIntro 的新工具，让雇主可以在规定时间安排与潜在候选人的介绍电话。该工具还将帮助招聘人员使用人工智能推荐潜在候选人。雇…

王浩然
2024年9月8日
000
AI前沿

Writer 如何构建企业平台 Blueprint 来为您实现 AI

随着企业不断探索其潜力，Agentic AI 不断发展壮大。然而，构建 AI 代理工作流程时可能会出现一些陷阱。全栈 AI 平台Writer的联合创始人兼首席执行官梅…

王浩然
2024年11月13日
000
AI前沿

Google Gemini 的 Imagen 3 让玩家可以设计自己的棋子

谷歌实验室是科技巨头谷歌旗下的实验部门，它推出了一项新的在线项目，提供一种有趣的国际象棋游戏变体。该网络实验名为 GenChess，顾名思义，它采用了谷歌的图像生成模型 Gemi…

王浩然
2024年11月28日
000
AI前沿

iPhone 16 需要与 Siri 一起做 5 件事才能在 AI 游戏中击败 Google Pixel 和 Galaxy S24

苹果年度盛事将于今天（9 月 9 日）举行，届时将发布 iPhone 16 ——但苹果这款配备Apple Intelligence 的新款超级手机与三星和谷歌的最佳产品相比如何？ …

王浩然
2024年9月9日
000
AI前沿

技能组合新高度：威胁情报与逆向工程的完美融合

在网络安全的世界里，威胁情报就像是我们的“眼睛”和“耳朵”。通过收集、分析和共享有关潜在威胁的信息，威胁情报帮助我们提前发现并应对安全风险。

点点
2024年9月7日
000
AI前沿

我们终于对开源人工智能有了“官方”定义

开源人工智能终于有了“官方”定义。开放源代码促进会 (OSI) 是一家长期存在的机构，旨在定义和“管理”所有开源事物，今天发布了其开放源代码 AI 定义 (OSAID) 1.0 …

王浩然
2024年10月29日
000
AI前沿

人工智能视觉搜索登陆 iPhone

该公司在周一的 Apple Event 2024 上宣布，视觉搜索即将登陆 iPhone，由苹果的 AI 功能套件 Apple Intelligence 提供支持。相机控制是iP…

王浩然
2024年9月10日
000
AI前沿

AI可穿戴设备1.0：Humanes的AI胸针是否过于野心勃勃？

自2021年11月1日起，Yahoo服务套件在中国大陆已无法访问，但这并不影响我们在全球其他地区的讨论。今日，我们聚焦于AI可穿戴设备领域，特别是Humanes推出的AI胸针项目。…

王浩然
2025年2月25日
000
AI前沿

LlamaIndex推出构建非结构化数据代理的云服务‌

在数字化转型的浪潮中，企业对于非结构化数据的处理能力日益成为竞争的关键。为了满足这一需求，LlamaIndex近日宣布推出了一项创新的云服务，旨在帮助企业轻松构建和管理非结构化数据…

王浩然
2025年3月5日
000
AI前沿

小众人工智能助手如何帮助释放真正的能力

随着人工智能继续渗透到越来越多的行业，未来十年左右这个市场的价值尚不可知。在这一扩张中，人工智能助手经历了巨大的增长，无论是其运作范围还是其产生的货币价值。具体来说，…

AI News
2024年9月6日
000
AI前沿

2025 年的网络安全：混合策略、深度伪造和加密敏捷性

全面审视 2025 年网络安全格局的演变，新兴技术带来新的威胁和机遇随着技术的出现，不良行为者不可避免地会试图利用它们来使网络攻击变得更加复杂和有效。生成式人工智能、混合云基础…

王浩然
2025年1月3日
000
AI前沿

日本最有趣的独角兽

尽管日本的创业行业是世界上最大的行业之一，但就独角兽企业数量和风险投资规模而言，日本仍落后于美国、中国和英国等其他地区。多年来，人口老龄化、整体经济通缩以及工薪阶层倾向于在传统的大…

点点
2024年10月13日
000
AI前沿

用AI“创造”蛋白质，「分子之心」获数亿元A轮融资

AI蛋白质设计平台公司「分子之心」近日完成数亿元A轮融资，由谢诺投资、深创投联合领投，商汤国香资本、久奕投资跟投。本轮融资将用于进一步扩大复合型人才团队，深入完善AI蛋白质基础大模…

点点
2024年9月13日
000
AI前沿

被AI颠覆一半工作的前大厂员工，花了8个月找到用AI工作的新方式

一专多会，才能长久

点点
2024年8月21日
010
AI前沿

DataStax 首席执行官：2025 年将是我们真正看到人工智能转型的一年

当企业领导者努力应对实施生成式人工智能的复杂性时，DataStax 首席执行官 Chet Kapoor 提出了一个令人放心的观点：当前的挑战是技术革命的正常组成部分，2025 年将…

王浩然
2024年9月22日
000
AI前沿

Tony Fadell 投资的 Plumerai 将设备内置 AI 引入家庭安全摄像头

周三，一些哈佛学生因给雷朋 Meta眼镜配备面部识别功能而登上头条新闻。这项 DIY 项目是最新一则引发人们对这项无处不在的技术的隐私担忧的新闻。随着摄像头在社会上越来越普遍，这个…

王浩然
2024年10月8日
000
AI前沿

Apple Intelligence 有望推动收入增长；研究公司预测 2024 年 AI 智能手机出货量将增加两倍

受益于 iPhone 等硬件产品的热销，以及服务业务创纪录的表现，苹果预计 2024 财年（截至 9 月底）总营收将超过 4000 亿美元。这一增长很大一部分将来自 Apple I…

王浩然
2024年9月16日
000
AI前沿

挪威1X公司正在研发家用仿人机器人

挪威的创新科技公司1X近日宣布，他们正在致力于开发一款专为家庭环境设计的仿人机器人。这一项目旨在通过先进的人工智能和机器人技术，为日常生活带来便利和新的互动体验。据1X公司介绍，…

王浩然
2025年2月26日
000
AI前沿

人形机器人为中国汽车制造商制造汽车

一家中国汽车制造商推出了一款新型轮式人形机器人，据称该机器人将于 2026 年开始应用于汽车制造。国有企业广州汽车集团在上海的一场活动上发布了第三代GoMate。 GoMate…

王浩然
2025年1月3日
000

发表回复

Please Login to Comment

Cohere 推出全新 AI 模型，旨在弥合全球语言鸿沟

Aya 表现优异

不同语言的模型

相关推荐

发表回复

Share To :