Ai2 发布新语言模型，与 Meta 的 Llama 竞争

王浩然 • 2024年11月29日上午11:00 • AI前沿 • 79 views

目前出现了一个新的 AI 模型家族，它是少数可以从头开始复制的模型之一。

周二，已故微软联合创始人保罗·艾伦 (Paul Allen) 创立的非营利性 AI 研究机构 Ai2 发布了 OLMo 2，这是其 OLMo 系列中的第二个模型系列。（OLMo 是“开放语言模型”的缩写。）虽然可供选择的“开放”语言模型有很多（例如 Meta 的Llama），但 OLMo 2 符合开放源代码倡议对开源 AI 的定义，这意味着用于开发它的工具和数据都是公开可用的。

开放源代码促进会 (Open Source Initiative) 是一家长期存在的机构，旨在定义和“管理”所有开源事物，该机构于 10 月最终确定了其开源 AI 定义。但2 月份发布的首批 OLMo 模型也符合标准。

AI2 在一篇博客文章中写道：“OLMo 2 的开发从头到尾都采用了开放且可访问的训练数据、开源训练代码、可重复的训练方案、透明的评估、中间检查点等。通过公开分享我们的数据、方案和发现，我们希望为开源社区提供发现新方法和创新方法所需的资源。”

OLMo 2 系列有两个模型：一个有 70 亿个参数（OLMo 7B），另一个有 130 亿个参数（OLMo 13B）。参数大致对应于模型解决问题的能力，参数较多的模型通常比参数较少的模型表现更好。

与大多数语言模型一样，OLMo 2 7B 和 13B 可以执行一系列基于文本的任务，例如回答问题、总结文档和编写代码。

为了训练模型，Ai2 使用了 5 万亿个 token 的数据集。token 代表原始数据位；100 万个 token 相当于约 75 万个单词。训练集包括“经过筛选的高质量”网站、学术论文、问答讨论板和“合成和人工生成的”数学练习册。

Ai2 声称，该结果是具有竞争力的模型，性能方面，具有像 Meta 的Llama 3.1版本这样的开放模型。

Ai2 写道：“与之前的 OLMo 模型相比，我们不仅观察到所有任务的性能显著提升，而且值得注意的是，OLMo 2 7B 的表现优于 Llama 3.1 8B。”“OLMo 2 [代表] 迄今为止最好的完全开放语言模型。”

OLMo 2 模型及其所有组件均可从 Ai2网站下载。它们遵循 Apache 2.0 许可，这意味着它们可用于商业用途。

最近，关于开放模型的安全性存在一些争议，据报道，中国研究人员正在使用 Llama 模型开发防御工具。2 月份，当我问 Ai2 工程师 Dirk Groeneveld 是否担心 OLMo 被滥用时，他说他相信最终好处大于坏处。

“是的，开放模型可能会被不当使用或用于非预期目的，”他说。“[然而，这种]方法也促进了技术进步，从而产生更符合道德的模型；这是验证和可重复性的先决条件，因为这些只有通过访问全栈才能实现；并减少了日益集中的权力，创造了更公平的访问。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/ai2-fa-bu-xin-yu-yan-mo-xing-yu-meta-de-llama-jing-zheng

Like (0)

王浩然作者

0 0

音频平台 Pocket FM 利用人工智能工具扩展其内容目录

Previous 2024年11月29日

Uber 正在组建一支零工队伍，为人工智能模型标记数据

Next 2024年11月29日

AI前沿

Altman 花了 3 个亿巨资，证明「国家发钱」没有用

人工智能的风刮了两年，在 AI 普及之前，工作的「存在主义危机」先一步到来，互联网上关于人工智能何时能取代人的工作，能取代什么工作的讨论层出不穷。在人工智能的道德伦理边界的讨论上，…

点点
2024年10月7日
000
AI前沿

Nvidia 在卡内基梅隆大学成立人工智能、机器人技术社区

该计划旨在加强具有人工智能技术转型潜力的社区之间的公私合作伙伴关系

点点
2024年10月22日
000
AI前沿

Thesys 融资 400 万美元，利用自适应“生成式 UI”改造 AI 驱动的用户界面

在充斥着旨在增强用户体验的人工智能代理的技术领域，Thesys 的使命是重新定义用户与人工智能的互动方式。在由Together Fund领投的新一轮 400 万美元种子融资以及8V…

王浩然
2024年11月10日
000
AI前沿

英特尔联合发起面向 HBCU 的量子 AI 挑战赛，以促进创新

部分参与者将获得一台英特尔 AI PC，用于运行基于 Python 的量子模拟，并通过 AI 进行增强

点点
2024年9月27日
000
AI前沿

增强开源 AI 并改善数据治理

在欧洲人工智能与大数据博览会召开之前，AI News 采访了Databricks高级解决方案架构师 Ivo Everts ，讨论了影响开源人工智能和数据治理未来的几个关键发展。 D…

点点
2024年9月28日
000
AI前沿

OpenAI 研究人员开发新模型，将媒体生成速度提高 50 倍

OpenAI 的两位研究人员发表了一篇论文，描述了一种新型模型——具体来说是一种新型的连续时间一致性模型 (sCM)——与传统扩散模型相比，该模型将人工智能生成图像、视频和音频等多…

王浩然
2024年10月25日
000
AI前沿

将人工智能带入实践：LinkedIn 结合 LLM、LangChain 和 Jupyter Notebooks 来提高快速工程水平

对于企业来说，找出正确的提示以从生成式 AI 模型中获得最佳结果并不总是一件容易的事。在某些组织中，这已经落到了新出现的提示工程师的职位上，但LinkedIn的情况并非如此。该专…

王浩然
2025年2月14日
000
AI前沿

ConverzAI 获 1600 万美元融资，为企业带来 30% 效率提升

总部位于华盛顿州雷德蒙德的初创公司ConverzAI是一家人工智能招聘自动化提供商，该公司在A 轮融资中筹集了 1600 万美元，以帮助其推动产品创新并扩大市场范围。此轮融资由 …

王浩然
2025年2月12日
000
AI前沿

亚马逊通过 AI 视频搜索改进 Ring 订阅服务

亚马逊正在改进其 Ring 视频门铃和摄像头的订阅服务。一项名为 Ring Home Premium 的新服务将包括全天候录制和人工智能视频搜索等功能，起价为每月 19.99 美…

王浩然
2024年10月10日
000
AI前沿

Meta 计划限制发布有风险的人工智能系统

Frontier AI 框架描述了 Meta 如何将 AI 模型分为高风险组和严重风险组 Meta发布了一个新的风险政策框架，概述了其计划如何评估和减轻新前沿 AI 模型带来的风险…

王浩然
2025年2月18日
000
AI前沿

Uber ChatGPT AI 助手鼓励人们使用电动汽车

在 OpenAI 的 GPT-4o 的支持下，Uber 的司机应用程序将配备人工智能助手，为所有可以想象到的电动汽车问题提供类似人类的答案

点点
2024年10月16日
000
AI前沿

Patronus AI 推出全球首个自助服务 API，旨在阻止 AI 幻觉

客服聊天机器人自信地描述一款并不存在的产品。金融人工智能编造市场数据。医疗保健机器人提供危险的医疗建议。这些人工智能幻觉曾被视为有趣的怪癖，但如今已成为急于部署人工智能的公司面临的…

王浩然
2024年11月3日
000
AI前沿

DeepSeek 真的在向中国发送数据吗？让我们来解密

上周，中国初创公司DeepSeek发布了性能强大但成本低廉的开源版本 DeepSeek-R1，在人工智能界引起轩然大波。该模型使用纯强化学习 (RL)，在一系列基准测试中与 Ope…

王浩然
2025年1月28日
000
AI前沿

Stable Diffusion 3.5 登陆 Amazon Bedrock：这对企业 AI 工作流程意味着什么

创建精美的生成式 AI 图像可能很有趣也很有用，但这并不是企业所需要的全部。企业文本转图像生成不仅仅是创建图像。它还涉及与现有工作流程和其他企业 AI 工具的集成。这是Stabl…

王浩然
2024年12月20日
000
AI前沿

AGI 的到来比我们想象的要快——我们必须做好准备

包括 Anthropic 的 Dario Amodei 和 OpenAI 的 Sam Altman 在内的人工智能领域的领军人物表示，“强大的人工智能”甚至超级智能可能会在未来 2…

王浩然
2024年11月11日
000
AI前沿

微软在 Hugging Face 上将强大的 Phi-4 模型完全开源

尽管其大投资伙伴 OpenAI 不断发布更强大的推理模型（例如最新的o3 系列），但微软并没有袖手旁观。相反，它正在开发以自有品牌发布的更强大的小型模型。正如多位现任和前任微软研…

王浩然
2025年1月9日
000
AI前沿

人工智能行业研究：创纪录的增长背后隐藏着严峻挑战

由英国科学、创新和技术部(DSIT) 与Perspective Economics、Ipsos和glass.ai合作开展的一项全面的人工智能行业研究详细概述了该行业的现状及其未来前…

点点
2024年10月26日
000
AI前沿

AI生成代码的风险及企业管理策略

随着人工智能（AI）技术的飞速发展，AI工具在代码编写中的应用日益广泛。曾经，几乎所有的应用程序代码都是由人类编写的，但如今，这一格局正在发生深刻变化。一些专家，如Anthropi…

王浩然
2025年3月15日
000
AI前沿

埃隆马斯克的 X 正在改变其隐私政策，允许第三方在你的帖子上训练人工智能

周三，社交网络 X（前身为 Twitter）更新了其隐私政策，表明它将允许第三方“合作者”使用 X 数据训练他们的 AI 模型，除非用户选择退出。虽然 X 所有者埃隆·马斯克使用 …

王浩然
2024年10月19日
000
AI前沿

为什么人工智能开发人员对 Claude 3.5 的计算机使用功能赞不绝口

Anthropic 刚刚发布了 Claude 3.5，这是其 LLM 系列的一个功能强大的新版本。虽然这个模型带来了改进的推理和编码技能，但真正令人兴奋的是围绕一项名为“计算机使用…

点点
2024年11月5日
000

发表回复

Please Login to Comment

Ai2 发布新语言模型，与 Meta 的 Llama 竞争

相关推荐

发表回复

Share To :