AI2 缩小了闭源和开源后训练之间的差距

王浩然 • 2024年11月26日下午9:00 • AI前沿 • 75 views

艾伦人工智能研究所 (Ai2)声称，随着其新模型训练系列 Tülu 3 的发布，闭源和开源后训练之间的差距已经缩小，并提出了开源模型将在企业领域蓬勃发展的论点。

Tülu 3 使开源模型与 OpenAI 的 GPT 模型、Anthropic 的 Claude 和谷歌的 Gemini 相媲美。它允许研究人员、开发人员和企业在不丢失模型数据和核心技能的情况下对开源模型进行微调，使其接近闭源模型的质量。

Ai2 表示，它发布了包含所有数据、数据组合、配方、代码、基础设施和评估框架的 Tülu 3。该公司需要创建新的数据集和训练方法来提高 Tülu 的性能，包括“使用强化学习直接针对可验证问题进行训练”。

Ai2 在一篇博文中表示：“我们的最佳模型源自复杂的训练过程，该过程将专有方法的部分细节与新技术和成熟的学术研究相结合。我们的成功源于精心的数据管理、严格的实验、创新的方法和改进的培训基础设施。”

Tülu 3 将提供多种尺寸。

企业开源

尽管有传闻称更多公司在项目中选择了更多开源大型语言模型 (LLM )，但在企业采用方面，开源模型往往落后于闭源模型。

Ai2 的论点是，使用 Tülu 3 等开源模型改进微调将增加选择开源模型的企业和研究人员的数量，因为他们可以确信它的表现可以与 Claude 或 Gemini 一样好。

该公司指出，Tülu 3 和 Ai2 的其他模型都是完全开源的，并指出 Anthropic 和 Meta 等声称开源的大型模型训练器“其训练数据和训练配方对用户都不透明”。开放源代码倡议最近发布了其开源 AI 定义的第一个版本，但一些组织和模型提供商在其许可证中并未完全遵循该定义。

企业关心模型的透明度，但许多企业选择开源模型并不是为了研究或数据开放，而是因为它最适合他们的用例。

当企业寻找开源模型纳入其堆栈并使用其数据进行微调时，Tülu 3 为其提供了更多选择。

Ai2 的其他模型OLMoE和Molmo也是开源的，该公司表示，它们的表现已开始超越 GPT-4o 和 Claude 等其他领先模型。

Tülu 3 的其他功能

Ai2 表示，Tülu 3 允许公司在微调过程中混合和匹配他们的数据。

Ai2 表示：“这些配方可以帮助你平衡数据集，因此如果你想建立一个可以编码的模型，但也能精确遵循指令并使用多种语言，那么你只需选择特定的数据集并按照配方中的步骤进行操作即可。 ”

混合和匹配数据集可以让开发人员更轻松地从较小的模型转移到较大的加权模型，并保留其训练后设置。该公司表示，它与 Tülu 3 一起发布的基础设施代码允许企业在模型大小之间移动时构建该管道。

Ai2 的评估框架为开发人员提供了一种方法，让他们可以指定他们希望在模型中看到的设置。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/ai2-suo-xiao-le-bi-yuan-he-kai-yuan-hou-xun-lian-zhi-jian

Like (0)

王浩然作者

0 0

中国研究人员推出 LLaVA-o1，挑战 OpenAI 的 o1 模型

Previous 2024年11月26日

开始使用 AI 代理（第 1 部分）：捕获流程、角色和连接

Next 2024年11月27日

AI前沿

人工智能编排：创造和谐还是创造依赖？

随着人工智能工具越来越多地融入我们的日常生活，我们面临一个关键问题：我们是在利用它们的力量来增强我们的能力，还是在慢慢地外包我们的思想——或者两者兼而有之？作为 DALL-E、C…

王浩然
2024年9月9日
000
AI前沿

佳士得AI艺术拍卖会据报道超出预期‌

近日，佳士得拍卖行举办的一场AI艺术拍卖会吸引了广泛关注，据报道，此次拍卖的结果远远超出了业界的预期。这场拍卖会不仅展示了AI艺术的无限潜力，也引发了人们对艺术与科技结合的深入思考…

王浩然
2025年3月9日
000
AI前沿

ZipRecruiter 的新工具将快速匹配潜在候选人并安排介绍电话

招聘平台ZipRecruiter正在推出一款名为 ZipIntro 的新工具，让雇主可以在规定时间安排与潜在候选人的介绍电话。该工具还将帮助招聘人员使用人工智能推荐潜在候选人。雇…

王浩然
2024年9月8日
000
AI前沿

谷歌Gemini新功能：现在可通过视频或屏幕内容提问‌

在不断创新与进步的科技浪潮中，谷歌再次引领潮流，为其Gemini搜索平台带来了革命性的新功能。近日，谷歌宣布Gemini已支持用户通过上传视频或利用屏幕截图中的内容来提问，这一变革…

王浩然
2025年3月4日
000
AI前沿

Creatio 通过 Energy 发布代理 AI 实现 CRM 自动化

一位风险投资家表示，谷歌的 NotebookLM生成式 AI 应用程序至少可以在某些用例中取代 CRM，而 CRM 提供商Creatio则进行了反击。 Creatio 今天宣布了一…

王浩然
2024年11月1日
000
法规是助力还是阻碍：Cloudflare 的看法

随着人工智能重塑数字格局，科技公司发现自己陷入了一场高风险的监管博弈，每一步都可能改变创新带来的可能性。对于像 Cloudflare 这样的全球基础设施提供商来说，这场博弈尤其复杂…

点点
AI前沿 2024年10月7日
000
AI前沿

《纽约时报》就人工智能向 Perplexity 发出停止侵权通知函

据《华尔街日报》报道，该报称该公司未经许可使用其文章

点点
2024年10月23日
000
AI前沿

Simplismart 通过个性化、软件优化的推理引擎增强 AI 性能

企业全力投入 AI。他们希望自己的模型能够在生产环境中顺利运行，并尽可能提高性能，以获得高投资回报。然而，即使市场上有各种先进的模型，团队仍然在部署问题上苦苦挣扎。去年，Ever…

王浩然
2024年10月19日
000
AI前沿

BMW 利用流程智能加速数字化转型

智能地使用流程智能是实现数字化转型的最佳途径吗？宝马集团认为是的。在过去八年中，这家市值 1550 亿欧元（1670 亿美元）的汽车制造商越来越致力于打造一家更加灵活、高效和创新的…

王浩然
2024年11月20日
000
AI前沿

据报道，前 OpenAI 首席技术官 Mira Murati 正在为一家新的 AI 初创公司筹集资金

据路透社报道，上个月宣布离职的OpenAI 首席技术官米拉·穆拉蒂 (Mira Murati)正在为一家新的人工智能初创公司筹集风险投资资金。据报道，这家初创公司将专注于构建基于…

王浩然
2024年10月20日
000
AI前沿

这款“AI Granny”黑客利用无聊的闲聊浪费电话诈骗者的时间

电话诈骗并不是什么新鲜事，但随着人工智能的出现，人们比以往任何时候都更难知道他们正在通话的人是否是他们所说的那个人。但英国移动网络 O2 正在扭转局面，创造了所谓的“人工智能奶奶”…

王浩然
2024年11月17日
000
AI前沿

人工智能如何增强人类在销售和营销方面的潜力

人工智能 (AI) 正在彻底改变各行各业专业人士的营销和销售方式。通过采用 AI，该领域的专业人士可以提高效率、提高成果并做出更快、更明智的决策。销售和营销的 AI 演变不仅意味着…

点点
2024年10月9日
000
AI前沿

活体细胞计算机：超越硅的人工智能和计算新前沿

几十年来，生物系统以其处理复杂信息、适应、学习和实时做出复杂决策的卓越能力吸引了计算机科学家。这些自然系统启发了神经网络和进化算法等强大模型的发展，这些模型已经改变了医学、金融、人…

点点
2024年9月6日
000
AI前沿

亚马逊与 Anthropic 合作增强 Alexa

亚马逊正准备推出其 Alexa 语音助手的改进版本，预计将于今年 10 月美国购物旺季之前上市。这项新技术在公司内部被称为“Remarkable”，将由 Anthropic 的C…

点点
2024年9月4日
000
AI前沿

Stable Diffusion 3.5：文本到图像 AI 的架构进步

Stability AI发布了 Stable Diffusion 3.5，标志着文本转图像 AI 模型的又一次进步。此版本代表了一次全面改革，由宝贵的社区反馈和对突破生成式 AI …

点点
2024年10月25日
000
AI前沿

OpenAI 可能以令人惊讶的方式摆脱与微软的协议

《纽约时报》周四发表了一篇文章，探讨了 OpenAI 与其投资者、合作伙伴兼竞争对手微软之间“紧张”的关系。报道称，由于 OpenAI 面临的财务压力、微软为 OpenAI 提供的…

王浩然
2024年10月19日
000
AI前沿

卡曼筹集2000万美元，打造小行星采矿自主航天器

近日，卡曼公司宣布成功筹集2000万美元资金，旨在开发一款用于小行星采矿的自主航天器。这一雄心勃勃的项目旨在利用先进的自主技术和太空探索经验，从小行星上开采宝贵资源，为未来的太空经…

王浩然
2025年2月24日
000
AI前沿

Hugging Face 推出用于机器人命令的自然语言 AI 模型

模型使得构建和部署能够执行复杂任务的人工智能机器人变得更加容易。开源代码库Hugging Face推出了一种机器人基础人工智能模型，可将自然语言命令转化为身体动作。该模型名为…

王浩然
2025年2月19日
000
AI前沿

Meta 计划限制发布有风险的人工智能系统

Frontier AI 框架描述了 Meta 如何将 AI 模型分为高风险组和严重风险组 Meta发布了一个新的风险政策框架，概述了其计划如何评估和减轻新前沿 AI 模型带来的风险…

王浩然
2025年2月18日
000
AI前沿

Pinecone 通过级联检索扩展矢量数据库，将企业 AI 准确率提高高达 48%

近年来，Pinecone 已成为领先的原生矢量数据库平台之一。Pinecone 凭借新功能继续在竞争日益激烈的市场中脱颖而出，帮助解决企业 AI 挑战今天，Pinecone 宣布…

王浩然
2024年12月3日
000

发表回复

Please Login to Comment

AI2 缩小了闭源和开源后训练之间的差距

企业开源

Tülu 3 的其他功能

相关推荐

发表回复

Share To :