研究人员开源 Sky-T1,这是一种“推理”人工智能模型,训练成本不到 450 美元

研究人员开源 Sky-T1,这是一种“推理”人工智能模型,训练成本不到 450 美元

所谓的推理人工智能模型正变得越来越容易开发,并且更便宜。

周五,加州大学伯克利分校天空计算实验室的研究团队 NovaSky 发布了 Sky-T1-32B-Preview,该推理模型在多个关键基准测试中与OpenAI 的 o1 早期版本相媲美。Sky-T1 似乎是第一个真正的开源推理模型,因为它可以从头开始复制;该团队发布了他们用来训练它的数据集以及必要的训练代码。

该团队在一篇博客文章中写道:“值得注意的是,Sky-T1-32B-Preview 的训练成本不到 450 美元,这表明可以经济高效地复制高级推理能力。”

450 美元听起来可能不太实惠。但不久前,训练一个具有同等性能的模型的价格往往高达数百万美元。合成训练数据或由其他模型生成的训练数据有助于降低成本。据报道,人工智能公司 Writer 最近发布的模型 Palmyra X 004 几乎完全基于 合成数据进行训练,开发成本仅为 70 万美元。

与大多数人工智能不同,推理模型可以有效地进行自我事实核查,这 有助于它们避免一些通常会使模型陷入困境的陷阱。与典型的非推理模型相比,推理模型需要更长的时间(通常要多几秒到几分钟)才能得出解决方案。好处是,它们在物理、科学和数学等领域往往更可靠。

NovaSky 团队表示,他们使用了另一个推理模型,即阿里巴巴QwQ-32B-Preview,来生成 Sky-T1 的初始训练数据,然后“整理”数据混合,并利用 OpenAI 的GPT-4o-mini将数据重构为更易用的格式。使用 8 个 Nvidia H100 GPU 机架训练 320 亿参数的 Sky-T1 大约需要 19 个小时。(参数大致对应于模型的解决问题的能力。)

NovaSky 团队表示,Sky-T1 在 MATH500(一组“竞赛级”数学挑战)上的表现优于 o1 的早期预览版本。该模型还在一组来自 LiveCodeBench(一种编码评估)的难题上击败了 o1 的预览版本。

然而,Sky-T1 不如 GPQA-Diamond 上的 o1 预览版,后者包含博士毕业生应该了解的物理、生物和化学相关问题。

同样值得注意的是,OpenAI 的o1 GA 版本比 o1 的预览版更强大,并且 OpenAI 预计将在未来几周发布性能更佳的推理模型o3 。

但NovaSky团队表示,Sky-T1仅标志着他们开发具有高级推理能力的开源模型之旅的开始。

“展望未来,我们将专注于开发更高效的模型,保持强大的推理性能,并探索先进的技术,进一步提高模型在测试时的效率和准确性,”该团队在帖子中写道。“请继续关注我们在这些激动人心的计划上取得的进展。”

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/yan-jiu-ren-yuan-kai-yuan-skyt1-zhe-shi-yi-zhong-tui-li-ren

Like (0)
王 浩然的头像王 浩然作者
Previous 4小时前
Next 39 mins ago

相关推荐

发表回复

Please Login to Comment