SLM
-
语言过度:SLM 如何打败规模更大、资源密集型的同类
ChatGPT 公开发布两年后,各行各业的公司都希望利用大型语言模型(LLM) 来改变业务流程,因此关于 AI 的讨论已不可避免。然而,尽管 LLM 功能强大且前景光明,但许多业务…
-
Hugging Face 展示了测试时间扩展如何帮助小型语言模型发挥其最大作用
在一项新的案例研究中,Hugging Face 的研究人员展示了如何配置小型语言模型(SLM),使其表现优于大型模型。他们的研究结果表明,具有 3B 参数的 Llama 3 模型在…
-
小型 AI 模型需求激增,阿联酋猎鹰 3 号向开源领导者发起挑战
阿联酋政府支持的技术创新研究所(TII) 宣布推出 Falcon 3,这是一系列开源小型语言模型 (SLM),旨在在轻量级、基于单 GPU 的基础设施上高效运行。 Falcon 3…
-
可区分自适应合并正在加速企业的 SLM
模型合并是一个基本的人工智能过程,使组织能够重复使用和组合现有的训练模型来实现特定目标。 如今,企业可以使用各种方法进行模型合并,但许多方法都很复杂。一种称为可微分自适应合并(DA…