SLM

AI前沿

语言过度：SLM 如何打败规模更大、资源密集型的同类

ChatGPT 公开发布两年后，各行各业的公司都希望利用大型语言模型(LLM) 来改变业务流程，因此关于 AI 的讨论已不可避免。然而，尽管 LLM 功能强大且前景光明，但许多业务…

王浩然
2024年12月22日
000
AI前沿

Hugging Face 展示了测试时间扩展如何帮助小型语言模型发挥其最大作用

在一项新的案例研究中，Hugging Face 的研究人员展示了如何配置小型语言模型(SLM)，使其表现优于大型模型。他们的研究结果表明，具有 3B 参数的 Llama 3 模型在…

王浩然
2024年12月21日
000
AI前沿

小型 AI 模型需求激增，阿联酋猎鹰 3 号向开源领导者发起挑战

阿联酋政府支持的技术创新研究所(TII) 宣布推出 Falcon 3，这是一系列开源小型语言模型 (SLM)，旨在在轻量级、基于单 GPU 的基础设施上高效运行。 Falcon 3…

王浩然
2024年12月18日
000
AI前沿

可区分自适应合并正在加速企业的 SLM

模型合并是一个基本的人工智能过程，使组织能够重复使用和组合现有的训练模型来实现特定目标。如今，企业可以使用各种方法进行模型合并，但许多方法都很复杂。一种称为可微分自适应合并(DA…

王浩然
2024年10月25日
000