法国人工智能初创公司Mistral发布了其首批生成式人工智能模型,旨在在笔记本电脑和手机等边缘设备上运行。
Mistral 称之为“Les Ministraux”的新模型系列可用于或调整为各种应用,从基本的文本生成到与更强大的模型协同完成任务。
有两种 Les Ministraux 型号可供选择 – Ministral 3B 和 Ministral 8B – 两者都有 128,000 个令牌的上下文窗口,这意味着它们大约可以容纳一本 50 页的书的长度。
Mistral 在一篇博文中写道: “我们最具创新精神的客户和合作伙伴越来越多地要求为关键应用提供本地、隐私优先的推理,例如设备翻译、无互联网智能助手、本地分析和自主机器人。Les Ministraux 的建立是为了为这些场景提供计算效率高、延迟低的解决方案。”
从今天起,Ministral 8B 可供下载 — 尽管仅供研究之用。Mistral 要求对 Ministral 8B 或 Ministral 3B 自行部署设置感兴趣的开发者和公司与其联系以获取商业许可。
否则,开发人员可以通过 Mistral 的云平台 La Platforme 以及这家初创公司未来几周内合作的其他云平台使用 Ministral 3B 和 Ministral 8B。Ministral 8B 每百万输出/输入令牌(约 750,000 个单词)收费 10 美分,而 Ministral 3B 每百万输出/输入令牌收费 4 美分。
最近,小型模型成为一种趋势,与大型模型相比,小型模型更便宜,训练、微调和运行速度更快。谷歌继续向其Gemma小型模型系列添加模型,而微软则提供其Phi模型系列。在最近更新的Llama套件中,Meta推出了几款针对边缘硬件优化的小型模型。
Mistral 声称,在旨在评估指令遵循和解决问题能力的几项 AI 基准测试中,Ministral 3B 和 Ministral 8B 的表现优于同类的 Llama 和 Gemma 模型,以及其自己的Mistral 7B 。
总部位于巴黎的 Mistral最近筹集了 6.4 亿美元风险投资,并继续逐步扩大其 AI 产品组合。在过去几个月中,该公司推出了一项供开发人员测试其模型的免费服务、一个让客户微调这些模型的SDK以及新模型,其中包括一个名为Codestral的代码生成模型。
Mistral 由 Meta 和谷歌 DeepMind 的校友共同创立,其使命是创建可与当今表现最佳的模型(如 OpenAI 的GPT-4o和 Anthropic 的 Claude)相媲美的旗舰模型,并理想地在此过程中赚钱。虽然“赚钱”这一部分被证明具有挑战性(对于大多数生成式 AI 初创公司而言都是如此),但据报道,Mistral已于今年夏天开始创收。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/mistral-fa-bu-zhen-dui-bi-ji-ben-dian-nao-he-shou-ji-you