Mistral Small 3 将开源 AI 带给大众——更小、更快、更便宜

王浩然 • 2025年2月2日下午9:00 • AI前沿 • 71 views

迅速崛起的欧洲人工智能初创公司Mistral AI今天推出了一种新的语言模型，该公司声称该模型的性能可与三倍于其规模的模型相媲美，同时大幅降低计算成本——这一进展可能会重塑先进人工智能部署的经济性。

新模型名为Mistral Small 3 ，拥有 240 亿个参数，在标准基准测试中达到 81% 的准确率，同时每秒处理 150 个标记。该公司根据宽松的Apache 2.0 许可证发布该模型，允许企业自由修改和部署它。

Mistral 首席科学官 Guillaume Lample 在接受采访时表示：“我们认为它是所有少于 700 亿个参数的模型中最好的模型。我们估计它基本上与几个月前发布的 Meta 的 Llama 3.3 70B 相当，后者的规模是前者的三倍。”

此前，中国初创公司 DeepSeek 声称其仅花费 560 万美元就训练出了一个具有竞争力的模型，此举引发了人们对人工智能开发成本的严格审查。此举导致英伟达的市值本周蒸发近 6000 亿美元，投资者开始质疑美国科技巨头的巨额投资。

一家法国初创公司如何构建一个规模很小、可与大型科技公司相媲美的人工智能模型

Mistral 的方法注重效率而非规模。该公司主要通过改进训练技术来实现性能提升，而不是投入更多计算能力来解决问题。

Lample 表示：“改变的基本上是训练优化技术。我们训练模型的方式有点不同，优化模型的方式也不同。”

Lample 表示，该模型在 8 万亿个 token 上进行训练，而同类模型则需要 15 万亿个 token。这种效率可以让担心计算成本的企业更容易获得先进的人工智能功能。

值得注意的是，Mistral Small 3的开发并未采用强化学习或合成训练数据，而这些技术是竞争对手常用的。Lample 表示，这种“原始”方法有助于避免嵌入不必要的偏见，因为这些偏见日后可能难以发现。

隐私和企业：为什么企业关注较小的人工智能模型来完成关键任务

该模型特别针对出于隐私和可靠性原因而需要本地部署的企业，包括金融服务、医疗保健和制造公司。据该公司称，它可以在单个 GPU 上运行，并处理 80-90% 的典型业务用例。

“我们的许多客户都希望采用本地解决方案，因为他们关心隐私和可靠性，”Lample 说道。“他们不希望关键服务依赖于他们无法完全控制的系统。”

IPO 临近，欧洲 AI 领军企业为开源主导地位奠定基础

此次发布之际，Mistral 的估值为 60 亿美元，将自己定位为全球人工智能竞赛中的欧洲冠军。据首席执行官 Arthur Mensch 称，该公司最近从微软获得了投资，并正在为最终的 IPO做准备。

行业观察人士表示，随着人工智能行业的成熟，Mistral 专注于更小、更高效的模型可能会被证明是具有先见之明的。这种方法与OpenAI和Anthropic等专注于开发越来越大、更昂贵的模型的公司形成了鲜明对比。

“我们可能会看到与 2024 年相同的情况，甚至可能比现在更多，基本上是大量具有非常宽松许可证的开源模型，”Lample 预测道。“我们相信这种类型的模型将越来越多地商品化。”

随着竞争加剧和效率提升，Mistral 优化小型模型的策略可能有助于实现高级 AI 功能民主化，从而有可能加速各行业的采用，同时降低计算基础设施成本。

该公司表示，将在未来几周发布具有增强推理能力的更多模型，这将进行一次有趣的测试，看看其以效率为中心的方法是否能够继续匹配更大规模系统的能力。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/mistral-small-3-jiang-kai-yuan-ai-dai-gei-da-zhong-geng

Like (0)

王浩然作者

0 0

超越基准：DeepSeek-R1 和 o1 在实际任务中的表现如何

Previous 2025年2月2日

Ai2 发布 Tülu 3，这是一个完全开源的模型，以新颖的后训练方法超越了 DeepSeek v3 和 GPT-4o

Next 2025年2月3日

AI前沿

百度限制谷歌和必应抓取内容用于人工智能训练

中国互联网搜索提供商百度已更新其类似维基百科的百科服务，以防止谷歌和微软必应抓取其内容。在百度百科 robots.txt 文件的最新更新中观察到了这一变化，该文件拒绝 Googl…

AI News
2024年8月31日
000
AI前沿

Diffbot 的人工智能模型无需猜测——它能够知道，这要归功于万亿事实知识图谱

Diffbot是一家位于硅谷的小公司，以维护世界上最大的网络知识索引之一而闻名，该公司今天宣布发布一种新的人工智能模型，有望解决该领域最大的挑战之一：事实准确性。新模型是Meta…

王浩然
2025年1月10日
000
AI前沿

OpenAI 首席技术官 Mira Murati 表示她将离开公司

OpenAI首席技术官米拉·穆拉蒂周三在 X 上发帖称，她将离开公司。穆拉蒂表示，在这家人工智能初创公司工作了六年多后，她将离开公司，从事自己的探索。 “经过深思熟虑，我做出了离开…

王浩然
2024年9月26日
000
AI前沿

人工智能驱动的栩栩如生的人形机器人将成为“情感伴侣”

人形机器人 Uma 的设计与人类相似，能够理解自然语言，可以讲故事、回答问题这种栩栩如生的形态是否代表着机器人的未来？这是 Una，它是由总部位于深圳的优必选机器人公司打造的 …

王浩然
2025年2月21日
000
AI前沿

OpenAI已开始组建其机器人团队

OpenAI 以其人工智能模型而闻名，迄今为止，这些模型主要存在于云服务器、其网站以及适用于 PC 和移动设备的应用程序中。不过，该公司的雄心并不局限于软件领域：今天在 X 上，…

王浩然
2025年1月11日
000
AI前沿

英国签署人工智能安全条约保护人权与民主

英国签署了具有里程碑意义的人工智能安全条约，旨在保护人权、民主和法治免受人工智能可能带来的威胁。大法官沙巴纳·马哈茂德 (Shabana Mahmood) 今天签署了欧洲委员会的…

AI News
2024年9月6日
000
AI前沿

OpenAI 向公众发布超现实主义 AI 视频生成器 Sora Turbo

OpenAI 今天宣布公开发布其超现实主义 AI 视频生成软件Sora——距离 2024 年 2 月首次公开展示已过去近 10 个月。事实上，OpenAI 实际上发布的是比当时首…

王浩然
2024年12月10日
000
AI前沿

安娜·帕特森的Ceramic AI：助力企业更快速、高效地构建AI模型‌

在AI技术日新月异的今天，如何更快地构建高效、精准的模型成为了众多企业关注的焦点。安娜·帕特森，一位在AI领域深耕多年的专家，带着她的创新项目——Ceramic AI，为企业提供了…

王浩然
2025年3月8日
000
AI前沿

零售商通过 AI 投资创造和获取价值的 3 个步骤

随着各家公司争夺消费者的注意力和钱包，零售业正在发展，竞争也日益激烈。根据美国零售联合会的数据，2024 年上半年核心销售额同比增长 3.2%，预计总销售额将比 2023 年增长 …

王浩然
2024年11月10日
000
AI前沿

Mistral 推出其首款多模态模型 Pixtral 12B

法国人工智能初创公司Mistral发布了其首个可处理图像和文本的模型。这个名为 Pixtral 12B 的模型拥有 120 亿个参数，大小约为 24GB。参数大致对应于模型解决问…

王浩然
2024年9月13日
000
AI前沿

Stable Diffusion 3.5：文本到图像 AI 的架构进步

Stability AI发布了 Stable Diffusion 3.5，标志着文本转图像 AI 模型的又一次进步。此版本代表了一次全面改革，由宝贵的社区反馈和对突破生成式 AI …

点点
2024年10月25日
000
AI前沿

亚马逊的 Tye Brady 讨论下一代机器人仓库

过去几年，“交付未来”活动展示了亚马逊运营的最新技术。西雅图 2023 年的活动展示了该公司药房服务和无人机送货的最新进展。今年在纳什维尔，亚马逊讨论了人工智能对其购物体验的更新…

点点
2024年10月13日
000
AI前沿

搜索变得更智能：OpenAI 的 SearchGPT 如何改变游戏规则

在我们日益互联的世界里，高效而准确的网络搜索已变得至关重要。无论是学生为学术项目收集信息，还是专业人士想要了解最新的行业趋势，搜索引擎已成为我们日常生活中必不可少的一部分。然而，虽…

点点
2024年9月12日
000
AI前沿

医生称人工智能正在给患者护理带来麻烦

如今，时不时就会有研究声称人工智能在诊断健康问题方面比人类医生更胜一筹。这些研究之所以引人注目，是因为美国的医疗体系严重崩溃，每个人都在寻找解决方案。人工智能为医生提供了一个潜在的…

王浩然
2024年12月29日
000
AI前沿

苹果智能家居中心因Siri挑战而推迟发布‌

据最新报道，苹果公司的智能家居中心产品发布计划遭遇挫折，原因竟出自其内置的Siri语音助手。这款备受期待的智能家居中心原本被视为苹果在智能家居领域的一大突破，但如今却面临延期发布的…

王浩然
2025年3月11日
000
AI前沿

人工智能位居 2025 年最重要技术榜首；数据隐私和人工智能的作用

人工智能位居 2025 年最重要技术榜首一项针对全球技术专家的调查显示，人工智能（包括预测性和生成性人工智能、机器学习和自然语言处理）被评为最有可能成为 2025 年最重要的技术…

王浩然
2024年11月4日
000
AI前沿

起底AIGC概念股：退潮之后，谁在裸泳？

生成式AI技术狂飙一年多以后，A股市场的「AIGC概念股」正在经历一场集体的「去泡沫」。截至9月12日收盘，相比去年的涨幅，今年以来，万得AIGC概念指数(8841660.WI)…

点点
2024年9月13日
000
AI前沿

构建还是购买？2025 年扩展您的企业级 AI 管道

扩大生成工具的采用范围一直是平衡野心与实用性的挑战，而在 2025 年，风险比以往任何时候都高。竞相采用大型语言模型 (LLM) 的企业正在面临一个新的现实：扩大规模不仅仅是部署更…

王浩然
2025年1月19日
000
AI前沿

在 AI 代理模拟中，Sam Altman 总会赢得 OpenAI 棋盘战斗吗？

一年前的今天，Sam Altman 在被解雇仅五天后重返 OpenAI。董事会会议室里到底发生了什么？游戏和人工智能模拟公司 Fable 开发了人工智能 Sim Francisco…

王浩然
2024年11月25日
000
AI前沿

iPhone 16 今日发布，但并未配备最受关注的功能：Apple Intelligence

iPhone 16将于本周五正式发售。但对于最早的采用者来说，这款手机在发售时就已经做出了根本性的妥协。简而言之，这不是他们承诺的 iPhone 16。苹果首席执行官蒂姆·库克表…

王浩然
2024年9月21日
000