欧洲版OpenAI，法国独角兽推多模态大模型Pixtral 12B，源代码已开放下载

点点 • 2024年9月13日下午4:00 • AI前沿 • 142 views

智东西9月12日消息，据VentureBeat报道，法国大模型独角兽Mistral AI昨日正式发布Pixtral 12B，这是该公司首个能够同时处理文本和图像的多模态大模型。

Pixtral 12B拥有120亿参数，大小约为24GB，该模型允许用户上传图像或提供图像链接，并能针对图像内容提出问题。

Mistral直接提供了一个磁力链接，用于下载新模型文件。目前Pixtral 12B模型尚未对公众开放网络使用，但其源代码已经可以在Hugging Face和GitHub上下载，方便用户在本地实例上进行测试。

磁力链接：Release v1.4.0 – Mistral common goes 🖼 · mistralai/mistral-common · GitHub

此外，Mistral开发者关系负责人Sophia Yang在社交平台X上发文透露，该模型将很快在Mistral的聊天机器人Le Chat和API平台Le platform上提供。

Mistral AI由前DeepMind研究员Arthur Mensch、前Meta员工Timothée Lacroix和前Meta员工Guillaume Lample于2023年4月共同创立。

据悉，Mistral在6月份筹集了6.45亿美元的资金，将其估值推高至60亿美元。

欧洲版OpenAI，法国独角兽推多模态大模型Pixtral 12B，源代码已开放下载

Mistral开发者关系负责人Sophia Yang在社交平台X上透露，Pixtral 12B将很快在Mistral的聊天机器人Le Chat和API平台Le platform上提供（图源：X截图）

一、Pixtral 12B模型能够原生支持任意图像：40层架构、14336个隐藏维度、32个注意力头

Pixtral 12B模型是Mistral AI的Nemo 12B文本模型的延伸，具备处理通过URL链接或base64编码提供的图像的能力。无论图像的数量或尺寸如何，Pixtral 12B都能够回答相关问题。

据悉，Pixtral 12B大小约为24GB，其架构包含40层、有14336个隐藏维度和32个注意力头，能够执行广泛的计算处理。

据TechCrunch报道，大多数生成式AI模型，包括Mistral的其他模型，都是基于来自网络的大量公共数据进行训练的，这些数据通常受版权保护。

尽管Pixtral 12B模型的官方细节和训练数据目前仍然保密，但其核心功能是允许用户分析图片，并将文本提示与图片结合起来进行综合处理。

这意味着用户可以上传图像或提供图像链接，并针对图像内容提出问题，Pixtral 12B将能够理解和回答这些问题。

发布Pixtral 12B对Mistral来说是首次尝试，但需要注意的是，其他竞争对手，如OpenAI和Anthropic，已经推出了具备图像处理功能的模型。

在X平台上，当被问及Pixtral 12B模型的120亿参数有何独特之处时，Mistral AI的开发者关系负责人Sophia Yang回答说：“该模型的特别之处在于它能够原生支持任意数量和任意尺寸的图像。”

据外媒NewsBytes报道，该模型有望执行诸如为图像添加标题和计算照片中的对象等任务，类似于Anthropic的Claude家族和OpenAI的GPT-4o等其他多模态模型。

在视觉处理方面，该模型配备了一个专用的视觉编码器，不仅能处理1024×1024分辨率的图像，还具备24个隐藏层以支持高级图像处理功能。

二、Mistral被誉为“欧洲版OpenAI”，其Large 2模型支持80多种编程语言

Mistral AI成立仅一年多，就因为其在AI技术上的影响力，被业界称为“欧洲版OpenAI”。

目前，Mistral已经与Microsoft、AWS和Snowflake等行业巨头建立了合作关系，以扩大其技术的覆盖范围。

Mistral开发者关系主管Sophia Yang称，Pixtral 12B将很快在Le Chat和Le Platforme上推出。

La Platforme是Mistral AI提供的一个服务平台，它提供三个聊天端点，mistral-tiny、mistral-small和mistral-medium，这些端点能够根据文本说明生成文本。

除聊天端点外，该平台还提供了一个嵌入端点Mistral-embed。该端点具有1024维度的嵌入模型，专为检索功能设计，在MTEB上达到了55.26的检索得分，适合需要进行文本相似性分析和数据检索的应用场景。

此外，在Pixtral 12B发布的几个月前，Mistral就已经推出了Mistral Large 2模型。

Mistral Large 2具有1230亿参数和128k的上下文窗口，支持包括中文、英语、法语、德语、西班牙语、意大利语、俄语、日语和韩语在内的多种语言，以及80多种编程语言。

这款GPT-4级别的模型不仅具备先进的多语言处理能力，还在推理、代码生成和数学性能方面实现了显著提升。

此外，该公司还推出了多个先进模型，包括具有专家混合架构的Mixtral 8x22B、开放权重编码模型Codestral（参数规模达22B），以及专为数学推理和科学发现设计的专用模型。

结语：Pixtral 12B输出不受限制，确切性能有待考究

随着Pixtral 12B的推出，Mistral将进一步拓展视觉应用程序的访问渠道。

虽然该开放模型的确切性能尚待验证，但这一举措延续了Mistral在AI领域所采取的积极策略。

TechCrunch援引知情人士称，Pixtral 12B模型可以在Apache 2.0许可下进行微调和使用。这意味着该模型的输出可以不受限制地用于个人或商业用途。

作为欧洲AI领域的新星，Mistral AI正以其独特的商业模式和开放策略，迅速崛起为全球AI竞赛中的重要参与者，其未来发展值得我们持续关注。

原创文章，作者：点点，如若转载，请注明出处：https://www.dian8dian.com/ou-zhou-ban-openai-fa-guo-du-jiao-shou-tui-duo-mo-tai-da-mo

DeepMind Le platform Mistral AI Pixtral 欧洲版OpenAI

Like (0)

点点

0 0

OpenAI o1比博士还“聪明”，全球11位AI大咖怎么看？

Previous 2024年9月13日下午3:00

从自动驾驶到机器人，群体智能将掀开AI下一篇章？

Next 2024年9月13日下午5:00

AI前沿

智能适配，成就AI成功应用的关键：精准计算的力量

在当今这个技术日新月异的时代，人工智能（AI）已成为推动企业转型和创新的重要力量。然而，尽管AI技术潜力巨大，但其在实际应用中的成功却往往受到诸多因素的制约。其中，一个至关重要却常…

王浩然
2025年3月21日
000
AI前沿

Cerebras-Perplexity 交易以超快 AI 瞄准 1000 亿美元搜索市场

Cerebras Systems和Perplexity AI正在联手挑战传统搜索引擎的主导地位，并宣布建立合作伙伴关系，承诺以以前认为不可能的速度提供近乎即时的人工智能搜索结果。 …

王浩然
2025年2月12日
000
AI前沿

Meta 不愿透露是否利用智能眼镜拍摄的照片来训练 AI

Meta 的 AI 驱动雷朋眼镜正面有一个隐蔽的摄像头，不仅会在你要求时拍照，还会在 AI 功能触发某些关键词（例如“看”）时拍照。这意味着这款智能眼镜会收集大量照片，包括有意拍摄…

点点
2024年10月2日
000
AI前沿

Meta 放弃事实核查内容：这对企业意味着什么

Facebook 创始人兼 Meta 首席执行官马克·“扎克”·扎克伯格今天再次震惊了世界，他宣布将彻底改变该公司在美国审核和处理用户生成帖子和内容的方式扎克伯格于今天早上（1 …

王浩然
2025年1月8日
000
AI前沿

沃尔玛和亚马逊利用人工智能推动零售转型

沃尔玛和亚马逊正在利用人工智能推动零售转型，带来全新的消费者体验并提高运营效率。据分析公司GlobalData称，沃尔玛正专注于增强现实和人工智能增强型商店管理。与此同时，亚马逊…

点点
2024年9月17日
000
AI前沿

DeepSeek 声称其“推理”模型在某些基准上击败了 OpenAI 的 o1

中国人工智能实验室 DeepSeek 发布了其所谓的推理模型 DeepSeek-R1 的开放版本，声称该模型在某些人工智能基准上的表现与 OpenAI 的o1一样好。 R1 可从 …

王浩然
2025年1月21日
000
AI前沿

Equinix 筹集 150 亿美元新资本，投资 xScale 数据中心以满足 AI 需求

Equinix 已筹集 150 亿美元资金，用于扩展其 xScale 数据中心以用于 AI，特别是用于在美国的投资总部位于加利福尼亚州雷德伍德城的 Equinix 凭借遍布全球的…

王浩然
2024年10月3日
000
AI前沿

Midjourney 表示正在“进军硬件领域”

据报道，人工智能图像生成平台 Midjourney在未获得任何风险投资的情况下就获得了超过 2 亿美元的收入，目前该平台正在进军硬件领域。该公司周三在 X 上的一篇帖子中宣布了这…

王浩然
2024年8月29日
000
AI前沿

Cohere 最小、最快的 R 系列模型在 RAG 方面表现出色，能够推理 23 种语言

人工智能初创公司Cohere发布了 Command R7B，这是其 R 模型系列中最小、最快的模型，以证明其支持广泛企业用例的意图，包括那些不需要昂贵、资源密集型的大型语言模型(L…

王浩然
2024年12月16日
000
AI前沿

Midjourney的新研究：让大型语言模型更具创意地写作

在人工智能领域，创新总是层出不穷。近日，以AI图像生成为主的Midjourney公司携手纽约大学（NYU）的机器学习专家，发布了一项令人瞩目的新研究。这项研究专注于提升文本型大型语…

王浩然
2025年3月25日
000
AI前沿

Fal.ai 是一家提供媒体生成 AI 模型的公司，从 a16z 和其他公司筹集了 2300 万美元

Fal.ai是一个专注于 AI 生成音频、视频和图像开发的平台，今天该公司透露，它已经从 Andreessen Horowitz (a16z)、Black Forest Labs联…

王浩然
2024年9月19日
000
AI前沿

.world 域名正在帮助品牌挖掘未来的互动潜力

元宇宙的终极愿景——一个横跨多个平台、连接物理世界和虚拟世界的沉浸式环境、点对点互动、交易、用户生成内容和世界构建——可能尚未完全实现。但它已经引导了消费者的期望，并激励各种规模的…

王浩然
2024年12月4日
000
AI前沿

5.25 亿美元债券资助智能能源扩张

台达电子宣布发行 5.25 亿美元债券，以加速开发基于物联网的下一代智能节能解决方案，以支持人工智能、智能制造、电动汽车和能源转型。此次通过台湾子公司台达国际控股有限…

王浩然
2025年1月26日
000
AI前沿

Tessl 以 5 亿美元以上的估值筹集 1.25 亿美元，用于构建编写和维护代码的 AI

许多初创公司和大型科技公司都尝试开发人工智能来编写软件。现在，又有一家新公司从幕后走出来，加入竞争行列，其使命是解决人类和所有这些人工智能一起编写代码时出现的许多问题。 Tessl…

王浩然
2024年11月15日
000
AI前沿

沃尔沃携手Nvidia，未来车型搭载AI芯片引领智能驾驶

沃尔沃新款 EX90 SUV 将采用 Nvidia 的 Orin 片上系统，为先进的人工智能驱动安全和自动驾驶铺平道路

点点
2024年9月7日
000
AI前沿

30年冷板凳，诺贝尔物理学奖得主Hinton的AI往事

Geoffrey E. Hinton大概没想到诺贝尔物理学奖颁给了自己。收到消息后，他被迫取消了预约好的核磁共振。 2024年诺贝尔物理学奖揭晓。机器学习专家John J. Hop…

点点
2024年10月9日
000
AI前沿

据报道，OpenAI 的。GPT-5 未达到预期

《华尔街日报》最新报道称，OpenAI 开发下一个主要模型 GPT-5 的努力正在落后于计划，其结果尚未证明其巨大的成本是合理的。这与 The Information之前的一篇报…

王浩然
2024年12月23日
000
AI前沿

如果你认为 SearchGPT 已经准备好取代谷歌，那可能只是幻觉

当OpenAI首次推出SearchGPT时，演示表明人们在网上搜索东西的方式将立即永远改变。但是，当人工智能搜索引擎的运行示例被证明存在一些缺陷时，“哇”变成了“哇，这太尴尬了” …

王浩然
2024年9月9日
000
AI前沿

OpenAI 呼吁美国政府将其数据输入人工智能系统

OpenAI 表示，美国只有借助人工智能才能在全球舞台上击败中国。 OpenAI 希望你将人工智能视为汽车。欧洲发明了汽车，但严格的监管阻碍了汽车在那里的广泛应用。在自由放任的美国…

王浩然
2025年1月21日
000
AI前沿

ApertureData 获得 825 万美元种子资金并推出 ApertureDB Cloud 以彻底改变多模式 AI

ApertureData是一家处于多模态 AI 数据管理前沿的公司，该公司在超额认购的种子轮融资中筹集了 825 万美元，以推动其开创性平台 ApertureDB 的开发和扩展。此…

点点
2024年10月11日
000