Pixtral 12B 现已上市：Mistral 的新型多模态 AI 可以无限制地分析图像

王浩然 • 2024年9月15日下午5:00 • 技术评测 • 111 views

Mistral AI 终于进军多模态领域。今天，这家法国 AI 初创公司与 OpenAI 和 Anthropic 等公司展开竞争，发布了 Pixtral 12B，这是其首款同时具备语言和视觉处理能力的多模态模型。

虽然该模型目前尚未在公共网络上发布，但可以从Hugging Face或GitHub下载其源代码，以在单个实例上进行测试。这家初创公司再次打破了AI 模型的典型发布趋势，首先提供了一个 torrent 链接来下载新模型的文件。

不过，该公司开发者关系主管 Sophia Yang 在X 帖子中指出，该公司将很快通过其网络聊天机器人提供该模型，让潜在的开发者可以试用。它还将在 Mistral 的 La Platforme 上推出，该平台提供使用该公司模型的 API 端点。

Pixtral 12B 带来了什么？

虽然新模型的官方细节（包括训练数据）仍处于保密状态，但核心理念似乎是 Pixtral 12B 将允许用户分析图像，同时结合文本提示。因此，理想情况下，人们可以上传图像或提供图像链接，并询问有关文件中主题的问题。

这是 Mistral 的首次举措，但值得注意的是，包括 OpenAI 和 Anthropic 等竞争对手在内的多种其他模型都已经具备图像处理能力。

当一位 X 用户询问杨先生，Pixtral 的 120 亿参数模型有何独特之处时，她回答说，该模型本身就可以支持任意数量和任意大小的图像。

正如X上的初始测试人员所分享的那样，24GB 模型的架构似乎有 40 层、14,336 个隐藏维度大小和 32 个注意力头，可进行大量的计算处理。

在视觉方面，它有一个专用的视觉编码器，支持 1024×1024 图像分辨率和 24 个隐藏层，用于高级图像处理。

然而，当公司通过 API 提供该功能时，这种情况可能会改变。

Mistral 将全力以赴挑战领先的 AI 实验室

随着 Pixtral 12B 的推出，Mistral 将进一步实现内容和数据分析等视觉应用的民主化。是的，开放模型的确切性能还有待观察，但这项工作无疑建立在该公司在 AI 领域采取的积极态度之上。

自去年推出以来，Mistral 不仅建立了强大的模型管道，与 OpenAI 等领先的人工智能实验室展开竞争，而且还与微软、AWS 和 Snowflake 等行业巨头合作，扩大其技术的影响力。

就在几个月前，它以 60 亿美元的估值筹集了 6.4 亿美元，随后推出了 Mistral Large 2，这是一个 GPT-4 类模型，具有先进的多语言功能以及在推理、代码生成和数学方面的改进性能。

它还发布了混合专家模型Mixtral 8x22B 、一个名为Codestral的 22B 参数开放权重编码模型，以及用于数学相关推理和科学发现的专用模型。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/pixtral-12b-xian-yi-shang-shi-mistral-de-xin-xing-duo-mo

AI 模型 Anthropic GitHub Mistral OpenAI Pixtral 多模态训练数据

Like (0)

王浩然作者

0 0

LLaMA-Omni：与 Siri 和 Alexa 一较高下的开源 AI

Previous 2024年9月15日

TikTok 将自动标记平台上的 AI 生成内容

Next 2024年9月15日

技术评测

10 款最佳 AI 表单生成器

高效的数据收集和用户参与对于企业和组织至关重要。人工智能 (AI) 颠覆了表单创建流程，提供了创新的解决方案，简化了创建过程，增强了用户体验，并提供了有价值的见解。

AI评测师
2024年8月27日
000
技术评测

三星新款笔记本电脑的人工智能功能实际上翻了一番

三星在新闻发布室发布了一篇帖子，宣布其最新的 Galaxy Book 型号 Galaxy Book5 Pro 360 将成为其首款新型“强力 AI PC”。这是一款Copilot+…

王浩然
2024年9月9日
000
技术评测

Vidyo AI 评论：将 1 小时的视频制作成 22 个热门短片

您是否曾发现自己被长达数小时的视频片段所淹没，希望能够弹指一挥就将其变成引人入胜的社交媒体剪辑？如果您曾经面临将长视频剪辑成简短、引人入胜的内容这一艰巨任务，那么您并不孤单。这个…

王浩然
2024年8月22日
000
技术评测

iPhone 16、Apple Intelligence、AirPods 4 等：2024 年 Apple Event 上揭晓的一切

苹果今年最大的活动已经到来，随之而来的是 iPhone 16 系列和一系列与 iOS 18 相关的 AI 更新。Apple Intelligence 是今年苹果活动的明星，就像 6…

王浩然
2024年9月10日
000
技术评测

微软终于让 Copilot+ 笔记本电脑可用于人工智能

微软的 Copilot+ PC 计划大获成功，其中许多都跻身最佳笔记本电脑之列，但并非因为其内置的 AI 硬件。现在，微软终于将 Copilot+ PC 中的神经处理单元 (NPU…

王浩然
2024年10月4日
000
技术评测

苹果终于出AI消除功能，相册可以利用起来了

昨天凌晨，苹果推送了 iOS18.1 第三个 beta 版本。目前 18.1 Beta 是苹果专门用来测试 Apple Intelligence 的，只有 iPhone 15 P…

AI评测师
2024年9月2日
000
技术评测

Google 如何让 Medium.com 的抄袭内容超越原创内容

多年来，Google 一直向网站站长社区强调，原创、高质量的内容是获得良好搜索结果排名的关键。Google 的系统旨在奖励那些展现出EEAT（专业性、经验性、权威性和可信度）的内容…

AI评测师
2024年10月5日
000
技术评测

AI 语言对决：比较 C++、Python、Java 和 Rust 的性能

在人工智能 (AI)开发中，编程语言的选择对于确定项目的效率和成功起着至关重要的作用。C++、Python、Java 和 Rust 各自具有独特的优势和特性，可以显著影响结果。这些…

AI评测师
2024年8月30日
000
技术评测

掌握 CUDA：面向机器学习工程师

计算能力已成为突破机器学习极限的关键因素。随着模型变得越来越复杂，数据集呈指数级增长，传统的基于 CPU 的计算往往无法满足现代机器学习任务的需求。这就是 CUDA（统一计算设备架…

AI评测师
2024年9月4日
000
AI前沿

Automattic 为员工提供了另一次辞职机会——这次的遣散费为 9 个月

Automattic 首席执行官马特·穆伦维格 (Matt Mullenweg) 向有意离职的员工提供为期六个月的遣散费，几天后， 159 人接受了这一提议。10 月 16 日晚，…

王浩然
2024年10月24日
000
技术评测

不要错过 Google Gemini 的深度研究模式：8 个信息丰富的报告示例

人工智能和商业领域的许多人都关注OpenAI 和 DeepSeek （从轶事和撰写/发布的文章和消息数量来看），尤其是 OpenAI 的由 o3 驱动的深度研究模式，这是一种新的…

王浩然
2025年2月14日
000
技术评测

Ray-Ban Meta 的新更新添加了提醒和语音消息

Meta 为其 Ray-Ban 智能眼镜添加了提醒功能，这是上个月Connect 活动期间预览的一项功能。更新后，您可以让 Meta AI 记住您的周围环境，例如您停车的位置，甚至…

王浩然
2024年10月6日
000
技术评测

企业 LLM API：2024 年支持 LLM 应用程序的最佳选择

最近，随着一些重大新闻的出现，企业 AI 领域的竞争正在加速。 OpenAI 的 ChatGPT目前拥有超过2 亿周活跃用户，比一年前增加了 1 亿。这一惊人的增长表明，企业环境中…

AI评测师
2024年9月20日
000
技术评测

为什么苹果在 iPhone 16 上又增加了一个按钮

苹果有得有失——尤其是在端口和按钮方面。长期以来，该公司对任何可能破坏其设备风水的细节都采取了“少即是多”的态度。如今，该公司对按钮的态度更加乐观。在 Apple Watch Ul…

王浩然
2024年9月10日
000
技术评测

iPad 上最强的绘画应用，宣布拒绝生成式 AI

小公司，大底气。

点点
2024年8月21日
000
技术评测

10 款最佳 AI 健身工具（2024 年 9 月）

人工智能正在通过提供触手可及的个性化锻炼体验，彻底改变健身行业。人工智能驱动的锻炼应用和工具对于各个级别的健身爱好者来说都变得不可或缺，它们提供量身定制的训练计划、实时反馈和随着您…

AI评测师
2024年9月27日
000
技术评测

TensorRT-LLM：优化大型语言模型推理以实现最佳性能的综合指南

随着对大型语言模型 (LLM) 的需求不断增长，确保快速、高效且可扩展的推理变得比以往任何时候都更加重要。NVIDIA 的TensorRT-LLM通过提供一套专为 LLM 推理设计…

AI评测师
2024年9月14日
000
技术评测

什么是 ChatGPT Plus？订阅前您需要了解以下信息

ChatGPT完全免费使用，但这并不意味着 OpenAI 对赚钱不感兴趣。 ChatGPT Plus 是一项订阅服务，让您可以访问GPT-4o大型语言模型，同时享受更快的速度、更高…

王浩然
2024年9月16日
000
技术评测

什么是“模型崩溃”？专家解释有关即将到来的人工智能末日的谣言

人工智能预言家和新闻贩子们预测生成式人工智能炒作的终结，并谈论即将发生的灾难性的“模型崩溃”。但这些预测有多现实？模型崩溃到底是什么？ “模型崩溃”这一概念在2023 年就被讨论…

AI评测师
2024年9月3日
000
技术评测

社交网络 Buttflies AI 添加了一项功能，可将你变成 AI 角色

Butterflies AI是一个人类与人工智能相互交流的新型社交网络，它正在推出一项新的克隆功能，可以将您变成人工智能角色。此次最新添加的功能建立在 6 月份向公众推出的一项功…

王浩然
2024年8月31日
000