Nvidia 刚刚发布了一款开源 LLM，与 GPT-4 竞争

点点 • 2024年10月4日上午10:00 • 技术评测 • 81 views

Nvidia 是人工智能行业最抢手的 GPU制造商之一，该公司宣布已发布一个开源大型语言模型，据报道其性能可与OpenAI、Anthropic、Meta和谷歌等领先的专有模型相媲美。

该公司在最近发布的白皮书中介绍了其新的 NVLM 1.0 系列，其中最引人瞩目的是拥有 720 亿个参数的 NVLM-D-72B 模型。研究人员写道：“我们推出了 NVLM 1.0，这是一系列前沿级多模态大型语言模型，在视觉语言任务上取得了最先进的成果，可与领先的专有模型（例如 GPT-4o）和开放访问模型相媲美。”

据报道，新模型系列已经具备“生产级多模态性”的能力，在各种视觉和语言任务中均表现出色，此外，与 NVLM 系列所基于的基础 LLM 相比，基于文本的响应也得到了改进。研究人员解释说：“为了实现这一点，我们精心设计并集成了一个高质量的纯文本数据集，将其与大量多模态数学和推理数据一起整合到多模态训练中，从而增强了跨模态的数学和编码能力。”

最终，法学硕士课程不仅能轻松解释某个表情包为何有趣，还能逐步解答复杂的数学方程式。得益于多模态训练风格，Nvidia 还成功将该模型的纯文本准确率在常见行业基准测试中平均提高了 4.3 个百分点。

Nvidia 似乎非常重视确保该模型符合开放源代码倡议对“开源”的最新定义，不仅将其训练权重开放供公众审查，还承诺在不久的将来发布该模型的源代码。这与OpenAI和谷歌等竞争对手的做法截然不同，后者对其 LLM 权重和源代码的细节严加保密。通过这样做，Nvidia 将 NVLM 系列定位为不一定直接与ChatGPT-4o和Gemini 1.5 Pro竞争，而是作为第三方开发人员构建自己的聊天机器人和 AI 应用程序的基础。

原创文章，作者：点点，如若转载，请注明出处：https://www.dian8dian.com/nvidia-gang-gang-fa-bu-le-yi-kuan-kai-yuan-llm-yu-gpt4-jing

Like (0)

点点

0 0

Microsoft Copilot 现在可以发声，并能在互联网上“看到你所看到的内容”

Previous 2024年10月4日上午9:00

微软终于让 Copilot+ 笔记本电脑可用于人工智能

Next 2024年10月4日上午11:00

技术评测

Perplexity AI 评论：彻底抛弃 Google 和 ChatGPT 吗？

您是否厌倦了无休止地筛选似乎不合时宜的搜索结果？或者您是否对经常无法满足您的研究需求的AI 工具感到失望？人们很容易花费无数的时间浏览搜索结果，并与似乎很少能提供您所需内容的 A…

AI评测师
2024年8月28日
000
技术评测

Pixtral 12B 现已上市：Mistral 的新型多模态 AI 可以无限制地分析图像

Mistral AI 终于进军多模态领域。今天，这家法国 AI 初创公司与 OpenAI 和 Anthropic 等公司展开竞争，发布了 Pixtral 12B，这是其首款同时具备…

王浩然
2024年9月15日
000
技术评测

Plaud NotePin 有望在其他可穿戴 AI 失败的地方取得成功

到目前为止，可穿戴 AI 的记录并不特别好。今年，我们已经看到 Humane（其备受诟病的 AI 别针背后的公司）在短短几个月内就破产了。Rabbit R1 的发布也遭遇了类似的负…

AI评测师
2024年9月2日
000
技术评测

强烈推荐10个人工智能小项目

实时车道线检测借助这一实时车道线检测项目，可以提升大家的人工智能水平。它利用最先进的算法，可实时准确地识别和跟踪车道标记。该项目在改善道路安全方面提供了实用、高影响力的人工智能应…

AI评测师
2024年9月6日
000
技术评测

如何（以及何时）在 Gmail 和 Google Docs 中使用 Gemini AI

这是 Google Gemini 写作辅助的用武之地，以及如何最好地使用它。

AI评测师
2024年9月2日
000
技术评测

AI 语言对决：比较 C++、Python、Java 和 Rust 的性能

在人工智能 (AI)开发中，编程语言的选择对于确定项目的效率和成功起着至关重要的作用。C++、Python、Java 和 Rust 各自具有独特的优势和特性，可以显著影响结果。这些…

AI评测师
2024年8月30日
000
技术评测

【深度】OpenAI o1技术原理分析及产业影响

距离OpenAI发布o1模型已经过去一周，其口碑出现了明显的两极分化。一种声音认为o1的出现意味着人类距离AGI只有咫尺之遥，另一种声音认为o1又贵又不好使，其能力表现甚至不如G…

AI评测师
2024年9月25日
000
技术评测

Agility Robotics 的 Digit：自动化劳动力的未来

在当今瞬息万变的世界，自动化正在以惊人的速度重塑行业，使机器人成为劳动力的重要组成部分。Agility Robotics凭借其先进的人形机器人引领着这一激动人心的变革。其旗舰产品D…

AI评测师
2024年8月27日
000
技术评测

从微调稳定扩散模型中提取训练数据

美国的新研究提出了一种从微调模型中提取大量训练数据的方法。当艺术家的风格被抄袭，或者受版权保护的图像被用于训练公众人物、受知识产权保护的角色或其他内容的生成模型时，这可能会提供法…

AI评测师
2024年10月8日
000
AI前沿

利用人工智能节省照片筛选时间

如果您是摄影师，没有什么比在大型活动或拍摄后整理数百张（甚至数千张）照片更耗时的事情了。您是否知道专业摄影师平均每小时拍摄一次，要花 3-4 个小时进行编辑？我最近偶然发现了Af…

AI评测师
2024年10月7日
000
技术评测

10 款最佳 AI 表单生成器

高效的数据收集和用户参与对于企业和组织至关重要。人工智能 (AI) 颠覆了表单创建流程，提供了创新的解决方案，简化了创建过程，增强了用户体验，并提供了有价值的见解。

AI评测师
2024年8月27日
000
技术评测

使用 JPEG 压缩来改善神经网络训练

加拿大的一篇新研究论文提出了一个框架，该框架有意将 JPEG 压缩引入神经网络的训练方案中，并设法获得更好的结果以及更好的抵抗对抗性攻击的能力。这是一个相当激进的想法，因为目前的…

AI评测师
2024年10月11日
000
技术评测

Python 中的异步 LLM API 调用：综合指南

作为开发人员和数据科学家，我们经常需要通过 API 与这些强大的模型进行交互。然而，随着我们的应用程序的复杂性和规模不断增长，对高效且高性能的 API 交互的需求变得至关重要。这就…

AI评测师
2024年9月4日
000
技术评测

开源 DeepSeek-R1 使用纯强化学习来匹敌 OpenAI o1 — 成本降低 95%

中国人工智能初创公司DeepSeek以使用开源技术挑战领先的人工智能供应商而闻名，最近它又抛出了一颗重磅炸弹：一项名为 DeepSeek-R1 的全新开放式推理法学硕士学位课程。 …

王浩然
2025年1月21日
000
技术评测

iPhone 16、Apple Intelligence、AirPods 4 等：2024 年 Apple Event 上揭晓的一切

苹果今年最大的活动已经到来，随之而来的是 iPhone 16 系列和一系列与 iOS 18 相关的 AI 更新。Apple Intelligence 是今年苹果活动的明星，就像 6…

王浩然
2024年9月10日
000
技术评测

微软更安全的 Windows Recall 功能也可被用户卸载

为了回应安全问题，微软详细介绍了如何彻底改造其备受争议的人工智能 Recall 功能，该功能可以截取您在计算机上看到或执行的几乎所有操作的屏幕截图。Recall 最初应该在 6 月…

王浩然
2024年9月30日
000
技术评测

Google 如何让 Medium.com 的抄袭内容超越原创内容

多年来，Google 一直向网站站长社区强调，原创、高质量的内容是获得良好搜索结果排名的关键。Google 的系统旨在奖励那些展现出EEAT（专业性、经验性、权威性和可信度）的内容…

AI评测师
2024年10月5日
000
技术评测

Phrasly 评论：它真的能让 AI 内容听起来像人类吗？

您是否想过，人工智能生成的内容是否真的听起来像人类？我最近遇到了Phrasly，事实证明，它可以将人工智能的效率与人类写作的真实性融为一体！在这篇 Phrasly 评论中，我将讨…

王浩然
2025年1月14日
000
技术评测

Grok 真的比 Midjourney 好吗？以下是两者的比较

说到 AI 图像生成器，如今有几十种选择。该系列中的两款佼佼者（包括 Dall-E、 Firefly、Stable Diffusion 和 Playground AI）是Midjo…

王浩然
2024年9月16日
000
技术评测

Midjourney 正在推出一款名为“Patchwork”的多人协作世界构建工具

Midjourney是一家流行的 AI 图像生成初创公司，仅在其 Discord 服务器上就有超过 2100 万用户，该公司正在从 AI图像创建和编辑领域拓展业务。拼凑物显露 M…

王浩然
2024年12月12日
000

发表回复

Please Login to Comment

Nvidia 刚刚发布了一款开源 LLM，与 GPT-4 竞争

相关推荐

发表回复

Share To :