Nvidia 刚刚发布了一款开源 LLM,与 GPT-4 竞争

Nvidia 刚刚发布了一款开源 LLM,与 GPT-4 竞争

Nvidia 是人工智能行业最抢手的 GPU制造商之一,该公司宣布已发布一个开源大型语言模型,据报道其性能可与OpenAIAnthropicMeta和谷歌等领先的专有模型相媲美。

该公司在最近发布的白皮书中介绍了其新的 NVLM 1.0 系列,其中最引人瞩目的是拥有 720 亿个参数的 NVLM-D-72B 模型。研究人员写道:“我们推出了 NVLM 1.0,这是一系列前沿级多模态大型语言模型,在视觉语言任务上取得了最先进的成果,可与领先的专有模型(例如 GPT-4o)和开放访问模型相媲美。”

据报道,新模型系列已经具备“生产级多模态性”的能力,在各种视觉和语言任务中均表现出色,此外,与 NVLM 系列所基于的基础 LLM 相比,基于文本的响应也得到了改进。研究人员解释说:“为了实现这一点,我们精心设计并集成了一个高质量的纯文本数据集,将其与大量多模态数学和推理数据一起整合到多模态训练中,从而增强了跨模态的数学和编码能力。”

最终,法学硕士课程不仅能轻松解释某个表情包为何有趣,还能逐步解答复杂的数学方程式。得益于多模态训练风格,Nvidia 还成功将该模型的纯文本准确率在常见行业基准测试中平均提高了 4.3 个百分点。

Nvidia 刚刚发布了一款开源 LLM,与 GPT-4 竞争

Nvidia 似乎非常重视确保该模型符合开放源代码倡议对“开源”的最新定义,不仅将其训练权重开放供公众审查,还承诺在不久的将来发布该模型的源代码。这与OpenAI和谷歌等竞争对手的做法截然不同,后者对其 LLM 权重和源代码的细节严加保密。通过这样做,Nvidia 将 NVLM 系列定位为不一定直接与ChatGPT-4o和Gemini 1.5 Pro竞争,而是作为第三方开发人员构建自己的聊天机器人和 AI 应用程序的基础。

原创文章,作者:点点,如若转载,请注明出处:https://www.dian8dian.com/nvidia-gang-gang-fa-bu-le-yi-kuan-kai-yuan-llm-yu-gpt4-jing

Like (0)
点点的头像点点
Previous 2024年10月4日 上午9:00
Next 2024年10月4日 上午11:00

相关推荐

发表回复

Please Login to Comment