IBM 希望凭借其新的开源 Granite 3.1 模型成为企业 LLM 之王

王浩然 • 2024年12月22日上午11:00 • AI前沿 • 62 views

IBM 今天发布了新的 Granite 3.1 系列，从而巩固了其在开源 AI 排行榜上的领先地位。

Granite 3.1大型语言模型(LLM) 为企业用户提供了 128K 标记的扩展上下文长度、新的嵌入模型、集成的幻觉检测和改进的性能。据 IBM 称，新的 Granite 8B Instruct 模型超越了同规模的开源竞争对手，包括 Meta Llama 3.1、Qwen 2.5 和 Google Gemma 2。IBM 在 OpenLLM 排行榜中包含的一系列学术基准中对其模型进行了排名。

新模型是 IBM Granite开源模型加速发布节奏的一部分。Granite 3.0刚刚于 10 月发布。当时，IBM 声称其与生成 AI 相关的业务账簿价值 20 亿美元。通过 Granite 3.1 更新，IBM 专注于将更多功能打包到较小的模型中。基本思想是较小的模型更易于企业运行，并且运营成本更低。

IBM 研究部 AI 模型副总裁 David Cox 说：“我们还提高了所有数字——几乎所有方面的表现都得到了提升。”“我们将 Granite 用于许多不同的用例，我们在 IBM 内部将其用于我们的产品，我们将其用于咨询，我们将其提供给客户，并将其作为开源发布，所以我们必须在所有方面都表现出色。”

为什么性能和更小的模型对企业 AI 很重要

企业可以使用多种方法来根据基准评估 LLM 的绩效。

IBM 采取的方向是让模型通过一系列学术和现实世界的测试。Cox 强调，IBM 测试并训练了其模型，以针对企业用例进行优化。性能不仅仅是某种抽象的速度衡量标准；相反，它是一种更细致入微的效率衡量标准。

IBM 致力于推动的效率的一个方面是帮助用户花费更少的时间获得期望的结果。

“你应该少花点时间在提示上，”考克斯说。“所以，某个领域的模型越强大，你花在设计提示上的时间就越少。”

效率还与模型大小有关。模型越大，通常需要的计算和 GPU 资源就越多，这也意味着成本更高。

“当人们进行最小可行原型工作时，他们通常会跳到非常大的模型，因此您可能会使用 700 亿参数模型或 4050 亿参数模型来构建原型，”考克斯说。“但现实情况是，其中许多都不经济，因此我们一直在尝试做的另一件事是将尽可能多的容量放入尽可能小的封装中。”

背景对于企业代理 AI 至关重要

除了承诺提高性能和效率之外，IBM 还大大扩展了 Granite 的上下文长度。

在最初的 Granite 3.0 版本中，上下文长度被限制为 4k。在 Granite 3.1 中，IBM 将其扩展到 128k，从而可以处理更长的文档。对于企业 AI 用户来说，扩展上下文是一项重大升级，无论是对于检索增强生成 (RAG) 还是对于代理 AI 而言都是如此。

代理型 AI 系统和 AI 代理通常需要处理和推理较长的信息序列，例如较大的文档、日志跟踪或扩展对话。增加的 128k 上下文长度使这些代理型 AI 系统能够访问更多的上下文信息，从而使它们能够更好地理解和响应复杂的查询或任务。

IBM 还发布了一系列嵌入模型，以帮助加速将数据转换为向量的过程。Granite-Embedding-30M-English 模型可以实现每查询 0.16 秒的性能，IBM 声称这比包括Snowflake 的 Arctic 在内的竞争对手更快。

IBM 如何改进 Granite 3.1 以满足企业 AI 需求

那么 IBM 是如何提高 Granite 3.1 性能的呢？Cox 解释道，这并不是某一个具体的事情，而是一系列的流程和技术创新。

他说，IBM 已经开发出越来越先进的多阶段训练管道。这使得该公司能够从模型中提取出更多的性能。此外，任何 LLM 培训的关键部分都是数据。IBM 不仅专注于增加训练数据的数量，还非常重视提高用于训练 Granite 模型的数据质量。

“这不是一个数量游戏，”考克斯说。“我们不可能出去获取 10 倍以上的数据，然后奇迹般地让模型变得更好。”

直接在模型中减少幻觉

降低 LLM 中出现幻觉和错误输出风险的常用方法是使用护栏。这些通常作为 LLM 的外部功能部署。

借助 Granite 3.1，IBM 将幻觉保护功能直接集成到模型中。Granite Guardian 3.1 8B 和 2B 型号现在包含函数调用幻觉检测功能。

考克斯说：“该模型可以自行设置护栏，这可以为开发人员提供不同的机会来捕捉事物。”

他解释说，在模型本身中进行幻觉检测可以优化整个流程。内部检测意味着更少的推理调用，从而使模型更高效、更准确。

企业目前如何使用 Granite 3.1，以及下一步该怎么做

新的 Granite 模型现在全部以开源形式免费提供给企业用户。这些模型也可通过 IBM 的 Watsonx 企业 AI 服务获取，并将集成到 IBM 的商业产品中。

该公司计划保持积极的步伐来更新 Granite 模型。展望未来，Granite 3.2 计划添加多模式功能，该功能将于 2025 年初首次亮相。

考克斯表示：“您将在接下来的几个版本中看到我们添加更多此类不同差异化的功能，这些功能将在明年的 IBM Think 大会上发布。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/ibm-xi-wang-ping-jie-qi-xin-de-kai-yuan-granite-3-1-mo-xing

Like (0)

王浩然作者

0 0

语言过度：SLM 如何打败规模更大、资源密集型的同类

Previous 2024年12月22日

模拟理论筹集 200 万美元，以便计算机不再浪费计算资源

Next 2024年12月22日

AI前沿

利用人工智能代理优化公司工作流程：神话还是现实？

一个问题随着越来越多的大公司投资人工智能代理，将其视为提高运营效率的未来，越来越多的怀疑论者也开始涌现。虽然人们对这些技术的潜力感到兴奋，但许多组织发现，现实往往与炒作的程度不符…

点点
2024年11月6日
000
AI前沿

Pika 1.5 再次更新，新增更多 AI 视频效果：碎裂、溶解、缩小、吃惊

Pika又名 Pika Labs 或 Pika AI，是一家总部位于加利福尼亚州帕洛阿尔托的初创公司，已筹集 5500 万美元，利用同名的视频 AI 模型颠覆视频制作领域，目前，该…

王浩然
2024年10月19日
000
AI前沿

Image Playground、ChatGPT 和更多 Apple Intelligence 功能已推出测试版

苹果周三发布了其顶级操作系统的最新开发者测试版，包括 iOS 18.2、iPadOS 18.2 和 macOS Sequoia 15.2。这些版本比 iOS 18.1、iPadOS…

王浩然
2024年10月25日
000
AI前沿

Cerebras 成为世界上最快的 DeepSeek R1 主机，速度比 Nvidia GPU 快 57 倍

Cerebras Systems今天宣布，它将在美国服务器上托管 DeepSeek 的突破性 R1 人工智能模型，承诺速度比基于 GPU 的解决方案快 57 倍，同时将敏感数据保留…

王浩然
2025年2月1日
000
AI前沿

前 iRobot 创始人打造人工智能家用机器人

iRobot 的前首席执行官兼联合创始人与另外两名 iRobot 校友合作创建了一家与健康和保健相关的新机器人初创公司。九个月前，科林·安格尔 (Colin Angle) 从 i…

王浩然
2024年12月2日
000
AI前沿

平衡成本、功耗和性能，实现生成式人工智能的民主化

如今，生成式人工智能还只是早期采用者使用的新事物，但明天，它将成为我们日常生活中不可或缺的一部分。因此，它必须可以在各种消费设备上使用，独立于基于云的处理，并且可供所有人使用，而不…

王浩然
2025年2月6日
000
AI前沿

谷歌 GenAI 面临欧洲隐私风险评估审查

谷歌在欧盟的主要隐私监管机构已展开调查，以查明该公司在使用个人信息训练生成式人工智能方面是否遵守了欧盟的数据保护法。具体来说，它正在调查这家科技巨头是否需要进行数据保护影响评估（…

王浩然
2024年9月14日
000
AI前沿

Connecty 的 AI 上下文映射如何终结企业数据管道混乱

企业数据堆栈以多样化、混乱和碎片化而闻名。数据从多个来源流入复杂的多云平台，然后分布在各种 AI、BI 和聊天机器人应用程序中，管理这些生态系统已成为一项艰巨而耗时的挑战。今天，总…

王浩然
2024年11月12日
000
AI前沿

Adobe 展示用于平面绘图的 3D 旋转工具

目前，我们已经习惯了使用人工智能图像工具，这些工具可以立即完成以前需要大量精力才能完成的编辑，例如填充场景中缺失的部分或删除照片中不需要的部分而不影响背景。但在本周的 Adob…

点点
2024年10月21日
000
AI前沿

微软押注碳去除竞赛将有助于抵消其飙升的人工智能排放量

微软陷入困境：该公司承诺到 2030 年实现碳负排放，但自 2020 年以来，其排放量飙升了 40% 以上，部分原因是其蓬勃发展的人工智能业务。该公司购买了大量可再生能源，但有些排…

王浩然
2024年11月17日
000
AI前沿

Nvidia的Cosmos-Transfer1：让机器人训练变得异常真实，彻底改变行业格局

在AI与机器人技术的融合日益紧密的今天，Nvidia推出了一项革命性的技术——Cosmos-Transfer1，这款创新的AI模型为开发者提供了一个前所未有的平台，用于创建高度逼真…

王浩然
2025年3月22日
000
AI前沿

苹果放弃投资 OpenAI，硅谷史上最大融资悬了？CEO 曝出丑闻，GPT-5 或将难产

OpenAI 正分崩离析今天，我做出了一个艰难的决定，那就是继续留在 OpenAI。 OpenAI 最近的日子可谓冰火两重天，一方面，融资活动如火如荼；另…

点点
2024年9月29日
000
AI前沿

Numeric 获 2800 万美元 A 轮融资，利用人工智能实现会计自动化

会计师通常害怕月末和季末结账。这是因为确定特定时期的财务记录通常需要手动操作，容易出错，而且耗时。 2020 年，帕克·吉尔伯特（上图中间）厌倦了在一家早期创业公司管理…

点点
2024年10月13日
000
AI前沿

训练数据提供商发布事后报告，Reflection 70B 事件仍在继续

2024 年 9 月 5 日，初创公司Hyperwrite AI（也称为 OthersideAI）的联合创始人兼首席执行官马特·舒默 (Matt Shumer) 在社交网络 X上发…

王浩然
2024年10月6日
000
AI前沿

Anomalo 的非结构化数据解决方案将企业 AI 部署时间缩短了 30%

长期以来用于结构化数据的数据质量工具现在正扩展到企业 AI 的非结构化数据。Anomalo 就是这样一家供应商，该公司多年来一直在开发用于结构化数据的数据质量平台。今天，该公司宣布…

王浩然
2024年11月25日
000
AI前沿

Meta 引领开源 AI 热潮，Llama 下载量同比增长 10 倍

开源 AI 终于接近闭源 AI 的主导地位。今天，开放模型类别的领先参与者之一Meta分享了一份年中更新，声称其 Llama 系列模型的采用率已飙升至新高，尤其是自上个月发布大型 …

王浩然
2024年9月3日
000
AI前沿

专家表示，OpenAI 的专利承诺只不过是“美德信号”

本周，OpenAI 在其网站上悄然发布了一份声明，承诺不会以攻击性的方式使用其专利。 OpenAI 坚称其坚持“广泛使用”和“合作”原则，并表示将只以支持创新的方式使用其专利。该公…

点点
2024年10月18日
000
AI前沿

大规模部署 AI：NVIDIA NIM 和 LangChain 如何彻底改变 AI 集成和性能

人工智能 (AI)已从一个未来概念转变为改变全球行业的强大力量。人工智能驱动的解决方案正在改变医疗保健、金融、制造和零售等行业的企业运营方式。它们不仅提高了效率和准确性，还增强了决…

点点
2024年9月25日
000
AI前沿

卖家销量下降后，Poshmark 撤销了降低销售费用的决定

社交市场 Poshmark宣布将降低销售费用并提高买家费用后不久，由于卖家的愤怒，该公司决定恢复原来的收费结构。在周一发送给卖家的一封电子邮件中，创始人兼首席执行官 Manis…

王浩然
2024年10月23日
000
AI前沿

谷歌的 NotebookLM 现在可让你引导 AI 生成的音频对话，并启动商业试点

谷歌周四更新了其人工智能笔记和研究助手NotebookLM的音频摘要功能，该功能最近因其基于用户分享的内容进行类似播客的音频对话而备受关注，它能够引导这些对话并关注特定主题，而不仅…

点点
2024年10月18日
000