IBM在公司年度TechXchange活动上推出了迄今为止最先进的 AI 模型系列,称为 Granite 3.0 。
Granite 3.0 系列包括一系列适用于各种应用的型号:
- 通用目的/语言:Instruct 和 Base 配置中的 8B 和 2B 变体
- 安全性:Guardian 型号有 8B 和 2B 两种尺寸,专为实现护栏而设计
- 混合专家:针对不同部署场景优化的一系列模型
IBM 声称,其新的 8B 和 2B 语言模型可以在众多学术和行业基准测试中匹敌甚至超越领先供应商提供的类似规模产品的性能。这些模型被定位为企业 AI 的多功能主力,在检索增强生成 (RAG)、分类、摘要和实体提取等任务中表现出色。
Granite 3.0 系列的一个关键区别在于 IBM 对开源 AI 的承诺。这些模型是在宽松的 Apache 2.0 许可下发布的,为企业客户和更广泛的 AI 社区提供了性能、灵活性和自主性的独特组合。
IBM 认为,通过将紧凑型 Granite 模型与专有企业数据相结合,尤其是使用其新颖的 InstructLab 对齐技术,企业可以以极低的成本实现与大型模型相媲美的任务特定性能。早期概念验证表明,与大型前沿模型相比,其潜在成本节省高达 23 倍。
IBM 表示,透明度和安全性仍然是其 AI 战略的重中之重。该公司已发布 Granite 3.0 的技术报告和负责任的使用指南,详细介绍了所使用的数据集、数据处理步骤和基准测试结果。此外,IBM 还为其watsonx.ai平台上的所有 Granite 模型提供知识产权赔偿,让企业在将这些模型与自己的数据集成时更有信心。
Granite 3.0 8B Instruct 模型表现出了特别令人鼓舞的结果,在标准学术基准上的表现优于 Meta 和 Mistral 等类似规模的开源模型。它在 IBM 的 AttaQ 安全基准上的所有测量安全维度上也处于领先地位。
IBM 还推出了 Granite Guardian 3.0 模型,旨在通过检查用户提示和 LLM 响应是否存在各种风险来实施安全护栏。这些模型提供了一套全面的风险和危害检测功能,包括针对 RAG 特定问题(例如基础性和上下文相关性)的独特检查。
整个 Granite 3.0 模型套件可在 HuggingFace 上下载,并在 IBM 的 watsonx 平台上提供商业使用选项。IBM 还与生态系统合作伙伴合作,将 Granite 模型集成到各种产品中,为全球企业提供更多选择。
随着 IBM 继续推进其 AI 产品组合,该公司表示,其重点是开发更复杂的 AI 代理技术,这些技术能够实现更高的自主性和解决复杂问题的能力。这包括计划在 IBM Watson x Orchestrate 中引入新的 AI 代理功能,并在 2025 年在其产品组合中构建代理功能。
原创文章,作者:点点,如若转载,请注明出处:https://www.dian8dian.com/ibm-tui-chu-granite-3-ai-mo-xing-bing-cheng-nuo-kai-yuan