小型 AI 模型需求激增，阿联酋猎鹰 3 号向开源领导者发起挑战

王浩然 • 2024年12月18日下午2:00 • AI前沿 • 86 views

阿联酋政府支持的技术创新研究所(TII) 宣布推出 Falcon 3，这是一系列开源小型语言模型 (SLM)，旨在在轻量级、基于单 GPU 的基础设施上高效运行。

Falcon 3 有四种模型尺寸——1B、3B、7B 和 10B，包括基础和指令变体，有望让开发人员、研究人员和企业能够民主化地使用高级 AI 功能。根据 Hugging Face 排行榜，这些模型的表现已经超越或接近同尺寸级别的热门开源模型，包括 Meta 的 Llama 和类别领导者 Qwen-2.5。

这一发展正值对 SLM 的需求迅速增长之际。SLM具有比 LLM 更少的参数和更简单的设计，因为它们效率高、价格低廉，并且能够部署在资源有限的设备上。它们适用于客户服务、医疗保健、移动应用和物联网等行业的一系列应用，而典型的 LLM 在这些行业中可能计算成本过高，无法有效运行。根据Valuates Reports 的数据，这些模型的市场预计将增长，未来五年的复合年增长率接近 18%。

Falcon 3 带来了什么？

Falcon 3 系列使用 14 万亿个 token 进行训练（数量是其前身 Falcon 2 的两倍多），采用仅解码器架构，并采用分组查询注意机制，以共享参数并在推理过程中最大限度地减少键值 (KV) 缓存的内存使用量。这在处理各种基于文本的任务时可以实现更快、更高效的操作。

从本质上讲，这些模型支持四种主要语言——英语、法语、西班牙语和葡萄牙语，并配备 32K 上下文窗口，使它们能够处理长输入，例如措辞繁重的文档。

TII 在其网站上指出：“Falcon 3 用途广泛，既可用于通用任务，也可用于专业任务，为用户提供了极大的灵活性。其基础模型非常适合生成应用程序，而指令变体则在客户服务或虚拟助手等对话任务方面表现出色。”

根据Hugging Face 上的排行榜，虽然四款 Falcon 3 型号的表现都相当出色，但 10B 和 7B 版本才是亮点，在推理、语言理解、指令遵循、代码和数学任务上取得了最先进的成绩。

在 13B 参数规模的模型中，Falcon 3 的 10B 和 7B 版本的表现优于竞争对手，包括谷歌的 Gemma 2-9B、Meta 的 Llama 3.1-8B、Mistral-7B和 Yi 1.5-9B。它们甚至在大多数基准测试中超越了阿里巴巴的类别领导者 Qwen 2.5-7B，例如 MUSR、MATH、GPQA 和 IFEval，但 MMLU 除外，MMLU 是用于评估语言模型对人类语言的理解和处理能力的测试。

跨行业部署

随着 Falcon 3 模型现已在Hugging Face上推出，TII 旨在为广泛的用户提供服务，实现经济高效的 AI 部署，而不会出现计算瓶颈。这些模型能够快速处理特定领域的任务，可以为边缘和隐私敏感环境中的各种应用提供支持，包括客户服务聊天机器人、个性化推荐系统、数据分析、欺诈检测、医疗诊断、供应链优化和教育。

该研究所还计划通过推出具有多式联运功能的机型来进一步扩大 Falcon 系列。这些机型预计将于 2025 年 1 月左右推出。

值得注意的是，所有模型均根据 TII Falcon License 2.0 发布，这是一个基于 Apache 2.0 的宽松许可证，具有可接受的使用政策，鼓励负责任的 AI 开发和部署。为了帮助用户入门，TII 还推出了 Falcon Playground，这是一个测试环境，研究人员和开发人员可以在将 Falcon 3 模型集成到他们的应用程序中之前试用它们。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/xiao-xing-ai-mo-xing-xu-qiu-ji-zeng-a-lian-qiu-lie-ying-3

Like (0)

王浩然作者

0 0

Lambda 推出“推理即服务” API，宣称成本为人工智能行业最低

Previous 2024年12月18日

谷歌：人工智能代理、多模式人工智能、企业搜索将在 2025 年占据主导地位

Next 2024年12月18日

AI前沿

麻省理工学院首次推出受大型语言模型启发的方法，用于教授机器人新技能

麻省理工学院本周展示了一种训练机器人的新模型。与用于教机器人新任务的标准数据集不同，该方法更具规模性，模仿用于训练大型语言模型 (LLM) 的大量信息。研究人员指出，模仿学习（即…

王浩然
2024年11月3日
000
AI前沿

Squirrel AI Agent 旨在拯救濒临灭绝的物种

为了保护英国日益减少的红松鼠数量，环保人士已经采用一种新的人工智能工具来识别、追踪和治疗松鼠。自 19 世纪 70 年代引入灰松鼠以来，红松鼠数量急剧下降，从 350 万只减少到…

王浩然
2024年12月2日
000
AI前沿

谷歌开始在乌拉圭建设价值 8.5 亿美元的数据中心

新设施旨在提高人工智能能力、支持经济增长和实现可持续发展

点点
2024年9月5日
000
AI前沿

Adobe 如何保护艺术家免受 AI 滥用

近年来，生成式人工智能在创造逼真的视觉效果、模仿艺术风格和创造全新表达形式方面的能力日益增强，重新定义了艺术的创作和体验方式。虽然这种转变为创意行业的创新和生产力提供了巨大的机会，…

点点
2024年10月16日
000
AI前沿

保卫陷入困境的 SOC：抵御对抗性 AI 攻击

77%的企业已成为对抗性 AI 攻击的受害者，而电子犯罪分子的突破时间仅用了2 分 7 秒，创下了历史记录。问题不在于您的安全运营中心 (SOC) 是否会成为攻击目标，而是何时成为…

王浩然
2024年12月10日
000
AI前沿

OpenAI 将在新加坡、巴黎、布鲁塞尔开设办事处，促进全球扩张

OpenAI在 X 上的一篇文章中表示，作为公司全球扩张战略的一部分，除了现有的旧金山、伦敦、都柏林和东京办事处外，还将在纽约、西雅图、巴黎、布鲁塞尔和新加坡等多个城市开设新办事处…

王浩然
2024年10月10日
000
AI前沿

人工智能如何增强人类在销售和营销方面的潜力

人工智能 (AI) 正在彻底改变各行各业专业人士的营销和销售方式。通过采用 AI，该领域的专业人士可以提高效率、提高成果并做出更快、更明智的决策。销售和营销的 AI 演变不仅意味着…

点点
2024年10月9日
000
AI前沿

Verizon 以 200 亿美元收购 Frontier Communications

此次收购扩大了 Verizon 的覆盖范围，并扩展了其智能边缘网络，以实现包括人工智能和物联网在内的数字创新

点点
2024年9月7日
000
AI前沿

人工智能在金融领域的应用：Palmyra-Fin 如何重新定义市场分析

人工智能 (AI)正在改变全球各行各业，并带来新的创新和效率水平。人工智能已成为金融领域的强大工具，为市场分析、风险管理和决策带来了新方法。金融市场以复杂性和快速变化而闻名，人工智…

点点
2024年9月21日
000
AI前沿

连接代码和良知：马里兰大学对道德和包容性人工智能的追求

随着人工智能系统日益渗透到我们日常生活中的关键决策过程，将道德框架融入人工智能开发正成为研究重点。在马里兰大学 (UMD)，跨学科团队致力于解决规范推理、机器学习算法和社会技术系统…

点点
2024年10月9日
000
AI前沿

据报道，OpenAI 正在制定新策略来应对人工智能改进放缓

据报道，OpenAI 正在制定新策略来应对人工智能改进放缓据《The Information》报道， OpenAI 的下一代旗舰模型可能不会像其前代产品那样带来巨大的飞跃。据报…

王浩然
2024年11月11日
000
AI前沿

训练数据提供商发布事后报告，Reflection 70B 事件仍在继续

2024 年 9 月 5 日，初创公司Hyperwrite AI（也称为 OthersideAI）的联合创始人兼首席执行官马特·舒默 (Matt Shumer) 在社交网络 X上发…

王浩然
2024年10月6日
000
AI前沿

从问题开始，沙盒，确定值得信赖的供应商——人工智能入门快速指南

77%的公司已在使用或探索使用 AI，超过 80% 的公司声称这是首要任务，领导者渴望从该技术中获得最大价值。然而，可用的解决方案数量和随之而来的大量营销信息可能会让寻找一条清晰的…

王浩然
2025年2月9日
000
AI前沿

Emergence 推出的 AI 协调器可以完成大型技术产品无法完成的任务：与其他产品良好协作

Emergence AI是一家由 IBM 研究院资深人员创立的初创公司，今年早些时候获得了超过 9700 万美元的融资，今天推出了企业级自主多智能体 AI 编排器，据称这是市场上最…

王浩然
2024年12月4日
000
AI前沿

Anthropic 首席执行官发表 15,000 字赞颂人工智能，充满技术乐观主义

Anthropic 首席执行官 Dario Amodei 希望你知道，他并不是人工智能“末日论者”。至少，这是我对 Amodei 上周五晚间在其博客上发表的一篇约 15,000 …

点点
2024年10月13日
000
AI前沿

OpenAI 推出 o3-mini 高级推理模型，对抗 DeepSeek 的崛起

OpenAI 及时发布了新的专有 AI 模型，以对抗开源竞争对手 DeepSeek-R1 的快速崛起——但这足以削弱后者的成功吗？今天，经过几天的谣言和社交媒体上人工智能用户的日…

王浩然
2025年2月2日
000
AI前沿

OpenAI 开始将注意力转向“超级智能”

OpenAI 首席执行官 Sam Altman 在其个人博客上发表文章称，他相信 OpenAI“知道如何构建（通用人工智能）”，就像它传统上所理解的那样——并且开始将其目标转向“超…

王浩然
2025年1月6日
000
AI前沿

卖家销量下降后，Poshmark 撤销了降低销售费用的决定

社交市场 Poshmark宣布将降低销售费用并提高买家费用后不久，由于卖家的愤怒，该公司决定恢复原来的收费结构。在周一发送给卖家的一封电子邮件中，创始人兼首席执行官 Manis…

王浩然
2024年10月23日
000
AI前沿

伟大的人工智能伪装：当自动化穿上特工服装时

这是一年中最恐怖的时刻，而在 2024 年，不仅仅是人们穿着服装。科技界正在上演一场伪装：自动化系统披上了人工智能代理的外衣，而许多人都被这种伪装所蒙骗。随着Gartner将“代…

王浩然
2024年11月3日
000
AI前沿

Gmail新增Gemini驱动的“添加到日历”按钮‌

近日，Gmail迎来了一项新功能的更新——一个由Gemini技术驱动的“添加到日历”按钮。这一功能的加入，旨在为用户提供更加便捷的日程管理体验。通过点击这个新按钮，用户能够轻松地…

王浩然
2025年3月12日
000

发表回复

Please Login to Comment

小型 AI 模型需求激增，阿联酋猎鹰 3 号向开源领导者发起挑战

Falcon 3 带来了什么？

跨行业部署

相关推荐

发表回复

Share To :