微软在 Hugging Face 上将强大的 Phi-4 模型完全开源

王浩然 • 2025年1月9日下午3:00 • AI前沿 • 72 views

尽管其大投资伙伴 OpenAI 不断发布更强大的推理模型（例如最新的o3 系列），但微软并没有袖手旁观。相反，它正在开发以自有品牌发布的更强大的小型模型。

正如多位现任和前任微软研究人员和人工智能科学家今天在 X 上宣布的那样，微软将在人工智能代码共享社区Hugging Face上发布其 Phi-4 模型作为一个完全开源项目，并提供可下载的权重。

微软 AI 首席研究工程师 Shital Shah 在 X 上写道： “phi-4 发布后反响非常热烈，这让我们非常惊讶。很多人都在要求我们发布权重。一些人甚至在 HuggingFace 上上传了盗版的 phi-4 权重……好吧，别再等了。我们今天将在 HuggingFace 上发布官方 phi-4 模型！使用 MIT 许可证（原文如此）！！”

权重是指指定 AI 语言模型（无论大小）如何理解和输出语言和数据的数值。模型的权重由其训练过程确定，通常通过无监督深度学习，在此过程中，它会根据收到的输入确定应提供哪些输出。人类研究人员和模型创建者可以在训练期间向模型添加自己的设置（称为偏差），从而进一步调整模型的权重。除非模型的权重已公开，否则通常不被视为完全开源，因为只有这样，其他人类研究人员才能采用该模型并完全自定义或根据自己的目的对其进行调整。

尽管微软上个月实际上就发布了 Phi-4，但它的用途最初仅限于微软新的Azure AI Foundry开发平台。

现在，任何拥有 Hugging Face 帐户的人都可以在该专有服务之外使用 Phi-4，并且它附带宽松的 MIT 许可证，允许它用于商业应用。

此版本为研究人员和开发人员提供了对该模型的 140 亿个参数的完全访问权限，从而可以进行实验和部署，而不受大型 AI 系统通常存在的资源限制。

人工智能向效率转变

Phi-4 于 2024 年 12 月首次在微软的 Azure AI Foundry 平台上推出，开发人员可以根据研究许可协议访问它。

该模型在数学推理和多任务语言理解等领域的表现超越了许多更大的模型，而且所需的计算资源却少得多，因此迅速引起了人们的关注。

该模型的精简架构及其对推理和逻辑的关注旨在满足对人工智能日益增长的高性能需求，同时在计算和内存受限的环境中保持高效。借助在宽松的 MIT 许可下发布的开源版本，微软正在让更广泛的研究人员和开发人员（甚至是商业研究人员和开发人员）更容易使用 Phi-4，这标志着人工智能行业在模型设计和部署方面的方法可能会发生转变。

是什么让Phi-4脱颖而出？

Phi-4 在测试高级推理和特定领域能力的基准测试中表现出色。亮点包括：

• 在 MATH 和 MGSM 等具有挑战性的基准测试中得分超过 80%，表现优于 Google 的 Gemini Pro 和 GPT-4o-mini 等更大的模型。

• 在数学推理任务中表现出色，这对金融、工程和科学研究等领域来说是一项关键能力。

• HumanEval 在功能代码生成方面取得了令人印象深刻的成果，使其成为 AI 辅助编程的有力选择。

此外，Phi-4 的架构和训练过程在设计时也充分考虑了精度和效率。其 140 亿参数密集型、仅解码器转换器模型在 9.8 万亿个精选和合成数据集上进行了训练，其中包括：

• 对公开发布的文件进行严格的质量筛选。

• 教科书风格的合成数据，侧重于数学、编码和常识推理。

• 高质量的学术书籍和问答数据集。

尽管该模型主要针对英语应用程序进行了优化，但训练数据也包括多语言内容（8％）。

微软的创建者表示，安全和协调过程（包括监督微调和直接偏好优化）可确保强大的性能，同时解决公平性和可靠性问题。

开源优势

通过在 Hugging Face 上提供具有完整权重和 MIT 许可证的 Phi-4，微软向企业开放了它在其商业运营中的使用。

开发人员现在可以将该模型纳入他们的项目中或针对特定应用程序进行微调，而无需大量的计算资源或微软的许可。

此举也符合开源基础 AI 模型以促进创新和透明度的日益增长的趋势。与通常仅限于特定平台或 API 的专有模型不同，Phi-4 的开源性质确保了更广泛的可访问性和适应性。

平衡安全性和性能

随着 Phi-4 的发布，微软强调了负责任的 AI 开发的重要性。该模型经过了广泛的安全评估，包括对抗性测试，以最大限度地减少偏见、有害内容生成和错误信息等风险。

但是，建议开发人员在敏感场景中部署模型时，针对高风险应用程序实施额外的保护措施，并将输出基于经过验证的上下文信息。

对人工智能格局的影响

Phi-4 挑战了将 AI 模型扩展到大规模的主流趋势。它表明，较小、设计良好的模型可以在关键领域取得相当甚至更好的结果。

这种效率不仅降低了成本，而且降低了能耗，使得计算预算有限的中型组织和企业更容易获得先进的人工智能功能。

随着开发人员开始试验该模型，我们很快就会看到它是否可以成为 OpenAI、Anthropic、Google、Meta、DeepSeek 等许多其他公司的商业和开源模型的可行替代方案。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/wei-ruan-zai-hugging-face-shang-jiang-qiang-da-de-phi4-mo

Like (0)

王浩然作者

0 0

烟雾、反射和入口：Adobe 的 TransPixar 将 AI VFX 提升到新水平

Previous 2025年1月9日

三星哈曼的人工智能将使汽车更具同情心

Next 2025年1月9日

AI前沿

LinkedIn 已停止为人工智能获取英国用户数据

英国数据保护监管机构已确认，微软旗下的LinkedIn暂时停止处理用于 AI 模型训练的用户数据。信息专员办公室监管风险执行董事斯蒂芬·阿尔蒙德 (Stephen Almond)…

王浩然
2024年9月21日
000
AI前沿

OpenAI 的 Converge 2 计划一直笼罩在神秘之中

去年 12 月，OpenAI 宣布将开放 2022 年启动的为期六周的加速器计划的第二批申请。随后，事情变得非常平静。但据两位熟悉该计划的消息人士透露，OpenAI 的 Conve…

王浩然
2024年8月31日
000
AI前沿

You.com 评论：尝试后你可能会停止使用 Google

我是一名 Google 爱好者。我可以轻易地花几个小时搜索随机问题的答案，或者出于好奇探索新主题。其他时候，我不想迷失在浩瀚的搜索结果中。我想要快速、有条理、准确的答案。最近，…

点点
2024年9月29日
000
AI前沿

Lambda 推出“推理即服务” API，宣称成本为人工智能行业最低

Lambda是一家成立 12 年的旧金山公司，以向机器学习研究人员以及 AI 模型构建者和训练人员按需提供图形处理单元 (GPU) 而闻名。但今天，该公司推出了Lambda In…

王浩然
2024年12月13日
000
AI前沿

美国版权局称，人工智能生成的内容可受版权保护——只要人类参与或编辑

美国版权局负责管理政府对电影、电视节目、小说、艺术、音乐甚至软件等人类创作的作品的版权保护，该局在今天发布的重要且有用的更新中澄清说，某些形式的人工智能生成内容实际上可以获得版权保…

王浩然
2025年2月4日
000
AI前沿

索尼与 AI Singapore 合作攻读 SEA-LION 法学硕士学位

索尼研究公司和新加坡人工智能研究所(AISG) 将合作研究 SEA-LION 系列大型语言模型 (LLM)。 SEA-LION 是“东南亚语言一体化网络”的缩写，旨在提高人工智能模…

点点
2024年9月11日
000
AI前沿

利用人工智能进行漏洞评估

根据Cybersecurity Ventures 2023 年的一份报告，到 2025 年，网络犯罪估计每年将给世界造成 10.5 万亿美元的损失。每年记录在案的网络犯罪数量都…

点点
2024年10月7日
000
AI前沿

Meta大动作！AR让位AI，未来科技谁是“大小王”？

对于Meta来说，元宇宙和AI孰轻孰重早已没有悬念。

点点
2024年9月9日
000
AI前沿

Google Cloud 将搜索和 YouTube 背后的技术引入企业 AI 应用

随着生成式人工智能的不断进步，对于许多企业来说，一个简单的聊天机器人可能已不再足够。云计算超大规模提供商正在竞相建立自己的数据库和工具，以帮助企业快速高效地部署运营数据，从而构建…

点点
2024年10月4日
000
AI前沿

为什么情境感知型人工智能代理将在 2025 年赋予我们超能力

2025 年将是大型科技公司从向我们出售越来越强大的工具转变为向我们出售越来越强大的能力的一年。工具和能力之间的区别微妙而深刻。我们将工具用作帮助我们克服有机限制的外部物品。从汽车…

王浩然
2025年1月6日
000
AI前沿

获得准确结果的五大反向视频搜索工具

您是否曾经盯着某个视频，想知道最初是谁发布的？或者，也许您自己制作了一个视频，突然间，它出现在互联网上，却没有注明来源。反向视频搜索工具就是为此类情况而设计的。它们让您可以上传视频…

点点
2024年9月26日
000
AI前沿

拟人化人工智能：将类人生物误认为人类的严重后果已经显现

在我们急于了解和接触人工智能的过程中，我们陷入了一个诱人的陷阱：将人类的特征归因于这些强大但本质上非人类的系统。这种将人工智能拟人化的倾向不仅仅是人类天性中无害的怪癖——它正在成为…

王浩然
2025年1月19日
000
AI前沿

烟雾、反射和入口：Adobe 的 TransPixar 将 AI VFX 提升到新水平

Adobe Research和香港科技大学(HKUST)的一个团队开发了一种人工智能系统，可以改变电影、游戏和交互式媒体的视觉效果的制作方式。这项名为TransPixar的技术为…

王浩然
2025年1月9日
000
AI前沿

Hugging Face 的 SmolVLM 可以大幅降低企业的 AI 成本

Hugging Face 刚刚发布了SmolVLM，这是一种紧凑型视觉语言 AI 模型，可能会改变企业在运营过程中使用人工智能的方式。新模型以惊人的效率处理图像和文本，而所需的…

王浩然
2024年11月28日
000
AI前沿

当“聊天机器人”变成一个贬义词时：企业领导者对对话式人工智能的 3 个误解

随着 OpenAI 的 ChatGPT、Meta 的 Llama 和 Anthropic 的 Claude 等法学硕士课程的激增，各种场合都出现了聊天机器人。有提供职业建议的聊天机…

点点
2024年8月28日
000
AI前沿

中国游戏开发商突破人工智能极限：从 NPC 到虚拟社会

随着生成式人工智能热潮的放缓，中国 AAA 级游戏《黑神话：悟空》重新引发了有关游戏行业如何利用人工智能的讨论。据 AWS 代表介绍，游戏领域长期以来一直是 AI 创新的试验场，…

王浩然
2024年9月16日
000
AI前沿

信用之光：Experian AI框架如何改变金融准入

在当今这个快速变化的世界，人工智能（AI）正逐渐成为各行各业的核心驱动力。而在信用评分和金融服务领域，Experian，这家全球领先的信用局，正以其独特的AI框架引领一场变革，为无…

王浩然
2025年3月31日
000
AI前沿

Google 的 NotebookLM 是秘密的 CRM 杀手吗？

我从未从事过销售工作，至少不是虚拟销售。我最接近的一次——这是我的年龄——是在十几岁时在商场从事零售工作，然后在我童年住所附近的 VHS/DVD 租赁店工作，所以我非常尊重那些比我…

王浩然
2024年11月1日
000
AI前沿

触觉人工智能如何改变人机关系

几十年来，有意识的机器人一直是科幻小说的主角，它引发了令人着迷的伦理问题，并揭示了创造人工意识的技术障碍。当今科技界在人工智能 (AI) 领域取得的大部分成就都归功于深度学习的最新…

王浩然
2024年12月23日
000
AI前沿

Hugging Face首席科学官担忧：AI正沦为服务器上的“应声虫”‌

在人工智能（AI）技术日新月异的今天，Hugging Face的首席科学官表达了对AI发展方向的一种深切忧虑。他警告称，当前的AI系统正逐渐演变成仅执行预设任务、缺乏独立思考和批判…

王浩然
2025年3月9日
000