Hugging Face 上孕育出 100 万个 AI 模型

点点 • 2024年10月1日下午3:00 • AI前沿 • 109 views

Hugging Face 引用社区驱动的定制作为多样化 AI 模型繁荣的动力。

人工智能托管平台 Hugging Face 的人工智能模型列表首次超过100 万个，标志着快速发展的机器学习领域的一个里程碑。人工智能模型是一种计算机程序（通常使用神经网络），经过数据训练以执行特定任务或做出预测。该平台于 2016 年作为聊天机器人应用程序开始，随后于 2020 年转型为人工智能模型的开源中心，现在为开发人员和研究人员提供了各种各样的工具。

机器学习领域代表着一个比大型语言模型 (LLM) 更大的世界，比如 ChatGPT 所采用的那种模型。在 X 的一篇文章中，Hugging Face 首席执行官 Clément Delangue写到，他的公司拥有许多备受瞩目的人工智能模型，如“Llama、Gemma、Phi、Flux、Mistral、Starcoder、Qwen、Stable transmission、Grok、Whisper、Olmo、Command、Zephyr、OpenELM、Jamba、Yi”，以及“其他 999,984 个模型”。输入您的电子邮件地址以获取 Ars Technica 新闻通讯

德朗格说，原因在于定制。他写道：“与‘一个模型统治一切’的谬论相反，针对您的用例、您的领域、您的语言、您的硬件以及您的约束条件进行小型专门定制的优化模型会更好。事实上，很少有人意识到，Hugging Face 上几乎有同样多的模型只对一个组织是私有的——供公司私下构建 AI，专门用于他们的用例。”

Hugging Face 提供的图表显示了随着时间的推移，每月添加到 Hugging Face 的 AI 模型数量。

Hugging Face 转型为一个主要的人工智能平台，这得益于整个科技行业人工智能研究和开发的加速。在短短几年内，随着人们对该领域的兴趣不断增加，网站上托管的模型数量也急剧增加。在 X 上，Hugging Face 产品工程师 Caleb Fahlgren发布了一张该平台每月创建的模型图表（以及其他图表的链接），并表示：“模型数量逐月呈指数级增长，而 9 月份甚至还没有结束。”

微调的力量

正如 Delangue 上文所暗示的，平台上模型数量之多源于平台的协作性质以及针对特定任务微调现有模型的实践。微调意味着采用现有模型并对其进行额外训练，以向其神经网络添加新概念并改变其产生输出的方式。来自世界各地的开发人员和研究人员贡献了他们的成果，从而形成了一个庞大的生态系统。

例如，该平台拥有 Meta 的开放权重Llama 模型的多种变体，这些模型代表原始基础模型的不同微调版本，每个版本都针对特定应用进行了优化。

Hugging Face 的存储库包含用于各种任务的模型。浏览其模型页面，在“多模式”部分下会显示图像转文本、视觉问答和文档问答等类别。在“计算机视觉”类别中，有深度估计、对象检测和图像生成等子类别。此外，还介绍了文本分类和问答等自然语言处理任务，以及音频、表格和强化学习 (RL) 模型。

按“下载次数最多”排序后，Hugging Face 模型列表揭示了人们认为哪些 AI 模型最有用的趋势。麻省理工学院的Audio Spectrogram Transformer以 1.63 亿次下载量遥遥领先，它可对语音、音乐和环境声音等音频内容进行分类。紧随其后的是谷歌的BERT ，下载次数为 5420 万次，这是一种 AI 语言模型，它通过预测掩蔽词和句子关系来学习理解英语，从而帮助完成各种语言任务。

排名前五的 AI 模型还包括all-MiniLM-L6-v2（将句子和段落映射到 384 维密集矢量表示，可用于语义搜索）、Vision Transformer（将图像处理为补丁序列以执行图像分类）和 OpenAI 的CLIP（连接图像和文本，允许它使用自然语言对视觉内容进行分类或描述）。

无论模型或任务是什么，平台都在不断发展。“如今，HF 上每 10 秒就会创建一个新的存储库（模型、数据集或空间），”Delangue 写道。“最终，模型的数量将与代码存储库的数量一样多，我们将一直为此努力！”

原创文章，作者：点点，如若转载，请注明出处：https://www.dian8dian.com/hugging-face-shang-yun-yu-chu-100-wan-ge-ai-mo-xing

AI 模型 CLIP Hugging Face Meta OpenAI 谷歌

Like (0)

点点

0 0

Tails OS 与 Tor Project 合并

Previous 2024年10月1日

OpenAI 首席技术官和其他两人离职，Altman 否认与重组计划有关

Next 2024年10月1日

AI前沿

2024 年证明控制人工智能是可能的

今年几乎所有的人工智能重大新闻都是关于该技术发展速度有多快、它造成的危害，以及关于它多久会发展到人类无法控制的程度的猜测。但 2024 年，各国政府也在监管算法系统方面取得了重大进…

王浩然
2024年12月26日
000
AI前沿

ChatGPT 的资源需求正在失控

众所周知，生成式人工智能的发展需要越来越多的水和电，但《华盛顿邮报》和加州大学河滨分校研究人员的一项新研究表明，OpenAI 的聊天机器人需要多少资源才能执行其最基本的功能。在…

王浩然
2024年9月24日
000
AI前沿

为什么多智能体 AI 能够解决 LLM 无法解决的复杂性

ChatGPT 的推出使得大型语言模型(LLM) 在科技和非科技行业中得到广泛应用。这种流行主要归因于两个因素：这是否意味着我们已经达到了人类水平的智能，我们称之为通用人工智能（…

王浩然
2024年11月3日
000
AI前沿

亚马逊首席执行官安迪·贾西暗示将推出“代理” Alexa

亚马逊首席执行官安迪·贾西 (Andy Jassy) 周四暗示，该公司的 Alexa 助手将推出改进的“代理”版本，可以代表用户采取行动。 “我认为下一代的这些助手和生成式人工智能…

王浩然
2024年11月2日
000
AI前沿

谷歌双子座人工智能（Gemini AI）解析‌

在科技日新月异的今天，谷歌再次引领创新潮流，推出了其最新的人工智能系统——双子座人工智能（Gemini AI）。这一系统旨在通过其强大的处理能力和智能算法，为用户提供前所未有的交互…

王浩然
2025年3月1日
000
AI前沿

我们已经从 RPA 走了很长一段路：AI 代理如何彻底改变自动化

在过去的一年里，自动化竞赛愈演愈烈，人工智能代理逐渐成为企业效率的终极变革者。虽然生成式人工智能工具在过去三年中取得了重大进展——成为企业工作流程中的重要助手——但现在人们的注意力…

王浩然
2024年12月16日
000
AI前沿

Brookfield 承诺投资 200 亿美元，法国 AI 生态系统投资额达 850 亿美元

据法新社证实，加拿大投资公司 Brookfield 计划到 2030 年向法国人工智能项目投资 200 亿欧元（按当前汇率计算约为 207 亿美元）。这笔资金的大部分将用于建设以人…

王浩然
2025年2月10日
000
AI前沿

Tessl 以 5 亿美元以上的估值筹集 1.25 亿美元，用于构建编写和维护代码的 AI

许多初创公司和大型科技公司都尝试开发人工智能来编写软件。现在，又有一家新公司从幕后走出来，加入竞争行列，其使命是解决人类和所有这些人工智能一起编写代码时出现的许多问题。 Tessl…

王浩然
2024年11月15日
000
AI前沿

Midjourney 现已向所有人免费开放

Midjourney 首席执行官 David Holz周三通过 Discord宣布，AI 图像生成器最终将通过其网站向所有用户开放，而不仅仅是付费用户。这款文本转图片生成器于 2…

点点
2024年9月2日
000
AI前沿

Pinecone 通过级联检索扩展矢量数据库，将企业 AI 准确率提高高达 48%

近年来，Pinecone 已成为领先的原生矢量数据库平台之一。Pinecone 凭借新功能继续在竞争日益激烈的市场中脱颖而出，帮助解决企业 AI 挑战今天，Pinecone 宣布…

王浩然
2024年12月3日
000
AI前沿

虚假拜登自动电话呼叫导致无线服务提供商被 FCC 罚款 100 万美元

这些电话使用人工智能模仿拜登的声音，告诉潜在选民在初选期间待在家里。

点点
2024年9月2日
000
AI前沿

企业如何评估和选择AI工具

1. **明确问题与需求**：在考虑采用新的AI系统前，企业应先明确自身面临的问题、关键挑战和核心需求。只有当AI技术能解决公司已有的、可衡量的问题时，才值得进一步探索。 2. *…

王浩然
2025年2月11日
000
AI前沿

亚马逊的 Tye Brady 讨论下一代机器人仓库

过去几年，“交付未来”活动展示了亚马逊运营的最新技术。西雅图 2023 年的活动展示了该公司药房服务和无人机送货的最新进展。今年在纳什维尔，亚马逊讨论了人工智能对其购物体验的更新…

点点
2024年10月13日
000
AI前沿

人工智能阅读教练初创公司 Ello 现在让孩子们创作自己的故事

Ello是一款旨在帮助阅读困难儿童的人工智能阅读伴侣，它于周一推出了一款新产品，让孩子们可以参与故事创作过程。这项名为“Storytime”的人工智能新功能可以帮助孩子们从一系…

王浩然
2024年10月1日
000
AI前沿

使用 Azure 和 OpenAI 微调预训练模型

在人工智能 (AI) 的动态领域，微调预训练模型对于根据特定需求定制 AI 至关重要。Microsoft Azure 与 OpenAI 合作，为此提供了一个强大的平台，帮助开发人员…

王浩然
2024年8月31日
000
AI前沿

谷歌将在石油资源丰富的沙特阿拉伯开设人工智能中心

谷歌在气候目标方面可能落后，但这并没有阻止这家科技巨头在依赖化石燃料的沙特阿拉伯建立一个以人工智能为重点的新数据中心。根据沙特公共投资基金和谷歌的公告，新的人工智能中心将支持对阿…

王浩然
2024年11月6日
000
AI前沿

Meta 有很大机会赢得 AI 硬件竞赛

在人工智能设备失败的一年里，雷朋 Meta 智能眼镜的表现超出预期。但它能保持这种势头吗？人工智能可穿戴设备经历了糟糕的一年。就在几个月前，科技界还坚信人工智能硬件将成为下一个…

王浩然
2024年9月23日
000
AI前沿

2024年电子游戏发布时间表在“从《星球大战不法分子》中学习”后，《刺客信条：阴影》推迟到2025年2024年电子游戏发布时间表

育碧宣布大幅推迟《刺客信条：暗影》，该版将于2025年2月14日发布，而不是之前计划于今年11月发布。现有的预购将退还。出版商一直以《刺客信条》大片的年度关键假日销售期为目标，这…

点点
2024年9月26日
000
AI前沿

OpenAI 推出可自我核实事实的模型 o1

ChatGPT制造商 OpenAI 宣布了其下一个主要产品发布：代号为 Strawberry 的生成式 AI 模型，正式名称为 OpenAI o1。更准确地说，o1 实际上是一系…

王浩然
2024年9月14日
000
AI前沿

OpenAI谋求估值高达1250亿美元新融资，暂无IPO计划

OpenAI估值到底能攀多高？筹资越来越难或需IPO续命

点点
2024年9月3日
000

发表回复

Please Login to Comment

Hugging Face 上孕育出 100 万个 AI 模型

微调的力量

相关推荐

发表回复

Share To :