Arcee AI 推出 SuperNova：一种可定制、符合指令的企业模型

王浩然 • 2024年9月17日下午10:00 • AI前沿 • 115 views

Arcee AI今天推出了SuperNova，这是一个专为企业部署而设计的 700 亿参数语言模型，具有先进的指令跟踪功能和完整的自定义选项。该模型旨在为 OpenAI 和 Anthropic 的基于 API 的服务提供强大且可拥有的替代方案，解决围绕数据隐私、模型稳定性和自定义的关键问题。

在以云端 API 为主导的 AI 领域，Arcee AI 采用了 SuperNova 这一不同的方法。大型语言模型 (LLM) 可以在企业自己的基础设施中部署和定制。SuperNova 今天发布，它基于 Meta 的 Llama-3.1-70B-Instruct 架构构建，并采用了一种新颖的后训练流程，Arcee 声称该流程可实现出色的指令遵循性和对特定业务需求的适应性。

技术创新

SuperNova 的开发涉及多方面的后期训练方法，正如该项目首席工程师 Lucas Atkins 所解释的那样：

“我们同时训练了三个模型。一个是从 Llama 405B 中提炼出来的。另一个是用我们用 EvolKit 存储库生成的数据集进行训练的。第三个是在当前的 Llama 3 指令之上进行相当详尽的 DPO。最后，我们使用一种新的合并技术将这三个模型结合起来，保留了每个模型的优势。”

Arcee 认为这一过程是专有的，它带来了他们声称的非常先进的指令遵循能力。从 405B 参数模型中提炼出来的结果尤其值得注意，因为它表明 SuperNova 可能捕捉到一些更大模型的功能，同时仍然可以在更适中的硬件上部署。

“作为一个整天都在摆弄这些模型的人，无论是闭源模型还是开源模型，这个模型确实给我留下了深刻的印象，”阿特金斯补充道。“这里最重要的是遵循指令，这使得它非常非常符合用户或组织的需求。”

Arcee 的合成数据生成管道 EvolKit 的使用是其方法的另一个关键组成部分。该工具将是开源的，允许创建复杂的问答对，可用于针对特定任务或领域微调模型。这对于希望根据其独特用例调整模型的企业来说可能特别有价值。

企业部署与定制

SuperNova 旨在部署在企业自己的云环境中，首先在 AWS Marketplace 上可用。Arcee 还致力于在 Google 和 Azure 市场上提供该服务。Arcee AI 联合创始人 Mark McQuade 重点介绍了部署过程：

“该模型会部署到您的 AWS VPC 中，但它也会启动一个 Web 服务器、一个聊天界面和一个数据库来存储您的聊天记录。您组织中的每个人都可以与其交互。”

这种部署模型解决了企业在数据隐私和模型稳定性方面的关键问题。与可能在未经通知的情况下弃用或更改的基于 API 的服务不同，SuperNova 为企业提供了对其 AI 资产的完全控制权。正如 McQuade 指出的那样，鉴于 AI 行业最近发生的事件，这一点尤其重要：

“OpenAI 刚刚弃用了 3.5……许多公司围绕 3.5 的 API 建立了业务。因此，API 发生变化，您的应用程序就会消失。在我们的世界中，除非您更改它，否则一切都不会改变，因为它是您的模型，是您运行它的方式。”

在公司自己的虚拟私有云 (VPC) 中部署 SuperNova 的能力可确保敏感数据永远不会脱离组织的控制。这对于受监管行业或处理机密信息的公司来说非常重要。

定制和持续改进

SuperNova 的一个关键特性是它能够在企业环境中进行微调和再训练。Atkins 解释了这一过程及其优势：

“随着时间的推移，我们可以在您自己的环境中完全重新训练模型，以更好地适应您的偏好。当我们保存这些聊天记录时，如果您希望模型全面改进，以适应您作为企业的独特偏好，我们有能力做到这一点，而无需让这些数据离开您的系统。”

此功能允许技术团队随着时间的推移调整模型以适应特定领域的知识或公司特定的要求。与基于云的 API 服务相比，这是一个显著的优势，因为后者通常不允许这种级别的定制。

持续改进方面尤其值得注意。当模型与组织内的用户交互时，它可以从这些交互中学习并提高其在公司特定任务上的表现。这形成了一个良性循环，模型使用得越多，它对组织的价值就越大。

开源组件

虽然完整的 70B 模型不是开源的，但 Arcee 正在向开发者社区发布几个组件：

用于测试和评估的免费 API：这使开发人员无需进行完整部署即可试验 SuperNova。
SuperNova-Lite：该模型的 8B 参数开源版本。这个较小的模型对于在资源受限的环境中工作的开发人员或那些想要在部署完整模型之前了解架构的人很有用。
EvolKit：用于创建复杂 QA 对的数据集生成管道。对于希望为其特定用例创建自定义训练数据的组织来说，此工具可能很有价值。

通过开源这些组件，Arcee 为更广泛的 AI 社区做出了贡献，同时也为潜在客户提供了评估和定制其产品的工具。Arcee SuperNova 也可在AWS Marketplace上购买。

绩效声明和基准

Arcee 声称 SuperNova 在各个领域都表现出色，尤其擅长数学推理。“这款产品在数学基准测试中表现相当出色，”Atkins 指出。不过，该公司鼓励第三方评估来验证其说法。

“我们将提供 API 供人们使用。如果有第三方想要运行可靠的基准测试来亲自评估，我们可以安排为他们提供权重访问权限。我们希望这个模型完全透明，”Atkins 说道。

这种对第三方评估的开放态度值得称赞，因为它允许对 Arcee 的说法进行独立验证。与 OpenAI、Anthropic 和其他领先 AI 公司的模型相比，SuperNova 在标准基准上的表现如何，这将特别有趣。

值得注意的是，它强调数学推理，因为这对于许多语言模型来说都是一个具有挑战性的领域。如果 SuperNova 确实在这个领域表现出色，那么它将对金融、工程和科学研究等行业特别有价值。

对企业 AI 战略的影响

SuperNova 的发布正值许多企业重新评估其 AI 战略之际。尽管基于云的 API 服务占据了主导地位，但人们对可部署、可定制的模型的兴趣日益浓厚，因为这些模型可以提供更多的控制和灵活性。

SuperNova 的方法解决了几个关键问题：

数据隐私：通过在公司自己的基础设施内部署，SuperNova 确保敏感数据永远不会脱离组织的控制。
模型稳定性：与可能未经通知而更改或弃用的 API 服务不同，SuperNova 提供了一个稳定的基础，仅在组织选择更新时才会发生变化。
定制：根据公司特定数据对模型进行微调和重新训练的能力可以实现大多数 API 服务无法实现的深度定制。
成本控制：虽然初始部署可能需要大量资源，但运行 SuperNova 的长期成本可能低于大规模 API 调用的费用。
竞争优势：定制的、持续改进的人工智能模型可以在人工智能驱动的洞察力至关重要的行业中提供显著的竞争优势。

人工智能主权困境

随着企业在快速发展的 AI 领域中探索，SuperNova 的发布揭示了行业中日益加剧的紧张局势：基于云的 AI 服务的便利性和强大功能与可部署模型提供的控制和定制之间的权衡。这种矛盾提出了我们所谓的“AI 主权困境”。

一方面，GPT-4 和 Claude 等基于云的 API 服务提供了最先进的性能和持续更新，但代价是数据隐私问题和有限的定制。另一方面，SuperNova 等模型承诺完全控制和定制，但需要大量内部专业知识来部署和维护。

Arcee 的 SuperNova 方案试图弥补这一差距，提供一种可以在本地部署的模型，同时仍提供旨在与领先的基于云的服务相媲美的功能。这种混合方法对于监管要求严格的行业或处理高度敏感数据的行业尤其有吸引力。

然而，该模式的成功取决于几个因素：

性能均等：像 SuperNova 这样的模型真的可以匹配不断更新的云模型的功能吗？
部署的简易性：企业是否发现部署和维护过程易于管理？
定制优势：根据专有数据对模型进行微调的能力是否能带来显著的竞争优势？
成本效益：随着时间的推移，SuperNova 等模型的总体拥有成本是否会低于大规模使用基于云的 API？

SuperNova 的发布标志着企业 AI 格局的潜在转变。它挑战了最先进的 AI 功能只能通过云 API 访问的观念，并阻止了 AI 权力集中在少数科技巨头手中。

SuperNova 和类似模型代表了企业 AI 故事的新篇章。它们提供了一种更可控、可定制且更符合特定业务需求的 AI 愿景。这一愿景是否会取代或补充当前以云为主导的范式还有待观察，但有一点是明确的：企业 AI 未来的争夺战正在加剧，而 SuperNova 等模型正处于这场革命的最前沿。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/arcee-ai-tui-chu-supernova-yi-zhong-ke-ding-zhi-fu-he-zhi

Like (0)

王浩然作者

0 0

FrodoBots 和 YGG 携手地球探测挑战赛，共同开发游戏化人工智能和机器人技术

Previous 2024年9月17日下午9:00

据称人工智能和机器人被用来欺诈性地增加音乐流量

Next 2024年9月18日上午8:00

AI前沿

Babbel 联合创始人 Markus Witte 将再次执掌公司，接替首席执行官 Arne Schepker

总部位于柏林的热门语言学习平台 Babbel 的首席执行官 Arne Schepker 即将卸任，该公司联合创始人兼前首席执行官 Markus Witte 将重返公司，带领公司“进…

点点
2024年10月13日
000
AI前沿

DataRobot 推出企业 AI 套件，以弥合 AI 开发与商业价值之间的差距

随着全球企业将资源投入到人工智能领域，许多企业都在努力将其技术投资转化为可衡量的业务成果。这就是DataRobot希望通过今天发布的一系列新产品更新来解决的挑战。Da…

王浩然
2024年11月13日
000
AI前沿

数据之道：Databricks如何革新AI大型语言模型的微调过程，摒弃数据标签依赖

在人工智能（AI）领域，大型语言模型（LLM）的性能优化长久以来依赖于高质量的数据标签。这些标签如同训练过程中的指南针，指引着模型理解并学习上下文信息。然而，随着企业纷纷踏上AI转…

王浩然
2025年3月31日
000
AI前沿

“strawberry”问题：如何克服人工智能的局限性

到目前为止，ChatGPT 和 Claude 等大型语言模型 ( LLM ) 已成为全球的日常用语。许多人开始担心人工智能会抢走他们的工作，因此，几乎所有基于 LLM 的系统都无法…

王浩然
2024年10月15日
000
AI前沿

谷歌量子人工智能投资波士顿初创公司

该笔投资将资助 QuEra 开发大规模容错量子计算机的目标

点点
2024年10月23日
000
AI前沿

人工智能水下机器人改变海上风电检测方式

Beam部署了世界上第一台人工智能驱动的自动水下机器人，用于海上风电场检查。该技术已通过检查苏格兰最大的海上风电场Seagreen 的导管架结构证明了其实力。Seagreen 是 …

点点
2024年9月26日
000
AI前沿

这是你永远不应该外包给人工智能模型的事情

在这个效率至上、颠覆性技术一夜之间创造出数十亿美元市场的世界里，企业不可避免地将生成式人工智能视为强大的盟友。从 OpenAI 的 ChatGPT 生成类似人类的文本，到 DALL…

王浩然
2024年12月8日
000
AI前沿

杰克·多西带着 Goose 回归，这是他创办的初创公司 Block 推出的一款全新、极其简单的开源 AI 代理构建平台

以鸟类为主题的社交网络 Twitter 的身份可能已被新主人埃隆·马斯克 (Elon Musk) 取消，但这并没有阻止其联合创始人之一杰克·多西 (Jack Dorsey) 为新项…

王浩然
2025年1月29日
000
AI前沿

确保 OT 环境中 AI 的使用安全

随着拥有运营技术 (OT) 的组织开始采用 AI，安全性需要成为其战略的重中之重。AI 的集成大大拓宽了攻击面 — — 这一范围已经因 IT 和 OT 的融合而扩大。大多数 OT …

点点
2024年9月6日
000
AI前沿

超越RAG：SEARCH-R1将搜索引擎直接融入推理模型

在人工智能（AI）领域，大型语言模型（LLM）的推理能力取得了显著进步。然而，这些模型在结合推理能力正确引用和使用外部数据——即它们未接受训练的信息——方面仍存在较大不足。这一问题…

王浩然
2025年3月22日
000
AI前沿

Midjourney 表示正在“进军硬件领域”

据报道，人工智能图像生成平台 Midjourney在未获得任何风险投资的情况下就获得了超过 2 亿美元的收入，目前该平台正在进军硬件领域。该公司周三在 X 上的一篇帖子中宣布了这…

王浩然
2024年8月29日
000
AI前沿

Cohere推出高效多语言Command A模型，瞄准全球企业市场

加拿大AI初创公司Cohere近期发布了其最新款面向企业应用的生成式AI模型——Command A。这款模型以其卓越的多语言能力、高效能以及仅需两台GPU即可运行的特性，迅速吸引了…

王浩然
2025年3月17日
000
AI前沿

Google 的 DataGemma AI 是统计向导

谷歌正在扩大其 AI 模型系列，同时解决该领域的一些最大问题。今天，该公司推出了 DataGemma，这是一对开源的、指令调整的模型，它们朝着缓解幻觉挑战迈出了一步——大型语言模型…

王浩然
2024年9月15日
000
AI前沿

增强开源 AI 并改善数据治理

在欧洲人工智能与大数据博览会召开之前，AI News 采访了Databricks高级解决方案架构师 Ivo Everts ，讨论了影响开源人工智能和数据治理未来的几个关键发展。 D…

点点
2024年9月28日
000
AI前沿

人工智能如何重新定义协作软件开发中的团队动态

虽然人工智能正在改变全球各个行业，但它对软件开发的影响尤其显著。人工智能工具正在提高代码质量和效率，并重新定义团队在协作环境中的协作方式。随着人工智能的不断发展，它正在成为重新配置…

点点
2024年10月9日
000
AI前沿

Nfinite 创始人兼首席执行官 Alex de Vigan – 访谈系列

Nfinite是他在装修第一套公寓时遇到挑战后于 2016 年创立的一家公司。Nfinite通过大规模向零售商和品牌提供 AI 驱动、沉浸式、引人入胜且个性化的视觉内容，改变了在线…

点点
2024年11月6日
000
AI前沿

miRoncol 推出突破性血液检测技术，可检测 12 种以上早期癌症

在癌症检测领域取得重大进展的背景下，医疗技术初创公司miRoncol完成了一项突破性血液检测的概念验证研究，该检测能够在早期检测出多种类型的癌症。这项创新检测利用了尖端技术，包括微…

点点
2024年10月16日
000
AI前沿

萨姆·奥特曼的世界币成为世界币，并展示新的虹膜扫描球来证明你的人类身份

世界币 (Worldcoin) 是 Sam Altman 共同创办的“人格证明”加密项目，该项目通过扫描人的眼球，周四宣布将“币”从其名称中删除，现在改名为“世界币”。世界币项目背…

点点
2024年10月18日
000
AI前沿

模组制作者正在利用人工智能在《天际》和《星露谷物语》中创造聊天伙伴

在《星露谷物语》中，玩家通常每天只能与角色对话几次。这一限制导致了许多模组的出现，这些模组增加了角色的对话内容，以便玩家可以花更多时间与虚拟伙伴相处。但与许多游戏一样，《星露谷物语…

王浩然
2024年10月19日
000
AI前沿

LangChain 表明，人工智能代理尚未达到人类水平，因为它们被工具所淹没

一旦人工智能代理显示出前景，组织就必须努力弄清楚单个代理是否足够，或者是否应该投资构建一个覆盖组织中更多点的更广泛的多代理网络。编排框架公司LangChain试图更接近这个问题…

王浩然
2025年2月12日
000