每周,有时甚至每天,都会有一个新的最先进的人工智能模型诞生。随着我们进入 2025 年,新模型的发布速度令人眼花缭乱,甚至令人精疲力竭。过山车的曲线继续呈指数级增长,疲劳和惊奇已成为永恒的伴侣。每次发布都会强调为什么这个特定的模型比其他所有模型都更好,无数的基准和条形图充斥着我们的信息流,我们努力跟上步伐。
十八个月前,绝大多数开发者和企业都在使用单一的 AI 模型。而今天,情况正好相反。很少有大规模企业将自己局限于单一模型的功能。企业对供应商锁定持谨慎态度,尤其是对于一项已迅速成为长期企业战略和短期底线收入核心部分的技术。团队将所有赌注都押在一个大型语言模型 (LLM) 上的风险越来越大。
但尽管存在这种碎片化,许多模型提供商仍然支持人工智能将是一个赢家通吃的市场的观点。他们声称,训练一流模型所需的专业知识和计算能力是稀缺的、可防御的和自我强化的。从他们的角度来看,构建人工智能模型的炒作泡沫最终将破灭,留下一个单一的、巨大的通用人工智能 (AGI) 模型,它将被用于一切。独家拥有这样的模型意味着成为世界上最强大的公司。这个奖项的规模引发了一场争夺越来越多 GPU 的军备竞赛,每隔几个月训练参数的数量就会增加一个新的零。
我们认为这种观点是错误的。无论是明年还是下个十年,都不会有一个单一的模型统治宇宙。相反,人工智能的未来将是多模型的。
语言模型是模糊商品
《牛津经济学词典》将商品定义为“按规模买卖且单位可互换的标准化商品”。语言模型在两个重要意义上是商品:
- 模型本身在更广泛的任务上变得越来越具有互换性;
- 制作这些模型所需的研究专业知识正变得更加分散和容易获取,前沿实验室的发展速度难以超越其他实验室,而开源社区的独立研究人员也紧随其后。
但是,尽管语言模型正在商品化,但它们的发展并不均衡。从 GPT-4 到 Mistral Small,任何模型都非常适合处理大量核心功能。与此同时,随着我们走向边缘和极端情况,我们看到了越来越大的差异,一些模型提供商明确专注于代码生成、推理、检索增强生成 (RAG) 或数学。这导致无休止的焦虑、reddit 搜索、评估和微调,以找到适合每项工作的正确模型。
因此,虽然语言模型是商品,但更准确地说,它们应该被描述为模糊商品。对于许多用例,人工智能模型几乎可以互换,价格和延迟等指标决定使用哪种模型。但在能力的边缘,情况将相反:模型将继续专业化,变得越来越差异化。例如,Deepseek-V2.5在 C# 编码方面比 GPT-4o 更强大,尽管规模只是 GPT-4o 的一小部分,而且价格便宜 50 倍。
这两种动态——商品化和专业化——都推翻了单一模型最适合处理所有可能用例的论点。相反,它们指向了人工智能领域逐渐分散的局面。
多模式编排和路由
语言模型的市场动态可以用人脑来类比。我们的大脑结构 10 万年来一直没有改变,而且大脑的相似之处远多于不同之处。在地球上的绝大部分时间里,大多数人都学习相同的知识,并且具有类似的能力。
但后来情况发生了变化。我们发展出了用语言交流的能力——首先是口语,然后是书面语。通信协议促进了网络的发展,随着人类开始相互联系,我们也开始越来越专业化。我们摆脱了需要成为所有领域通才、成为自给自足的孤岛的负担。矛盾的是,专业化的集体财富也意味着今天的普通人类比我们的任何祖先都更善于通才。
在足够广泛的输入空间中,宇宙总是倾向于专业化。从分子化学到生物学再到人类社会,情况都是如此。只要有足够的多样性,分布式系统的计算效率就会始终高于整体系统。我们相信人工智能也是如此。我们越能利用多种模型的优势而不是只依赖一种模型,这些模型就越能专业化,从而拓展能力的边界。
利用不同模型的优势,路由模式变得越来越重要——动态地将查询发送到最适合的模型,同时在不降低质量的情况下利用更便宜、更快的模型。路由使我们能够充分利用专业化的所有优势——更高的准确率、更低的成本和延迟——同时又不放弃泛化的任何稳健性。
路由功能的一个简单示例是,世界上大多数顶级模型本身都是路由器:它们使用混合专家架构构建,将每个下一个令牌生成路由到几十个专家子模型。如果 LLM 确实是呈指数级增长的模糊商品,那么路由必须成为每个 AI 堆栈的重要组成部分。
有一种观点认为,法学硕士在达到人类智能水平后将达到稳定状态——随着我们的能力完全饱和,我们将围绕一个通用模型进行整合,就像我们围绕 AWS 或 iPhone 进行整合一样。这两个平台(或其竞争对手)在过去几年中都没有将其能力提升 10 倍——所以我们不妨适应它们的生态系统。然而,我们相信人工智能不会止步于人类智能水平;它将远远超出我们想象的任何极限。随着它的实现,它将变得越来越分散和专业化,就像任何其他自然系统一样。
人工智能模型碎片化是一件非常好的事情,这一点再怎么强调也不为过。碎片化的市场是高效的市场:它们赋予买家权力,最大限度地发挥创新,并最大限度地降低成本。如果我们能够利用更小、更专业的模型网络,而不是将所有东西都通过单个巨型模型的内部发送,我们就会朝着更安全、更可解释、更可操控的人工智能未来迈进。
最伟大的发明没有主人。本杰明·富兰克林的继承人并不拥有电力。图灵的遗产并不拥有所有的计算机。人工智能无疑是人类最伟大的发明之一;我们相信它的未来将是——也应该是——多模型的。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/jin-guan-ren-gong-zhi-neng-jun-bei-jing-sai-ji-lie-dan-wo