人工智能规模扩张的终结可能尚未到来：接下来会发生什么？

王浩然 • 2024年12月2日上午10:00 • AI前沿 • 103 views

随着人工智能系统在日益复杂的任务中实现超越人类的表现，业界正在努力解决是否有可能建立更大的模型，或者创新是否必须走不同的道路。

大型语言模型 (LLM) 开发的一般方法是规模越大越好，性能会随着数据和计算能力的增加而扩展。然而，最近媒体的讨论集中在 LLM 如何接近其极限。“人工智能是否遇到了瓶颈？ ” The Verge提出质疑，而路透社报道称“随着当前方法受到限制，OpenAI 和其他公司正在寻求通往更智能人工智能的新道路。”

令人担忧的是，多年来推动人工智能发展的可扩展性可能不会扩展到下一代模型。有报道称，GPT-5 等突破人工智能当前极限的前沿模型的开发可能会面临挑战，因为预训练期间的性能提升会逐渐减少。OpenAI和彭博社报道的这些挑战也报道了谷歌和 Anthropic 的类似新闻。

这个问题引发了人们的担忧，即这些系统可能受到收益递减规律的影响——每增加一个输入单位，收益就会逐渐减少。随着 LLM 规模的扩大，获取高质量训练数据和扩展基础设施的成本呈指数级增长，从而降低了新模型性能改进的回报。由于大量可访问信息已被纳入现有训练数据集，高质量新数据的可用性有限，这加剧了这一挑战。

这并不意味着人工智能性能提升的终结。它只是意味着，为了保持进步，需要通过模型架构、优化技术和数据使用方面的创新进行进一步的工程设计。

学习摩尔定律

半导体行业也出现了类似的收益递减模式。几十年来，该行业一直受益于摩尔定律，该定律预测晶体管的数量每 18 到 24 个月就会翻一番，通过更小、更高效的设计推动性能的大幅提升。该定律最终也遭遇了收益递减，从2005 年至 2007 年左右开始，原因是登纳德缩放定律（即缩小晶体管也会降低功耗的原理）已达到极限，这助长了摩尔定律消亡的预测。

我在 2012 年至 2022 年与 AMD 合作期间，对这个问题有过深入的了解。这个问题并不意味着半导体（以及计算机处理器）从一代到下一代都停止了性能改进。它确实意味着改进更多地来自芯片设计、高带宽内存、光开关、更多缓存和加速计算架构，而不是晶体管的缩小。

新的进步之路

目前的 LLM已经出现了类似的现象。GPT-4o、Claude 3.5 和 Gemini 1.5 等多模态 AI 模型已证明其整合文本和图像理解的强大功能，推动了视频分析和上下文图像字幕等复杂任务的进步。对训练和推理算法进行更多调整将进一步提高性能。代理技术使 LLM 能够自主执行任务并与其他系统无缝协调，很快就会大大扩展其实际应用。

未来的模型突破可能源自一种或多种将符号推理与神经网络相结合的混合 AI 架构设计。OpenAI 的 o1 推理模型已经展示了模型集成和性能扩展的潜力。量子计算虽然才刚刚开始发展，但有望通过解决当前的计算瓶颈来加速 AI 训练和推理。

感知到的扩展障碍不太可能终结未来的增长，因为人工智能研究界已经不断证明其在克服挑战和释放新功能和性能进步方面的独创性。

事实上，并非所有人都认为存在一堵墙。OpenAI 首席执行官 Sam Altman 简洁地表达了自己的观点：“没有墙。”

在“ CEO 日记” 播客节目中，前谷歌 CEO、《创世纪》合著者埃里克·施密特 (Eric Schmidt) 基本上同意 Altman 的观点，他表示，他不相信存在扩展障碍——至少在未来五年内不会出现。“五年内，这些法学硕士的曲柄将再转动两到三次。这些曲柄中的每一个看起来都是能力的两倍、三倍、四倍，所以我们可以说，转动所有这些系统的曲柄将使能力提高 50 倍或 100 倍，”他说。

领先的人工智能创新者仍然对进步的速度以及新方法的潜力持乐观态度。这种乐观态度在最近与 OpenAI 首席产品官 Kevin Weil 和 Anthropic 首席产品官 Mike Krieger在“ Lenny’s Podcast ”上的对话中显而易见。

在此次讨论中，克里格表示，OpenAI 和 Anthropic 目前正在开展的工作“感觉就像魔术一样”，但他也承认，在短短 12 个月内，“我们就会回过头来说，你能相信我们曾经使用过那些垃圾吗？……这就是人工智能发展的速度。”

确实如此——感觉就像魔术一样，就像我最近使用 OpenAI 的高级语音模式时所体验到的那样。与“Juniper”交谈感觉非常自然和无缝，展示了人工智能如何发展以理解实时对话中的情感和细微差别并做出回应。

Krieger 还讨论了最近的 o1 模型，称其为“一种扩展智能的新方法，我们感觉我们才刚刚开始。”他补充道：“这些模型将以更快的速度变得更加智能。”

这些预期的进步表明，尽管传统的扩展方法在短期内可能会或可能不会面临收益递减，但人工智能领域有望通过新方法和创造性工程继续取得突破。

缩放真的重要吗？

尽管扩展挑战主导了当前围绕法学硕士的大部分讨论，但最近的研究表明，当前的模型已经能够取得非凡的成果，这引发了一个发人深省的问题：进一步的扩展是否重要。

最近的一项研究预测，ChatGPT 将帮助医生在面对复杂的患者病例时做出诊断。该研究使用 GPT-4 的早期版本进行，比较了 ChatGPT 的诊断能力与有无 AI 帮助的医生的诊断能力。令人惊讶的是，ChatGPT 单独表现明显优于两组医生，包括使用 AI 辅助的医生。造成这种情况的原因有很多，从医生不了解如何最好地使用机器人到他们相信自己的知识、经验和直觉天生就更胜一筹。

这并不是第一项显示机器人比专业人士取得更好结果的研究。今年早些时候报道了一项研究，该研究表明，法学硕士可以进行财务报表分析，其准确度可与专业分析师相媲美，甚至超过专业分析师。使用 GPT-4 的另一个目标是预测未来的收益增长。GPT-4 在预测未来收益方向方面的准确率达到了 60%，明显高于人类分析师预测的 53% 至 57% 的范围。

值得注意的是，这两个例子都基于已经过时的模型。这些结果强调，即使没有新的扩展突破，现有的 LLM 也已经能够在复杂任务中超越专家，挑战了关于进一步扩展以实现有影响力结果的必要性的假设。

规模化、技能化或两者兼而有之

这些例子表明，目前的法学硕士已经非常强大，但单靠扩展可能并不是未来创新的唯一途径。但随着更多扩展的可能性和其他新兴技术有望提高性能，施密特的乐观态度反映了人工智能发展的快速步伐，这表明在短短五年内，模型就可以发展成为通才，无缝回答多个领域的复杂问题。

无论是通过扩展、技能培训还是全新的方法，人工智能的下一个前沿领域都有望改变的不仅仅是技术本身，还有它在我们生活中的作用。未来的挑战是确保进步对每个人都是负责任、公平和有影响力的。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/ren-gong-zhi-neng-gui-mo-kuo-zhang-de-zhong-jie-ke-neng

Like (0)

王浩然作者

0 0

为什么微服务可能会随着单体应用的强势回归而终结

Previous 2024年12月1日

Squirrel AI Agent 旨在拯救濒临灭绝的物种

Next 2024年12月2日

AI前沿

教师节，群里都用AI来送“礼”了

日前，百度原文心一言APP更名为“文小言”，名字换得更有人味儿了，百度希望结合9月推出的全民免费试用月活动，让更多用户养成上“文小言”去搜索和创作的习惯。不过，对普通人来说，需要…

点点
2024年9月12日
000
AI前沿

GitHub 的 Copilot 登陆 Apple 的 Xcode

GitHub 在 Universe 大会上宣布了一系列重要新产品，包括完全使用 AI 编写应用程序的 Spark 项目，以及对其 Copilot 服务的多模型支持。但 Copilo…

王浩然
2024年10月30日
000
AI前沿

超越法学硕士：SandboxAQ 的大型量化模型如何优化企业 AI

虽然大型语言模型 (LLM) 和生成式 AI在过去一年中占据了企业 AI 讨论的主导地位，但企业还可以通过其他方式从 AI 中获益。其中一种替代方案是大型定量模型 (LQM)。 L…

王浩然
2024年12月20日
000
AI前沿

OpenAI获得400亿美元巨额融资，企业AI竞争进入新阶段

在科技界引起轰动的一则消息中，OpenAI宣布完成了一轮高达400亿美元的融资，由软银集团领投，这一里程碑式的融资将OpenAI的估值推高至前所未有的3000亿美元，成为有史以来最…

王浩然
2025年4月1日
000
AI前沿

Grok 3疑似短暂屏蔽对特朗普和马斯克的负面提及

近日，有报道称，人工智能系统Grok 3似乎曾短暂地对涉及特朗普和马斯克的负面言论进行了屏蔽。这一发现引发了公众的广泛关注与讨论，人们开始质疑Grok 3是否具备足够的公正性和客观…

王浩然
2025年2月26日
000
AI前沿

Stampli 的认知人工智能旨在自主处理您企业的所有采购订单

应付账款 (AP) 自动化初创公司Stampli在拉斯维加斯举行的 Oracle NetSuite 年度 SuiteWorld 2024大会上推出了其最新创新——认知 AI 。该…

王浩然
2024年9月17日
000
AI前沿

VESSL AI 为其 MLOps 平台获得 1200 万美元融资，旨在将 GPU 成本降低高达 80%

随着企业越来越多地将人工智能融入其工作流程和产品中，对能够更轻松地创建、测试和部署机器学习模型的工具和平台的需求也日益增长。这类平台（通常称为机器学习操作或 MLOps）已经有点拥…

王浩然
2024年10月10日
000
AI前沿

网络安全专家需要更安全、更专业的 GenAI 工具

CrowdStrike委托对全球 1,022 名网络安全专业人士进行了一项调查，以评估他们对生成式人工智能 (GenAI) 的采用及其影响的看法。研究结果显示，人们对 GenAI…

王浩然
2024年12月24日
000
AI前沿

谷歌Gemini：现在您可以从iPhone锁屏与之对话‌

谷歌近日宣布了一项令人兴奋的新功能——用户现在可以直接从iPhone的锁屏界面与谷歌Gemini进行语音交互。这一创新功能极大地提升了用户与智能助手的互动体验，使得信息获取和服务调…

王浩然
2025年3月5日
000
AI前沿

百度限制谷歌和必应抓取内容用于人工智能训练

中国互联网搜索提供商百度已更新其类似维基百科的百科服务，以防止谷歌和微软必应抓取其内容。在百度百科 robots.txt 文件的最新更新中观察到了这一变化，该文件拒绝 Googl…

AI News
2024年8月31日
000
AI前沿

什么是 AI 代理？计算机科学家解释下一波 AI 工具

与 ChatGPT 等 AI 聊天机器人互动可能很有趣，有时也很有用，但日常 AI 的下一个级别不仅仅是回答问题：AI 代理可以为您执行任务。包括OpenAI、微软、谷歌和Sal…

王浩然
2025年1月6日
000
AI前沿

Slack 的人工智能代理有望利用情境能力重塑生产力

Slack将把Salesforce 的Agentforce AI 代理深度整合到其工作场所协作平台中，强调情境智能是日益拥挤的 AI 代理市场中的关键差异化因素。 Slack 首席…

王浩然
2024年12月19日
000
AI前沿

亚马逊的 Tye Brady 讨论下一代机器人仓库

过去几年，“交付未来”活动展示了亚马逊运营的最新技术。西雅图 2023 年的活动展示了该公司药房服务和无人机送货的最新进展。今年在纳什维尔，亚马逊讨论了人工智能对其购物体验的更新…

点点
2024年10月13日
000
AI前沿

开始使用 AI 代理（第 1 部分）：捕获流程、角色和连接

现代的 AI 代理至少包含一个能够调用某些工具的大型语言模型(LLM)。有了合适的编码工具集，它就可以开始生成代码，能够在容器中运行代码，观察结果，修改代码，从而更有可能生成有用的…

王浩然
2024年11月27日
000
AI前沿

全球最大人工智能数据中心计划落户韩国

数据中心项目预计初始年收入将达到 35 亿美元，总价值有望达到 350 亿美元 LG 电子创始家族成员 Brian Koo 与韩国政府合作，打造了全球最大的人工智能数据中心。韩国…

王浩然
2025年2月19日
000
AI前沿

过度投资的AI，坑了美国消费一把

“不下馆子，小零食也不吃了，刷牙洗澡这些虽然不能少，但也要尽量控制支出。” 这段话是对美国消费股二季报的总结。二季度，美国沃尔玛、宝洁等代表的必选消费公司营收虽然还在正增长，但大部…

点点
2024年9月12日
000
AI前沿

AI大模型站在十字路口，持续突破or陷入低谷

AI大模型已进入转折点，未来18个月将是迈向AGI时代的关键。当普通人被AI轰炸的已经疲劳，应用落地也没有惊人地突破，AI大模型的发展似乎已经进入瓶颈期。在云栖大会…

点点
2024年9月21日
000
AI前沿

销售团队如何利用人工智能来优化转化率

如今，在现代销售中保持竞争力实际上意味着要拥抱最新的技术趋势。自 2022 年底以来（得益于 OpenAI 的 ChatGPT，生成式人工智能进入公众视野），人工智能一直走在这一…

点点
2024年9月26日
000
AI前沿

Uniphore 推出 X-Stream，一款统一的知识产品，可将 RAG 应用的构建速度提高 8 倍

Uniphore是一家以对话式 AI 和自动化解决方案而闻名的全球科技公司，它正在朝着简化企业开发检索增强生成(RAG) 应用程序的方式迈进。该公司今天宣布推出 X-Stream，…

王浩然
2024年9月20日
000
AI前沿

无需再训练：Sakana 的新 AI 模型改变了机器学习的方式

Sakana AI是一家专注于研究自然启发算法的人工智能研究实验室，其研究人员开发了一种自适应语言模型，该模型无需微调即可学习新任务。该模型称为Transformer² (Tran…

王浩然
2025年1月25日
000