OpenAI首席研究科学家Noam Brown周二在旧金山举行的TED AI 大会上发表了一场关于人工智能未来的有力演讲,特别关注OpenAI 的新 o1 模型及其通过战略推理、高级编码和科学研究改变行业的潜力。Brown 曾推动过扑克牌 AI Libratus和精通外交游戏的CICERO等 AI 系统的突破,现在他设想的未来是,AI 不仅仅是一种工具,而是一个跨行业创新和决策的核心引擎。
“过去五年来,人工智能领域取得了令人难以置信的进步,可以用一个词来概括:规模,”布朗在开发者、投资者和行业领袖的注视下开始演讲。“是的,上行链路确实取得了进步,但当今的前沿模型仍然基于 2017 年推出的相同变压器架构。主要区别在于数据的规模和输入的计算。”
布朗是 OpenAI 研究工作的核心人物,他很快强调,虽然扩展模型一直是 AI 进步的关键因素,但现在是时候进行范式转变了。他指出,AI 需要超越纯粹的数据处理,进入他所说的“系统二思维”——一种更慢、更慎重的推理形式,可以反映人类处理复杂问题的方式。
人工智能下一次飞跃背后的心理学:理解系统二思维
为了强调这一点,布朗分享了他攻读博士学位期间研究Libratus的一个故事。Libratus 是一款扑克牌人工智能系统,在 2017 年击败了顶级人类玩家。
“事实证明,让机器人在扑克牌游戏中思考 20 秒,其性能提升效果与将模型扩大 10 万倍并训练 10 万倍的效果相同,”Brown 说道。“当我得到这个结果时,我真的以为这是一个 bug。在攻读博士学位的前三年,我成功地将这些模型扩大了 100 倍。我为这项工作感到自豪。我曾撰写多篇论文介绍如何进行这种扩展,但我很快就知道,与这种扩展系统相比,所有这些都只是注脚。”
布朗在演讲中介绍了系统二思维,以解决传统扩展的局限性。系统二思维由心理学家丹尼尔·卡尼曼在《思考,快与慢》一书中推广,指的是人类用于解决复杂问题的一种更慢、更慎重的思维模式。布朗认为,将这种方法纳入人工智能模型可以带来巨大的性能提升,而无需成倍增加数据或计算能力。
他回忆说,让Libratus在做出决策之前思考 20 秒会产生深远的影响,相当于将模型扩大了 100,000 倍。“结果让我震惊,”布朗说,说明了企业如何通过专注于系统二思维,以更少的资源实现更好的结果。
OpenAI o1 内部:需要时间思考的革命性模型
布朗的演讲是在 OpenAI 发布o1 系列模型后不久发表的,该模型将系统二思维引入人工智能。这些模型于 2024 年 9 月推出,旨在比其前辈更仔细地处理信息,使其成为科学研究、编码和战略决策等领域复杂任务的理想选择。
“我们不再局限于仅仅扩大系统一的培训。现在我们也可以扩大系统二的思维,而在这个方向上扩大规模的好处是,它在很大程度上尚未被开发,”布朗解释道。“这不是一场 10 年甚至 2 年之后的革命。这是一场正在发生的革命。”
o1 模型已经在各种基准测试中表现出色。例如,在国际数学奥林匹克资格考试中,o1 模型的准确率达到了 83%,与 OpenAI 的 GPT-4o 的 13% 相比有了显著的飞跃。布朗指出,通过复杂的数学公式和科学数据进行推理的能力使 o1 模型对于依赖数据驱动决策的行业特别有价值。
速度较慢的人工智能的商业案例:为什么耐心在企业解决方案中会有回报
对于企业而言,OpenAI 的 o1 模型带来的益处远不止学术表现。Brown 强调,扩展系统二元思维可以改善医疗、能源和金融等行业的决策过程。他以癌症治疗为例,问观众:“请举手,如果你愿意为一种新的癌症治疗支付超过 1 美元的费用……1,000 美元怎么样?100 万美元怎么样?”
布朗表示,o1 模型可以帮助研究人员加快数据收集和分析速度,使他们能够专注于解释结果并产生新的假设。在能源领域,他指出,该模型可以加速更高效太阳能电池板的开发,从而有可能带来可再生能源领域的突破。
他承认,人们对较慢的人工智能模型持怀疑态度。“当我向人们提到这一点时,我经常得到的回答是,人们可能不愿意等待几分钟才能得到答复,或者花几美元来得到问题的答案,”他说。但他认为,对于最重要的问题来说,这种成本是值得的。
硅谷新一轮人工智能竞赛:为何处理能力并不是一切
OpenAI 转向系统二思维可能会重塑人工智能的竞争格局,尤其是在企业应用领域。虽然大多数当前模型都针对速度进行了优化,但 o1 背后的深思熟虑的推理过程可以为企业提供更准确的见解,尤其是在金融和医疗保健等行业。
在科技领域,谷歌和Meta等公司都在大力投资人工智能,而 OpenAI 对深度推理的关注使其与众不同。例如,谷歌的Gemini AI针对多模式任务进行了优化,但在解决问题的能力方面,它与 OpenAI 的模型相比如何还有待观察。
尽管如此,实施 o1 的成本可能会限制其广泛采用。与以前的版本相比,该模型运行速度更慢,成本更高。报告显示,o1-preview 模型的成本为每百万输入令牌 15 美元,每百万输出令牌 60 美元,远高于 GPT-4o。不过,对于需要高精度输出的企业来说,这项投资可能是值得的。
布朗在演讲结束时强调,人工智能发展正处于关键时刻:“现在我们有了一个新的参数,我们可以扩大系统二思维的规模——而我们才刚刚开始朝这个方向扩大规模。”
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/openai-ke-xue-jia-noam-brown-zhen-jing-ted-ai-da-hui-20