加州大学圣地亚哥分校和清华大学的研究人员让人工智能能够更好地了解何时寻求帮助

加州大学圣地亚哥分校和清华大学的研究人员让人工智能能够更好地了解何时寻求帮助

一个计算机科学家团队开发了一种方法,可以帮助人工智能了解何时使用工具而不是依赖内置知识,模仿人类专家解决复杂问题的方式。

加州大学圣地亚哥分校和清华大学的研究表明,当人工智能系统学会平衡内部知识和外部工具时,准确率会提高 28%,这是在科学工作中部署人工智能的关键能力。

科学家如何教人工智能做出更好的决策

研究人员在论文中写道:“虽然将 LLM 与工具相结合可以提高可靠性,但这种方法通常会导致过度依赖工具,从而削弱模型通过基本推理解决简单问题的能力。” “相比之下,人类专家首先使用领域知识评估问题的复杂性,然后再选择合适的解决方法。”

这种新方法被称为“边学习边适应”,采用两步流程来训练人工智能系统。首先,模型直接从使用外部工具生成的解决方案中学习,帮助其内化领域知识。然后,它学会将问题分为“简单”或“困难”,并据此决定是否使用工具。

加州大学圣地亚哥分校和清华大学的研究人员让人工智能能够更好地了解何时寻求帮助

小型人工智能模型在复杂任务上的表现优于大型系统

这一进展之所以意义重大,是因为它采用了效率至上的理念。研究人员使用一个只有 80 亿个参数的语言模型(比 GPT-4 等行业巨头小得多),在测试数据集中,答案准确率提高了 28.18%,工具使用准确率提高了 13.89%。该模型在专门的科学任务中表现出了特别的优势,在特定领域的表现优于大型模型。

这一成功挑战了人工智能开发中的一个基本假设:更大的模型必然会产生更好的结果。相反,研究表明,教会人工智能何时使用工具而不是依赖内部知识(就像训练初级科学家知道何时相信他们的计算而不是咨询专门的设备一样)可能比原始的计算能力更重要。

加州大学圣地亚哥分校和清华大学的研究人员让人工智能能够更好地了解何时寻求帮助

更小、更智能的人工智能模型的兴起

这项研究与 2024 年整个行业向更高效的 AI 模型转变的趋势相一致。包括Hugging FaceNvidiaOpenAIMetaAnthropicH2O.ai在内的主要参与者今年都发布了体积较小但功能强大的模型。

Hugging Face 的SmolLM2版本参数小至 1.35 亿个,可直接在智能手机上运行。H2O.ai 的紧凑型文档分析模型在专门任务上的表现优于科技巨头的大型系统。甚至 OpenAI 也凭借GPT-4o Mini进入了小型模型领域,以极低的成本提供类似的功能。

这种“AI小型化”的趋势反映出人们越来越认识到更大并不总是更好——专业化的、高效的模型通常可以在使用更少的计算资源的情况下匹配或超越更大模型的性能。

人工智能如何学会平衡内部知识和外部工具

该技术方法涉及两个不同的学习阶段。在训练过程中,模型首先经历研究人员所称的“世界知识蒸馏”(WKD),从使用外部工具生成的解决方案中学习。这有助于它积累内部专业知识。

第二阶段“工具使用适应”(TUA)教会系统根据其直接解决问题的信心和准确性对问题进行分类。对于较简单的问题,它保持与 WKD 相同的方法。但对于更具挑战性的问题,它会学会切换到使用外部工具。

商业影响:更高效的人工智能系统,适用于复杂的科学工作

对于部署 AI 系统的企业来说,这项研究解决了长期困扰该行业的一个根本挑战。当前的 AI 系统代表了两个极端:它们要么不断寻求外部工具(这会增加计算成本并减慢简单操作的速度),要么冒险尝试在内部解决所有问题,从而导致需要专门工具才能解决的复杂问题出现潜在错误。

这种低效率不仅仅是一个技术问题,而是一个重大的业务问题。实施人工智能解决方案的公司经常发现,他们要为运行外部工具的云计算资源支付高价,即使是人工智能应该在内部处理的基本任务也是如此。另一方面,选择独立人工智能系统的组织可能会犯下代价高昂的错误,因为这些系统在没有适当验证工具的情况下尝试进行复杂的计算。

研究人员的方法提供了一个有希望的中间立场。通过教人工智能做出像人类一样的何时使用工具的决定,组织可以降低计算成本,同时保持甚至提高准确性。这在科学研究、金融建模或医学诊断等领域尤其有价值,因为效率和精度都至关重要。

此外,这一发展表明,未来人工智能系统可能成为科学工作中更具成本效益和更可靠的合作伙伴,能够在何时利用外部资源方面做出细致入微的决定——就像一位经验丰富的专业人士,他确切地知道何时咨询专门的工具而不是依赖他们的专业知识。

知道何时寻求帮助的力量

除了直接的技术成就之外,这项研究还挑战了主导人工智能发展的“越大越好”的范式。通过证明相对较小的模型可以通过更明智的工具使用决策超越其较大的同类模型,该团队指出了人工智能更可持续、更实用的未来。

这项研究的影响远远超出了学术研究的范围。随着人工智能越来越多地进入错误会带来实际后果的领域——从医疗诊断到气候建模——知道何时寻求帮助的能力变得至关重要。这项研究表明,未来的人工智能系统不仅功能强大,而且非常谨慎——就像熟练的专业人士一样,了解自己的局限性。

本质上,研究人员教会了人工智能一些基本的人性:有时最明智的决定是知道何时寻求帮助。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/jia-zhou-da-xue-sheng-di-ya-ge-fen-xiao-he-qing-hua-da-xue

Like (0)
王 浩然的头像王 浩然作者
Previous 2024年11月6日
Next 2024年11月7日

相关推荐

发表回复

Please Login to Comment