泛化能力

AI前沿

SWiRL：打造如顶尖问题解决者般的AI商业应用新篇章

在AI技术日新月异的今天，斯坦福大学与谷歌DeepMind的研究人员携手推出了Step-Wise Reinforcement Learning（SWiRL）技术，旨在为大型语言模型…

王浩然
4天前
000
AI前沿

大型语言模型中的灾难性过度训练：研究人员的警告

在人工智能领域，大型语言模型（LLM）正逐渐成为研究和应用的核心。然而，随着这些模型规模的不断扩大和能力的不断增强，一个潜在的问题也逐渐浮出水面——灾难性过度训练。近日，研究人员纷…

王浩然
2025年3月31日
000
AI前沿

LLM新技术：控制CoT长度，优化推理，降低成本

一、引言在人工智能领域，大型语言模型（LLM）通过“链式思考”（Chain of Thought，简称CoT）进行推理已成为最新一代模型的关键特征。这种推理过程涉及将复杂问题分解…

王浩然
2025年3月17日
000
AI前沿

Google DeepMind发布新型AI模型以强化机器人控制能力‌

在人工智能领域，Google DeepMind一直以其前沿的技术和创新的研究引领着行业发展。近日，DeepMind团队再次取得突破，发布了一系列专为机器人控制设计的新型AI模型。这…

王浩然
2025年3月13日
000