OpenAI o1
-
Hugging Face 展示了测试时间扩展如何帮助小型语言模型发挥其最大作用
在一项新的案例研究中,Hugging Face 的研究人员展示了如何配置小型语言模型(SLM),使其表现优于大型模型。他们的研究结果表明,具有 3B 参数的 Llama 3 模型在…
-
谷歌发布全新推理模型Gemini 2.0 Flash Thinking 与OpenAI o1竞争
谷歌在重新定义人工智能领域的最新举措中,宣布推出 Gemini 2.0 Flash Thinking,这是一种多模式推理模型,能够快速、透明地解决复杂问题。 谷歌首席执行官 Sun…
-
阿里巴巴发布了一款“公开”挑战 OpenAI o1 推理模型的模型
一种新的所谓“推理”人工智能模型 QwQ-32B-Preview 已经问世。它是少数几个可以与 OpenAI 的o1相媲美的模型之一,也是第一个可以在宽松许可下下载的模型。 QwQ…
-
阿里巴巴研究人员推出具有高级推理能力的法学硕士 Marco-o1
OpenAI o1的近期发布引起了人们对大型推理模型 (LRM) 的极大关注,并启发了旨在解决经典语言模型经常遇到的复杂问题的新模型。基于 o1 的成功和 LRM 的概念,阿里巴巴…
-
DeepSeek 首个推理模型 R1-Lite-Preview 引人注目,超越 OpenAI o1 表现
DeepSeek是中国量化对冲基金High-Flyer Capital Management旗下的 AI 分支,专注于发布高性能开源技术,现已推出其最新的以推理为重点的大型语言模型…
-
Kimi创始人杨植麟最新分享:关于OpenAI o1新范式的深度思考
OpenAI o1的发布,又一次引发了行业内关于大模型进化新范式的讨论。 讨论的焦点是两个公认的大模型进化瓶颈:数据瓶颈——数据不够用了;以及算力瓶颈——3.2万张卡已是目前的天花…