推理模型
-
从MIPS到Exaflops:40年间计算能力的飞跃将重塑AI领域
在最近的NVIDIA GTC大会上,该公司揭幕了一款据称是全球首款能够达到每秒一百亿亿次(即一Exaflop)浮点运算的单机架服务器系统。这一突破性进展基于最新的GB200 NVL…
-
超越基准:Gemini 2.5 Pro或成最强推理模型
在人工智能领域,新模型的推出总是伴随着各种期待与争议。近期,谷歌悄然发布了其最新的旗舰语言模型——Gemini 2.5 Pro。与业界其他AI实验室喜欢将新模型冠以“世界最强”不同…
-
超越RAG:SEARCH-R1将搜索引擎直接融入推理模型
在人工智能(AI)领域,大型语言模型(LLM)的推理能力取得了显著进步。然而,这些模型在结合推理能力正确引用和使用外部数据——即它们未接受训练的信息——方面仍存在较大不足。这一问题…
-
百度发布新型LLM:ERNIE 4.5与ERNIE X1,成本低于DeepSeek与OpenAI,但尚未开源
近日,中国搜索引擎巨头百度宣布推出两款全新的人工智能模型——ERNIE 4.5与ERNIE X1。ERNIE 4.5作为一款多模态语言模型,而ERNIE X1则专注于推理能力。百度…
-
Together AI 3.05亿美元赌注:DeepSeek-R1等推理模型正在增加而非减少GPU需求重写并翻译后的内容
DeepSeek-R1刚出现时,业界普遍担忧先进推理能力的实现可能会减少对基础设施的需求。然而,事实证明情况并非如此。至少,根据Together AI的说法,DeepSeek和开源…
-
DeepSeek 声称其“推理”模型在某些基准上击败了 OpenAI 的 o1
中国人工智能实验室 DeepSeek 发布了其所谓的推理模型 DeepSeek-R1 的开放版本,声称该模型在某些人工智能基准上的表现与 OpenAI 的o1一样好。 R1 可从 …
-
OpenAI 全球事务副总裁声称 o1 在纠正偏见方面“几乎完美”,但数据并不完全支持这一点
本周,OpenAI 的头条新闻可能都是高管离职。但该公司全球事务副总裁 Anna Makanju 对人工智能偏见的评论也引起了我们的注意。 周二,马坎朱在联合国未来峰会的一个小组讨…
-
OpenAI 的先进“草莓计划”模型终于问世
经过数月的猜测和期待,OpenAI 发布了其高级推理模型Project Strawberry的生产版本,并将其更名为“o1”。它还附带一个“迷你”版本(就像 GPT-4o 一样),…