推理能力

AI前沿

并非越大越好：探讨数百万令牌大型语言模型的商业案例

在人工智能领域，大型语言模型（LLMs）正朝着数百万令牌的容量迈进，这一趋势引发了AI界的热烈讨论。模型如MiniMax-Text-01拥有400万令牌的容量，而Gemini 1.…

王浩然
2025年4月14日
000
AI前沿

NVIDIA新推Llama 3.1 Nemotron Ultra，性能超越DeepSeek R1，体积仅其一半‌

在AI领域，大型语言模型（LLM）的竞争日益激烈，各大科技公司纷纷推出自己的旗舰产品，以期在这个充满挑战与机遇的市场中占据一席之地。近日，NVIDIA宣布推出其最新的LLM——Ll…

王浩然
2025年4月10日
000
AI前沿

MetaScale利用自适应策略提升大型语言模型推理能力

重写与翻译后的内容 MetaScale利用自适应策略提升大型语言模型推理能力 ‌引言‌ 在人工智能领域，大型语言模型（LLM）的推理能力一直是研究者们关注的焦点。近期，MetaSc…

王浩然
2025年3月26日
000
AI前沿

少即是多：加州大学伯克利分校与谷歌通过简单采样解锁大型语言模型潜力‌

在人工智能领域，大型语言模型（LLMs）的推理能力一直是研究者和开发者关注的焦点。近期，来自谷歌研究和加州大学伯克利分校的研究人员发表了一篇新论文，揭示了一种令人惊讶的简单测试时间…

王浩然
2025年3月24日
000
AI前沿

NVIDIA推出Llama Nemotron开放推理模型，加速自主AI发展

在人工智能（AI）领域，NVIDIA始终走在创新的前沿。近日，在NVIDIA GTC大会上，这家AI巨头宣布了一系列硬件和软件更新，其中最为引人注目的莫过于其全新推出的Llama …

王浩然
2025年3月22日
000
AI前沿

迈向通用人工智能：推理与深度研究如何推动AI从统计预测迈向结构化问题解决

引言人工智能（AI）领域正经历着从统计预测向结构化问题解决的深刻转型。这一转型的核心驱动力在于推理与深度研究能力的显著增强。本文旨在探讨这一转型的背景、现状以及推理与深度研究在其…

王浩然
2025年3月18日
000
AI前沿

医学教育的AI飞跃：代理式检索增强生成（RAG）、开放权重大型语言模型（LLMs）和实时病例洞察如何塑造纽约大学朗格尼医学中心的新一代医生

病人数据记录往往复杂且有时不完整，这意味着医生并不总能立即获得所需的所有信息。此外，医学专业人士无法跟上行业内涌现的大量病例研究、研究论文、试验和其他前沿发展。位于纽约市的纽约大学…

王浩然
2025年2月22日
000
AI前沿

小语言模型如何通过测试时缩放解锁隐藏推理能力并超越大型语言模型‌

根据上海人工智能实验室的一项新研究，非常小的语言模型（SLMs）在推理任务中能够超越领先的大型语言模型（LLMs）。研究人员展示，通过正确的工具和测试时缩放技术，一个具有10亿参数…

王浩然
2025年2月22日
000