DeepSeek 首个推理模型 R1-Lite-Preview 引人注目，超越 OpenAI o1 表现

王浩然 • 2024年11月24日下午1:00 • AI前沿 • 110 views

DeepSeek是中国量化对冲基金High-Flyer Capital Management旗下的 AI 分支，专注于发布高性能开源技术，现已推出其最新的以推理为重点的大型语言模型 (LLM) R1-Lite-Preview，目前可通过其基于网络的 AI 聊天机器人DeepSeek Chat独家使用。

DeepSeek 以其对开源 AI 生态系统的创新贡献而闻名，其新版本旨在为公众带来高级推理能力，同时保持对可访问和透明 AI 的承诺。

尽管 R1-Lite-Preview 目前只能通过聊天应用程序使用，但它已经引起了人们的关注，因为它提供的性能接近甚至在某些情况下超过了 OpenAI 所推崇的 o1-preview 模型。

与 2024 年 9 月发布的模型一样，DeepSeek-R1-Lite-Preview 展示了“思路链”推理，向用户展示了它响应他们的查询和输入的不同链或“思路”，并通过解释它在做什么以及为什么这样做来记录这一过程。

虽然有些思路在人类看来可能毫无意义，甚至是错误的，但 DeepSeek-R1-Lite-Preview 总体上似乎非常准确，甚至可以回答其他较老但功能强大的 AI 模型（如 GPT-4o 和 Claude 的 Anthropic 家族）所遇到的“技巧”问题，包括“Strawberry 这个词中有多少个字母 R？”和“9.11 和 9.9 哪个更大？”请参阅以下我在 DeepSeek Chat 上对这些提示进行测试的屏幕截图：

人工智能推理的新方法

DeepSeek-R1-Lite-Preview 旨在完成需要逻辑推理、数学推理和实时解决问题的任务。

据 DeepSeek 称，该模型在 AIME（美国邀请数学考试）和 MATH 等既定基准上的表现超过了 OpenAI o1 预览版的水平。

其透明的思维过程增强了它的推理能力，使用户可以跟随模型一步步解决复杂的挑战。

DeepSeek 还发布了扩展数据，表明当模型获得更多时间或“思维标记”来解决问题时，准确率会稳步提高。性能图表突显了随着思维深度的增加，它在 AIME 等基准测试中取得更高分数的能力。

基准测试和实际应用

DeepSeek-R1-Lite-Preview 在关键基准测试中表现出色。

该公司公布的结果凸显了其处理广泛任务的能力，从复杂的数学到基于逻辑的场景，其性能得分可与 GPQA 和 Codeforces 等推理基准中的顶级模型相媲美。

其推理过程的透明度进一步使其与众不同。用户可以实时观察模型的逻辑步骤，增加了许多专有人工智能系统所缺乏的责任感和信任感。

然而，DeepSeek 尚未发布完整代码供独立第三方分析或基准测试，也没有通过 API 提供 DeepSeek-R1-Lite-Preview 以进行同类独立测试。

此外，该公司尚未发布博客文章或技术论文来解释 DeepSeek-R1-Lite-Preview 是如何训练或构建的，这留下了许多关于其底层起源的问号。

可访问性和开源计划

R1-Lite-Preview 现在可通过Chat.deepseek.com上的 DeepSeek Chat 访问。虽然该模型可供公众免费使用，但其先进的“深度思考”模式每日消息数量限制为 50 条，为用户体验其功能提供了充足的机会。

展望未来，根据该公司在 X 上的帖子，DeepSeek 计划发布其 R1 系列模型和相关 API 的开源版本。

此举符合该公司支持开源 AI 社区的历史。

其上一版本的DeepSeek-V2.5因融合了通用语言处理和高级编码能力而获得好评，成为当时最强大的开源AI模型之一。

继承传统

DeepSeek 继续其在开源 AI 领域不断突破界限的传统。早期的模型如 DeepSeek-V2.5 和DeepSeek Coder在语言和编码任务中表现出了令人印象深刻的能力，基准测试将其列为该领域的领导者。

R1-Lite-Preview的发布增加了一个新的维度，专注于透明推理和可扩展性。

随着企业和研究人员探索推理密集型人工智能的应用，DeepSeek 对开放的承诺确保其模型仍然是开发和创新的重要资源。

通过结合高性能、透明操作和开源可访问性，DeepSeek 不仅推动了人工智能的发展，而且还重塑了人工智能的共享和使用方式。

R1-Lite-Preview 现已开放公开测试。预计开源模型和 API 也将随之推出，进一步巩固 DeepSeek 在易用、先进 AI 技术领域的领先地位。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/deepseek-shou-ge-tui-li-mo-xing-r1litepreview-yin-ren-zhu

Like (0)

王浩然作者

0 0

aiOla 推出开源AI 音频转录模型，可实时隐藏敏感信息

Previous 2024年11月23日

Snowflake 击败 Databricks，直接集成 Claude 3.5

Next 2024年11月24日

AI前沿

商业领袖如何实现人工智能和可持续发展目标

对于企业来说，平衡人工智能的采用和对环境的影响是当务之急。根据世界经济论坛(WEF) 的数据，支持人工智能发展所需的电力每 100 天翻一番。到 2028 年，人工智能的能源消耗可…

王浩然
2024年12月11日
000
AI前沿

字节入局AI硬件赛道，一切为火山引擎卖方案服务？

谈起2023年的互联网大事件，有两件事是必不可能绕开的：其一是拼多多市值超越阿里，其二就是字节跳动（下文简称字节）上半年营收超过了腾讯。凭借今日头条和抖音两款现象级产品，字节几…

点点
2024年9月12日
000
AI前沿

Meta 让企业能够创建嵌入广告的聊天机器人

在周三于门洛帕克举行的Meta Connect 2024 开发者大会上，Meta 宣布将利用点击消息广告将其人工智能商业聊天机器人扩展到 WhatsApp 和 Messenger …

王浩然
2024年9月29日
000
AI前沿

Vectorize 融资 360 万美元，利用突破性的 RAG 平台彻底改变人工智能数据检索

Vectorize是 AI 驱动数据领域的一家先驱初创公司，已获得由True Ventures领投的 360 万美元种子资金。此次融资标志着该公司推出其创新的检索增强生成(RAG)…

点点
2024年10月9日
000
AI前沿

ChatGPT并非唯一用户量激增的聊天机器人‌

在科技日新月异的今天，人工智能（AI）的应用场景正以惊人的速度扩展。聊天机器人，作为AI技术的重要分支，正逐渐成为我们日常生活中不可或缺的一部分。提到聊天机器人，ChatGPT无疑…

王浩然
2025年4月2日
000
AI前沿

ApertureData 获得 825 万美元种子资金并推出 ApertureDB Cloud 以彻底改变多模式 AI

ApertureData是一家处于多模态 AI 数据管理前沿的公司，该公司在超额认购的种子轮融资中筹集了 825 万美元，以推动其开创性平台 ApertureDB 的开发和扩展。此…

点点
2024年10月11日
000
AI前沿

人工智能行业对 Chatbot Arena 非常着迷，但它可能不是最好的基准

在过去的几个月里，埃隆·马斯克等科技高管一直在吹捧其公司人工智能模型在特定基准：Chatbot Arena 上的表现。 Chatbot Arena 由一个名为 LMSYS 的非营利…

王浩然
2024年9月8日
000
AI前沿

Hugging Face扩展LeRobot平台，引入自动驾驶机器训练数据‌

Hugging Face近日宣布对其LeRobot平台进行重大扩展，新增了针对自动驾驶机器的训练数据。这一举措旨在提升自动驾驶技术的准确性和可靠性，通过引入高质量的训练数据，助力自…

王浩然
2025年3月12日
000
AI前沿

增强开源 AI 并改善数据治理

在欧洲人工智能与大数据博览会召开之前，AI News 采访了Databricks高级解决方案架构师 Ivo Everts ，讨论了影响开源人工智能和数据治理未来的几个关键发展。 D…

点点
2024年9月28日
000
AI前沿

OpenAI放宽ChatGPT图像创作的安全措施

OpenAI，这家全球领先的人工智能公司，近日宣布对其备受争议的ChatGPT工具进行重大更新。此次更新的核心在于，OpenAI放宽了ChatGPT在图像创作方面的安全限制，这一决…

王浩然
2025年3月29日
000
AI前沿

Alexa新技能：阅读、总结与回顾长篇文档‌

亚马逊的智能助手Alexa近日解锁了一项全新技能——能够阅读、总结并回顾长篇文档。这一功能为处理大量文字信息的用户提供了极大的便利。 ‌一、阅读功能‌ Alexa现在能够流畅地阅读…

王浩然
2025年2月28日
000
AI前沿

OpenAI 将在新加坡、巴黎、布鲁塞尔开设办事处，促进全球扩张

OpenAI在 X 上的一篇文章中表示，作为公司全球扩张战略的一部分，除了现有的旧金山、伦敦、都柏林和东京办事处外，还将在纽约、西雅图、巴黎、布鲁塞尔和新加坡等多个城市开设新办事处…

王浩然
2024年10月10日
000
AI前沿

Anthropic 推出新“风格”功能，在人工智能军备竞赛中押注个性化

Anthropic是一家由主要技术投资者支持的领先人工智能公司，今天宣布对其Claude AI助手进行重大更新，允许用户自定义 AI 的沟通方式——此举可能会重塑企业将 AI 融入…

王浩然
2024年11月27日
000
AI前沿

研究人员开源 Sky-T1，这是一种“推理”人工智能模型，训练成本不到 450 美元

所谓的推理人工智能模型正变得越来越容易开发，并且更便宜。周五，加州大学伯克利分校天空计算实验室的研究团队 NovaSky 发布了 Sky-T1-32B-Preview，该推理模型…

王浩然
2025年1月12日
000
AI前沿

AI的生态进化：模应一体的终结与新商业逻辑的诞生

9 月 4 日，文心一言大模型的移动端应用发布了 4.0.0 版本，最大的改动是 App 名字从“文心一言”改名为“文小言”；同一天，支付宝旗下 AI 应用“支小宝”最新版本也正式…

点点
2024年9月7日
000
AI前沿

为什么黄仁勋和马克·贝尼奥夫认为代理型人工智能有“巨大”机遇

Nvidia创始人兼首席执行官黄仁勋表示，展望未来，人工智能代理的机会将是“巨大的”。黄仁勋本周在 Salesforce 的旗舰活动Dreamforce的炉边谈话中表示，目前…

王浩然
2024年9月22日
000
AI前沿

AUDEZE总部处于自己的联盟中——就像它的耳机一样

Audeze——CRBN和Maxwell等高端耳机的制造商——是奥德赛一词的戏剧，灵感来自开创性的科幻经典《2001：太空漫游》。这是一个恰当的名字，或者更确切地说，是一个恰当的灵…

点点
2024年9月29日
000
AI前沿

获得准确结果的五大反向视频搜索工具

您是否曾经盯着某个视频，想知道最初是谁发布的？或者，也许您自己制作了一个视频，突然间，它出现在互联网上，却没有注明来源。反向视频搜索工具就是为此类情况而设计的。它们让您可以上传视频…

点点
2024年9月26日
000
AI前沿

中国游戏开发商突破人工智能极限：从 NPC 到虚拟社会

随着生成式人工智能热潮的放缓，中国 AAA 级游戏《黑神话：悟空》重新引发了有关游戏行业如何利用人工智能的讨论。据 AWS 代表介绍，游戏领域长期以来一直是 AI 创新的试验场，…

王浩然
2024年9月16日
000
AI前沿

OpenAI o1比博士还“聪明”，全球11位AI大咖怎么看？

据国外媒体报道，美国当地时间周四，OpenAI推出了名为OpenAI o1的新人工智能模型，这也是其首个具有“推理”能力的大模型，它能通过类似人类的推理过程来逐步分析问题，直至得出…

点点
2024年9月13日
000