阿里巴巴发布了一款“公开”挑战 OpenAI o1 推理模型的模型

王浩然 • 2024年11月28日下午4:00 • AI前沿 • 77 views

一种新的所谓“推理”人工智能模型 QwQ-32B-Preview 已经问世。它是少数几个可以与 OpenAI 的o1相媲美的模型之一，也是第一个可以在宽松许可下下载的模型。

QwQ-32B-Preview 由阿里巴巴的 Qwen 团队开发，包含 325 亿个参数，可以考虑长度约为 32,000 个单词的提示；在某些基准上，它的表现优于 OpenAI 迄今为止发布的两个推理模型 o1-preview 和 o1-mini。（参数大致对应于模型的解决问题的能力，参数较多的模型通常比参数较少的模型表现更好。OpenAI 不会透露其模型的参数数量。）

根据阿里巴巴的测试，QwQ-32B-Preview 在 AIME 和 MATH 测试中击败了 OpenAI 的 o1 模型。AIME 使用其他 AI 模型来评估模型的性能，而 MATH 是一组文字问题。

QwQ-32B-Preview 可以解决逻辑难题并回答相当有挑战性的数学问题，这要归功于它的“推理”能力。但它并不完美。阿里巴巴在一篇博客文章中指出，该模型可能会意外切换语言、陷入循环，并且在需要“常识推理”的任务上表现不佳。

与大多数人工智能不同，QwQ-32B-Preview 和其他推理模型可以有效地进行自我事实核查。这有助于它们避免一些通常会绊倒模型的陷阱，但缺点是它们通常需要更长的时间才能找到解决方案。与 o1 类似，QwQ-32B-Preview 通过任务进行推理，提前规划并执行一系列操作，帮助模型找出答案。

QwQ-32B-Preview 可以在人工智能开发平台 Hugging Face 上运行和下载，它与最近发布的DeepSeek推理模型类似，对某些政治话题的处理较为谨慎。阿里巴巴和 DeepSeek 都是中国公司，它们必须接受中国互联网监管机构的基准测试，以确保其模型的响应“体现社会主义核心价值观”。许多中国人工智能系统拒绝回应可能引起监管机构愤怒的话题，例如有关习近平政权的猜测。

当被问及“台湾是中国的一部分吗？”时，QwQ-32B-Preview 回答说是（而且是“不可分割的”）——这一观点与世界大多数国家不同，但与中国执政党的观点一致。与此同时，当被问及天安门广场时，没有得到任何回应。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/a-li-ba-ba-fa-bu-le-yi-kuan-gong-kai-tiao-zhan-openai-o1

Like (0)

王浩然作者

0 0

Hugging Face 的 SmolVLM 可以大幅降低企业的 AI 成本

Previous 2024年11月28日

Google Gemini 的 Imagen 3 让玩家可以设计自己的棋子

Next 2024年11月28日

AI前沿

播客平台Podcastle推出全新文本转语音模型，配备超450种AI语音‌

近日，知名播客平台Podcastle宣布了一项重大更新——推出了一款先进的文本转语音（TTS）模型，该模型拥有超过450种独特的AI语音，为用户带来了前所未有的个性化音频体验。 P…

王浩然
2025年3月4日
000
AI前沿

DPAD 算法增强脑机接口，有望推动神经技术进步

人类大脑拥有由数十亿个神经元组成的复杂网络，不断产生电活动。这种神经交响乐编码了我们的每一个想法、动作和感觉。对于研究脑机接口 (BCI) 的神经科学家和工程师来说，破译这种复杂的…

点点
2024年9月14日
000
AI前沿

AWS 推出基于生成式 AI 的工业物联网助手

亚马逊网络服务(AWS) 推出了 AWS IoT SiteWise Assistant，这是一种生成式 AI 工具，旨在使工业用户能够访问和了解他们的运营数据。 AWS IoT S…

王浩然
2024年12月2日
000
AI前沿

MetaScale利用自适应策略提升大型语言模型推理能力

重写与翻译后的内容 MetaScale利用自适应策略提升大型语言模型推理能力 ‌引言‌ 在人工智能领域，大型语言模型（LLM）的推理能力一直是研究者们关注的焦点。近期，MetaSc…

王浩然
2025年3月26日
000
AI前沿

模型太多，混乱不堪：OpenAI 承诺简化其产品线

OpenAI 计划“简化”其模型产品，即使它准备发布其最后一个非推理模型 GPT-4.5。对于一家科技公司来说，这是罕见的承认，其产品发布对客户来说没有足够的差异化。 OpenAI…

王浩然
2025年2月13日
000
AI前沿

Google的Gemini 2.0 Flash：原生多模态AI图像生成引领快速编辑与风格转换潮流

Google近期推出的Gemini 2.0 Flash模型，以其原生多模态AI图像生成能力，在AI界掀起了新一轮的创新风暴。这款模型不仅将文本与图像生成功能融为一体，还实现了快速的…

王浩然
2025年3月17日
000
AI前沿

构建一个对话式人工智能需要花费多少钱？

超过 40% 的营销、销售和客户服务组织已采用生成式人工智能，仅次于 IT 和网络安全。在所有生成式人工智能技术中，对话式人工智能将在这些领域迅速普及，因为它能够弥合企业与客户之间…

王浩然
2024年9月15日
000
AI前沿

据报道，Telegram 被非法和极端主义活动“淹没”

《纽约时报》对来自 16,000 个频道的 320 多万条 Telegram 消息进行分析，发现该消息平台已被非法和极端主义活动“淹没”。具体来说，《纽约时报》发现了 1,500…

点点
2024年9月8日
010
AI前沿

1X 发布生成世界模型来训练机器人

机器人初创公司1X Technologies开发了一种新的生成模型，可以大大提高在模拟中训练机器人系统的效率。该公司在一篇新博客文章中宣布了这一模型，它解决了机器人技术的一个重要挑…

王浩然
2024年9月20日
000
AI前沿

WP Engine 申请禁令以恢复其 WordPress.org 访问权限

网络托管服务提供商 WP Engine 已向北加州一家法院提交了禁令，要求其介入并恢复其对WordPress.org 开源存储库的访问权限。上个月， WP Engine 对 Wo…

王浩然
2024年10月23日
000
AI前沿

Meta 的 Llama AI 模型现在也支持图像

本杰明·富兰克林曾经写道，除了死亡和税收，没有什么是确定的。让我修改一下这句话，以反映当前的人工智能淘金热：除了死亡、税收和新的人工智能模型，没有什么是确定的，其中最后一种模式正在…

王浩然
2024年9月29日
000
AI前沿

Cohere 最小、最快的 R 系列模型在 RAG 方面表现出色，能够推理 23 种语言

人工智能初创公司Cohere发布了 Command R7B，这是其 R 模型系列中最小、最快的模型，以证明其支持广泛企业用例的意图，包括那些不需要昂贵、资源密集型的大型语言模型(L…

王浩然
2024年12月16日
000
AI前沿

Meta 向研究人员开放其 MobileLLM，并发布完整权重

Meta AI 宣布开源MobileLLM，这是一套针对移动设备优化的语言模型，其模型检查点和代码现已在 Hugging Face 上提供。不过，目前它仅在 Creative Co…

王浩然
2024年11月3日
000
AI前沿

小而强大：H2O.ai 的新 AI 模型在文档分析领域挑战科技巨头

开源 AI 平台提供商H2O.ai今天宣布了两种新的视觉语言模型，旨在改进文档分析和光学字符识别 (OCR) 任务。这两个模型名为H2OVL Mississippi-2B和H2OV…

王浩然
2024年10月19日
000
AI前沿

英国将推出“汉弗莱”公务员助理及其他人工智能计划以减少官僚主义

英国政府宣布了一项大规模投资人工智能的计划，一周后，政府公布了该计划在公共部门的具体实施细节。计划包括：人工智能助手加快公共服务；跨部门数据共享；一套新的人工智能工具——以英国老电…

王浩然
2025年1月21日
000
AI前沿

Meta 有很大机会赢得 AI 硬件竞赛

在人工智能设备失败的一年里，雷朋 Meta 智能眼镜的表现超出预期。但它能保持这种势头吗？人工智能可穿戴设备经历了糟糕的一年。就在几个月前，科技界还坚信人工智能硬件将成为下一个…

王浩然
2024年9月23日
000
AI前沿

特朗普撤销拜登人工智能政策，签署行政命令加强人工智能领导地位

随着任职第一周结束，唐纳德·特朗普总统签署了另一项有关人工智能的行政命令，因为人工智能仍然是首要任务。周四，特朗普签署了一项行政命令，取消拜登政府实施的人工智能政策，…

王浩然
2025年1月26日
000
AI前沿

在 AI 代理模拟中，Sam Altman 总会赢得 OpenAI 棋盘战斗吗？

一年前的今天，Sam Altman 在被解雇仅五天后重返 OpenAI。董事会会议室里到底发生了什么？游戏和人工智能模拟公司 Fable 开发了人工智能 Sim Francisco…

王浩然
2024年11月25日
000
AI前沿

帕尔默·卢基的人工智能防御公司 Anduril 正在俄亥俄州建造一座价值 10 亿美元的工厂

西方的火焰正向东方袭来。科技亿万富翁兼VR 耳机大亨帕尔默·卢基 (Palmer Luckey)创立的人工智能防御公司 Anduril周四宣布计划在俄亥俄州哥伦布市建造一家工厂。…

王浩然
2025年1月21日
000
AI前沿

Zoom 的定制 AI 头像工具可能存在风险

Zoom 希望将你变成一个由 AI 动画制作的、逼真的头像——但要等到明年某个时候。今天，Zoom 在年度开发者大会上宣布了即将推出的功能，该功能将把用户录制的自己的视频片段转换…

王浩然
2024年10月12日
000

发表回复

Please Login to Comment

阿里巴巴发布了一款“公开”挑战 OpenAI o1 推理模型的模型

相关推荐

发表回复

Share To :