谷歌发布全新推理模型Gemini 2.0 Flash Thinking 与OpenAI o1竞争

王浩然 • 2024年12月20日下午1:00 • AI前沿 • 81 views

谷歌在重新定义人工智能领域的最新举措中，宣布推出 Gemini 2.0 Flash Thinking，这是一种多模式推理模型，能够快速、透明地解决复杂问题。

谷歌首席执行官 Sundar Pichai 在社交网络 X 上的一篇文章中写道，这是“我们迄今为止最周到的模型：）”

在开发者文档中，谷歌解释说，“思考模式的响应推理能力比基础版Gemini 2.0 Flash 模型更强”，而基础版 Gemini 2.0 Flash 模型是谷歌最新、最出色的模型，仅在八天前发布。

新模型仅支持 32,000 个标记输入（约50-60 页文本），并且每个输出响应可以产生 8,000 个标记。在 Google AI Studio 的侧面板中，该公司声称它最适合“多模式理解、推理”和“编码”。

该模型的训练过程、架构、许可和成本的完整细节尚未公布。目前，它在 Google AI Studio 中显示每个令牌的成本为零。

更易于理解和更透明的推理

与 OpenAI 的竞争推理模型o1 和 o1 mini不同，Gemini 2.0 允许用户通过下拉菜单访问其逐步推理，从而更清晰、更透明地了解模型如何得出结论。

通过允许用户了解决策过程，Gemini 2.0 解决了人们对人工智能作为“黑匣子”运行的长期担忧，并使该模型（许可条款仍不明确）与竞争对手的其他开源模型相提并论。

我对该模型的早期简单测试表明，它可以正确而快速地（一到三秒内）回答一些对于其他 AI 模型来说非常棘手的问题，例如计算“Strawberry”一词中的 R 的数量。（见上面的截图）。

在另一项测试中，当比较两个十进制数（9.9 和 9.11）时，该模型系统地将问题分解为更小的步骤，从分析整数到比较小数位。

这些结果得到了LM Arena的独立第三方分析的支持，该分析将 Gemini 2.0 Flash Thinking 评为所有 LLM 类别中表现第一的模型。

原生支持图像上传和分析

Gemini 2.0 Flash Thinking 是对竞争对手 OpenAI o1 家族的进一步改进，旨在处理跳跃中的图像。

o1 最初是纯文本模型，但后来扩展到包括图像和文件上传分析。目前，这两种模型也只能返回文本。

根据开发者文档显示，Gemini 2.0 Flash Thinking目前还不支持与谷歌搜索落地，也不支持与其他谷歌应用和外部第三方工具集成。

Gemini 2.0 Flash Thinking 的多模式能力扩展了其潜在用例，使其能够应对结合不同类型数据的场景。

例如，在一项测试中，该模型解决了一个需要分析文本和视觉元素的难题，展示了其跨格式集成和推理的多功能性。

开发人员可以通过 Google AI Studio 和 Vertex AI 利用这些功能，其中模型可供实验。

随着人工智能领域的竞争日趋激烈，Gemini 2.0 Flash Thinking 可能标志着问题解决模型新时代的开始。它能够处理多种数据类型、提供可视化推理并大规模执行，这使它成为推理人工智能市场的有力竞争者，可与 OpenAI 的 o1 系列及其他产品相媲美。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/gu-ge-fa-bu-quan-xin-tui-li-mo-xing-gemini-2-flash-thinking

Like (0)

王浩然作者

0 0

Previous 2024年12月20日

Stable Diffusion 3.5 登陆 Amazon Bedrock：这对企业 AI 工作流程意味着什么

Next 2024年12月20日

AI前沿

D-ID 推出可进行实时对话的全新高质量虚拟形象

AI 视频平台 D-ID 今天宣布推出两种用于内容创作的新类型化身——Express 和 Premium+。各家公司都在追逐创造更像人类的人工智能形象的金蛋，这些形象可能会减轻企…

王浩然
2024年11月2日
000
AI前沿

JetBrains AI 部门负责人 Vladislav Tankov – 访谈系列

Vladislav Tankov 是 AI 总监，领导 JetBrains AI 和 Grazie 产品的开发，负责 JetBrains IDE 中的 AI 助手。 JetBrai…

点点
2024年9月25日
000
AI前沿

无论你喜欢与否，人工智能正在学习如何影响你

当我还是个孩子的时候，我的生活中曾出现过四个人工智能特工。他们的名字分别是 Inky、Blinky、Pinky 和 Clyde，他们竭尽全力追捕我。那是 20 世纪 80 年代…

王浩然
2025年2月18日
000
AI前沿

苹果 16 英寸 MacBook Pro（M4 Pro）评测：强大的台式机替代品

周一，彭博社报道了苹果公司全面改革其笔记本电脑产品线的计划。这正是那种在新款 MacBook Pro 发布和上市之间的一周内你不想听到的谣言。深入研究后发现，计划中的改革将在 20…

王浩然
2024年11月8日
000
AI前沿

Atlassian 的 Rovo AI 现已正式发布

六个月前， Atlassian首次展示了 Rovo。Rovo是该公司所谓的“AI 队友”，它将更智能的搜索和基于聊天的 AI 工具与代理相结合，可以帮助用户在 Jira 和 Con…

王浩然
2024年10月10日
000
AI前沿

加速清洁能源项目的平台

由麻省理工学院校友创办的 Station A 让业主购买清洁能源的过程变得简单。企业和开发商在安装清洁能源技术（例如太阳能装置和电动汽车充电器）时，通常面临陡峭的学习曲线。为了获…

王浩然
2025年1月27日
000
AI前沿

忘掉 GPT-5！OpenAI 推出全新 AI 模型系列 o1，声称性能达到博士级

自 2023 年 3 月（18 个月前）OpenAI 推出强大的专有大型语言模型 (LLM) GPT-4以来，用户和开发人员一直在想，这家在硅谷乃至全球掀起生成式人工智能热潮的公司…

王浩然
2024年9月15日
000
AI前沿

谷歌发布三款全新实验性 Gemini 模型

谷歌刚刚宣布发布三种新的实验性人工智能模型，展示了其在该领域的持续创新，同时也凸显了人工智能能力进步的快速速度。谷歌新产品的先锋产品是 Gemini 1.5 Flas…

点点
2024年8月30日
000
AI前沿

随着 GenAI 工具越来越受员工欢迎，影子 IT 风险也在上升

企业始终面临数据泄露的风险，但如今威胁已扩大了许多倍，部分原因是生成式 AI 工具的蓬勃发展。Gartner 最近发现，自 2019 年以来，每位员工使用的 SaaS 应用程序数…

王浩然
2024年10月19日
000
AI前沿

OpenAI发布Responses API与开源Agents SDK：赋能开发者打造个性化深度研究与运营工具

在人工智能技术日新月异的今天，OpenAI再次迈出重要一步，推出了Responses API与开源Agents SDK。这两项创新成果不仅为开发者提供了更为灵活和强大的工具，还极大…

王浩然
2025年3月16日
000
AI前沿

OpenAI 的代理时代开始了：ChatGPT Tasks 提供作业调度、提醒等功能

ChatGPT 发布了一项名为 Tasks 的新功能，朝着成为成熟的个人助理迈出了重要一步。这可能预示着OpenAI未来将发布更多代理。 Tasks 目前处于测试阶段，可让 Cha…

王浩然
2025年1月15日
000
AI前沿

Anthropic 聘请 OpenAI 联合创始人 Durk Kingma

Durk Kingma 是 OpenAI 鲜为人知的联合创始人之一，今天他宣布将加入 Anthropic。在 X 的一系列帖子中，Kingma 透露他将主要在荷兰（他常驻的地方）…

大龄程序员
2024年10月2日
000
AI前沿

已故 OpenAI 举报人的母亲指控存在谋杀阴谋，呼吁 FBI 展开调查

OpenAI 举报人 Suchir Balaji 于 11 月 26 日被发现死在旧金山的公寓中，其母亲呼吁 FBI 对其死因展开调查。Poornima Ramarao 周日在 X…

王浩然
2024年12月31日
000
AI前沿

谷歌扩展人工智能虚拟试穿工具，将礼服也纳入其中

谷歌周四宣布，已扩展其基于人工智能的虚拟试穿工具以支持礼服，让用户可以虚拟穿着来自数百个品牌的数千件礼服，包括 Boden、Maje、Sandro、Simkhai 和 Staud。…

王浩然
2024年9月8日
000
AI前沿

字节入局AI硬件赛道，一切为火山引擎卖方案服务？

谈起2023年的互联网大事件，有两件事是必不可能绕开的：其一是拼多多市值超越阿里，其二就是字节跳动（下文简称字节）上半年营收超过了腾讯。凭借今日头条和抖音两款现象级产品，字节几…

点点
2024年9月12日
000
AI前沿

Anthropic的Claude聊天机器人：疑似采用Brave浏览器驱动其网页搜索功能

在人工智能领域，每一次技术创新都可能引发行业的广泛关注。近日，Anthropic公司旗下的Claude聊天机器人被曝出疑似采用Brave浏览器作为其网页搜索功能的强大后盾。这一消息…

王浩然
2025年3月24日
000
AI前沿

小语言模型如何通过测试时缩放解锁隐藏推理能力并超越大型语言模型‌

根据上海人工智能实验室的一项新研究，非常小的语言模型（SLMs）在推理任务中能够超越领先的大型语言模型（LLMs）。研究人员展示，通过正确的工具和测试时缩放技术，一个具有10亿参数…

王浩然
2025年2月22日
000
AI前沿

用AI“创造”蛋白质，「分子之心」获数亿元A轮融资

AI蛋白质设计平台公司「分子之心」近日完成数亿元A轮融资，由谢诺投资、深创投联合领投，商汤国香资本、久奕投资跟投。本轮融资将用于进一步扩大复合型人才团队，深入完善AI蛋白质基础大模…

点点
2024年9月13日
000
AI前沿

人工智能不断从新的经验中学习，不会忘记过去

我们的大脑在不断学习。那家新开的三明治熟食店很棒。那家加油站？以后最好别去那里。此类记忆会重新连接大脑中支持新学习的区域。在睡眠期间，前一天的记忆会被转移到大脑的其他部位进行长期…

点点
2024年9月3日
000
AI前沿

苹果的 ELEGNT 框架可以让家用机器人不再像机器，而更像伴侣

苹果研究人员开发出了一种新框架，可以使非人形机器人在与人互动时动作更加自然、富有表现力，这可能为家庭和工作场所中更具吸引力的机器人助手铺平道路。这项研究于本月在 arXiv 上发…

王浩然
2025年2月9日
000