谷歌发布免费 Gemini 2.0 Flash Thinking 模型，对 OpenAI 的付费战略施压

王浩然 • 2025年1月23日下午3:00 • AI前沿 • 58 views

谷歌悄然发布了其热门人工智能模型 Gemini 的重大更新，该模型现在可以解释其推理过程，在数学和科学任务中创下新的性能记录，并提供了 OpenAI 高级服务的免费替代方案。

周二，谷歌人工智能工作室发布了新的Gemini 2.0 闪电思维模型，实验编号为“ Exp-01-21 ”，该模型在美国数学邀请赛(AIME)中取得了 73.3% 的成绩，在GPQA Diamond科学基准中取得了 74.2% 的成绩。这些结果显示出与早期人工智能模型相比的明显改进，并表明谷歌在高级推理方面的实力不断增强。

谷歌 DeepMind 首席执行官Demis Hassabis在 X.com (原 Twitter) 上的一篇文章中写道：“从 AlphaGo 这样的程序开始，我们十多年来一直在开拓这些类型的规划系统，很高兴看到这些想法与最强大的基础模型的强大结合。”

Gemini 2.0 闪电思维打破百万代币处理纪录

该模型最引人注目的特点是它能够处理多达一百万个文本标记（比OpenAI 的 o1 Pro 模型多五倍），同时保持更快的响应时间。这种扩展的上下文窗口允许模型同时分析多篇研究论文或大量数据集，这一功能可能会改变研究人员和分析师处理大量信息的方式。

“作为第一次实验，我选取了各种宗教和哲学文本，并让 Gemini 2.0 闪电思维将它们编织在一起，提取出新颖独特的见解，”测试该模型的人工智能研究员Dan Mac在X.com 的一篇文章中说道。“它总共处理了 970,000 个 token。产出相当惊人。”

此次发布正值人工智能行业发展的关键时刻。OpenAI 最近宣布了其o3 模型，该模型在 GPQA Diamond 基准测试中获得了 87.7% 的分数。然而，谷歌决定在 Beta 测试期间免费提供其模型（有使用限制），这可能会吸引那些寻求替代OpenAI 每月 200 美元订阅服务的开发人员和企业。

谷歌免费提供 Gemini 2.0 Flash Thinking，内置代码执行功能

谷歌 DeepMind 首席科学家Jeff Dean强调了模型可靠性的提升：“我们正在不断迭代，提高可靠性，减少模型思维和最终答案之间的矛盾”，他写道。

该模型还包含本机代码执行功能，允许开发人员直接在系统内运行和测试代码。此功能与改进的矛盾保护措施相结合，使 Gemini 2.0 Flash Thinking 成为研究和商业应用的有力竞争者。

行业分析师指出，谷歌专注于解释其推理过程，这可能有助于解决人们对人工智能透明度和可靠性日益增长的担忧。与传统的“黑箱”模型不同，Gemini 2.0 闪电思维展示了其工作，使用户更容易理解和验证其结论。

谷歌挑战 OpenAI，AI 透明度成为新战场

该模型已经在Chatbot Arena 排行榜上占据榜首，这是人工智能性能的著名基准，在硬提示、编码和创意写作等类别中处于领先地位。

然而，该模型的实际性能和局限性仍然存在疑问。虽然基准测试分数提供了有价值的指标，但它们并不总是直接转化为实际应用。谷歌的挑战将是让企业客户相信其免费产品可以匹敌或超越付费替代品的功能。

随着人工智能军备竞赛愈演愈烈，谷歌的最新版本表明其战略发生了转变：将先进功能与可访问性相结合。这种方法是否有助于缩小与 OpenAI 的差距还有待观察，但它无疑为技术决策者提供了一个令人信服的理由来重新考虑他们的人工智能合作伙伴关系。

目前，有一点是清楚的：可以展示其工作的人工智能时代已经到来，任何拥有 Google 帐户的人都可以使用它。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/gu-ge-fa-bu-mian-fei-gemini-2-flash-thinking-mo-xing-dui

Like (0)

王浩然作者

0 0

字节跳动的 UI-TARS 可以接管你的电脑，性能优于 GPT-4o 和 Claude

Previous 2025年1月23日

DeepMind 的新推理时间缩放技术提高了 LLM 中的规划准确性

Next 2025年1月23日

AI前沿

DeepMind 的新推理时间缩放技术提高了 LLM 中的规划准确性

推理时间扩展是2025 年人工智能的一大主题，人工智能实验室正在从不同角度对其进行攻克。谷歌 DeepMind 在其最新研究论文中引入了“思维进化”的概念，这是一种优化大型语言模型…

王浩然
2025年1月23日
000
AI前沿

过度投资的AI，坑了美国消费一把

“不下馆子，小零食也不吃了，刷牙洗澡这些虽然不能少，但也要尽量控制支出。” 这段话是对美国消费股二季报的总结。二季度，美国沃尔玛、宝洁等代表的必选消费公司营收虽然还在正增长，但大部…

点点
2024年9月12日
000
AI前沿

OpenAI 全球事务副总裁声称 o1 在纠正偏见方面“几乎完美”，但数据并不完全支持这一点

本周，OpenAI 的头条新闻可能都是高管离职。但该公司全球事务副总裁 Anna Makanju 对人工智能偏见的评论也引起了我们的注意。周二，马坎朱在联合国未来峰会的一个小组讨…

王浩然
2024年9月27日
000
AI前沿

Bluesky 用户数增长至 900 多万

Bluesky 持续发展：该公司宣布，截至周五早上，其已新增 300 万用户，总用户数达到 900 多万。换句话说，自巴西法院禁止 X（前身为 Twitter）以来，该社交平台的…

点点
2024年9月8日
000
AI前沿

Dario Amodei 质疑 DeepSeek 600 万美元的 AI 说法：Anthropic 对中国最新 AI 举措有何看法

上周，中国人工智能初创公司DeepSeek宣布其最新语言模型 DeepSeek-R1 震惊了人工智能界。该模型似乎可以与领先的美国人工智能系统相媲美，但成本却只有后者的一小部分。这…

王浩然
2025年2月3日
000
AI前沿

Nvidia的Cosmos-Transfer1：让机器人训练变得异常真实，彻底改变行业格局

在AI与机器人技术的融合日益紧密的今天，Nvidia推出了一项革命性的技术——Cosmos-Transfer1，这款创新的AI模型为开发者提供了一个前所未有的平台，用于创建高度逼真…

王浩然
2025年3月22日
000
AI前沿

人工智能如何塑造民主对话的未来

在当今政治两极分化的世界中，在复杂的社会和政治问题上找到共同点变得越来越困难。随着社会变得越来越多元化，气候变化、移民和经济政策等关键问题上的分歧只会越来越大。让人们聚在一起就复杂…

点点
2024年11月5日
000
AI前沿

合成数据的前景与风险

有可能仅使用另一个人工智能生成的数据来训练一个人工智能吗？这听起来可能有点荒唐。但这个想法已经存在了相当长一段时间——而且随着新的真实数据越来越难获得，这种想法越来越受到关注。 A…

王浩然
2024年10月14日
000
AI前沿

企业 AI 从“实验”走向“必要”，支出增长 130%

一项新研究表明，生成式人工智能已迅速从一项实验技术转变为一种重要的商业工具，到 2024 年其采用率将增加一倍以上。这项研究由宾夕法尼亚大学沃顿商学院的研究中心AI …

王浩然
2024年10月29日
000
AI前沿

不只是炒菜，AI正在全面渗透餐饮

AI推动餐饮行业智能化革命，机器人正取代厨师、制茶师、咖啡师。 9月13日，北京市发出首张“具身智能机器人食品经营许可证”。所谓具身智能机器人，指将人工智能融入机器人这个物理实体…

点点
2024年9月21日
000
AI前沿

解决量子计算最紧迫的挑战

量子计算有可能改变许多行业，从密码学到药物研发。但扩展这些系统是一项艰巨的任务。随着量子计算机的发展，它们面临着更多的错误和噪音，这些错误和噪音可能会扰乱计算。为了解决这个问题…

王浩然
2024年12月8日
000
AI前沿

Jon Potter，RXN 集团合伙人 – 访谈系列

Jon Potter 是RXN Group的合伙人，并领导州级 AI 业务。他是一位经验丰富的律师、说客和传播者，创立并领导了两个行业协会和一个消费者组织，并就立法、通信和问题倡导…

点点
2024年10月21日
000
AI前沿

Together AI 3.05亿美元赌注：DeepSeek-R1等推理模型正在增加而非减少GPU需求‌重写并翻译后的内容

DeepSeek-R1刚出现时，业界普遍担忧先进推理能力的实现可能会减少对基础设施的需求。然而，事实证明情况并非如此。至少，根据Together AI的说法，DeepSeek和开源…

王浩然
2025年2月22日
000
AI前沿

Google 的 DataGemma AI 是统计向导

谷歌正在扩大其 AI 模型系列，同时解决该领域的一些最大问题。今天，该公司推出了 DataGemma，这是一对开源的、指令调整的模型，它们朝着缓解幻觉挑战迈出了一步——大型语言模型…

王浩然
2024年9月15日
000
AI前沿

特朗普的胜利将使埃隆·马斯克和 xAI 受益

共和党政治家、商人唐纳德·J·特朗普 (Donald J. Trump)以强势政治回归赢得了 2024 年美国总统大选，尽管各种选前民意调查显示，他与对手卡马拉·哈里斯 (Kama…

王浩然
2024年11月9日
000
AI前沿

引导人工智能部署：避免陷阱并确保成功

通往人工智能的道路不是短跑，而是一场马拉松，企业需要调整自己的步伐。那些在学会走路之前就开始跑步的人将会失败，成为那些试图快速到达人工智能终点线的企业的坟墓。事实是，没有终点线。没…

点点
2024年10月12日
000
AI前沿

从 AI 代理到企业预算，20 家风险投资公司分享了他们对 2025 年企业技术的预测

尽管人工智能被一些人誉为工业革命以来最大的技术突破，但企业——可以说是该技术最大的潜在客户群——采用人工智能的速度却很慢。尽管一些投资者预测 2024 年将是企业开始采用更多 A…

王浩然
2024年12月31日
000
AI前沿

LinkedIn 在更新服务条款前曾抓取用户数据用于培训

LinkedIn 可能已经在没有更新其条款的情况下利用用户数据训练了 AI 模型。 LinkedIn 的美国用户（欧盟、欧洲经济区或瑞士除外，这可能是由于这些地区的数据隐私规则）在…

王浩然
2024年9月19日
000
AI前沿

亚马逊与 Anthropic 合作增强 Alexa

亚马逊正准备推出其 Alexa 语音助手的改进版本，预计将于今年 10 月美国购物旺季之前上市。这项新技术在公司内部被称为“Remarkable”，将由 Anthropic 的C…

点点
2024年9月4日
000
AI前沿

ChatGPT 登陆 Windows

ChatGPT 现已在 Windows 上推出。今天，OpenAI宣布已开始预览其 AI 聊天机器人平台ChatGPT的专用 Windows 应用程序。 OpenAI 表示，该应…

点点
2024年10月18日
000