谷歌推出 Gemini 2.0 Pro、Flash-Lite 并将推理模型 Flash Thinking 连接到 YouTube、地图和搜索

王浩然 • 2025年2月6日上午9:00 • AI前沿 • 71 views

谷歌的 Gemini 系列人工智能大型语言模型 (LLM) 在近一年前刚开始并不顺利，出现了一些令人尴尬的图像生成错误事件，但自那以后，它一直在稳步改进，而且该公司似乎有意让其第二代产品——Gemini 2.0——成为迄今为止面向消费者和企业的最大、最好的产品。

今天，该公司宣布全面发布Gemini 2.0 Flash，推出Gemini 2.0 Flash-Lite，并推出Gemini 2.0 Pro实验版本。

这些模型旨在支持开发人员和企业，现在可以通过 Google AI Studio 和 Vertex AI 访问，其中 Flash-Lite 处于公开预览阶段，Pro 可供早期测试。

谷歌 DeepMind 首席技术官 Koray Kavukcuoglu 在公司的公告博客文章中写道：“所有这些模型在发布时都将具有多模式输入和文本输出的功能，并且未来几个月将有更多模式可供普遍使用。”这表明，尽管DeepSeek和OpenAI等竞争对手不断推出强大的产品，但谷歌仍具有一定的优势。

谷歌发挥其多式联运优势

DeepSeek-R1 和OpenAI 的新 o3-mini 模型都不能接受多模式输入——即图像和文件上传或附件。

虽然 R1 可以在其网站和移动应用聊天上接受它们，但该模型执行光学字符识别（OCR），这是一项已有 60 多年历史的技术，仅从这些上传中提取文本 – 并不真正理解或分析其中包含的任何其他特征。

然而，两者都是一类新的“推理”模型，它们会故意花更多时间思考答案，反思“思路链”及其答案的正确性。这与 Gemini 2.0 pro 系列等典型的 LLM 不同，因此 Gemini 2.0、DeepSeek-R1 和 OpenAI o3 之间的比较有点像苹果和橘子之间的比较。

但今天谷歌在推理方面也有一些新消息：谷歌首席执行官 Sundar Pichai 在社交网络 X上宣布， iOS 和 Android 版Google Gemini移动应用已更新，加入了谷歌自己的竞争对手推理模型 Gemini 2.0 Flash Thinking。该模型可以连接到谷歌地图、YouTube 和谷歌搜索，从而实现一系列全新的人工智能研究和互动，没有 DeepSeek 和 OpenAI 等服务的新贵根本无法与之匹敌。

我在撰写本文时在 iPhone 上的 Google Gemini iOS 应用上尝试了它，根据我的初步查询，它令人印象深刻地思考了上个月最受欢迎的 10 个 YouTube 视频的共同点，还在几秒钟内为我提供了附近医生办公室和营业/关门时间的表格。

Gemini 2.0 Flash 正式发布

Gemini 2.0 Flash 模型最初于 12 月作为实验版本推出，现已准备好投入生产。

专为高效AI应用而设计，提供低延迟响应并支持大规模多模态推理。

与竞争对手相比，它的一个主要优势在于它的上下文窗口，或者用户可以以提示的形式添加的令牌数量，并在与 LLM 驱动的聊天机器人或应用程序编程接口 (API) 的一次来回交互中接收回来。

尽管许多领先模型（例如 OpenAI 上周推出的新款 o3-mini）仅支持 200,000 个或更少的 token（约相当于一本 400 到 500 页的小说），但 Gemini 2.0 Flash 却支持 100 万个 token，这意味着它能够处理海量信息，特别适用于高频和大规模任务。

Gemini 2.0 Flash-Lite 的到来将成本曲线降至最低

同时，Gemini 2.0 Flash-Lite 是一款全新的 LLM，旨在提供经济高效的 AI 解决方案，同时不影响质量。

Google DeepMind 表示，在第三方基准测试（如 MMLU Pro（77.6% vs. 67.3%）和 Bird SQL 编程（57.4% vs. 45.6%））上，Flash-Lite 的表现优于其全尺寸（参数数量更多）的前代产品 Gemini 1.5 Flash，同时保持相同的价格和速度。

它还支持多模式输入，并具有 100 万个标记的上下文窗口，类似于完整的 Flash 模型。

目前，Flash-Lite 可通过 Google AI Studio 和 Vertex AI 进行公开预览，预计将在未来几周内全面上市。

如下表所示，Gemini 2.0 Flash-Lite 的价格为每百万代币 0.075 美元（输入）和每百万代币 0.30 美元（输出）。Flash-Lite 被定位为开发人员非常实惠的选择，在大多数基准测试中均优于 Gemini 1.5 Flash，同时保持相同的成本结构。

Logan Kilpatrick 强调了这些模型的经济性和价值，并在 X 上表示：“Gemini 2.0 Flash 是所有 LLM 中最具价值的道具，现在是时候构建了！”

确实，与可通过提供商 API 获得的其他领先的传统 LLM 相比，例如OpenAI 4o-mini（每 100 万个代币输入/输出 0.15 美元/0.6 美元）、Anthropic Claude（每 100 万个代币输入/输出 0.8 美元/4 美元！）甚至 DeepSeek 的传统 LLM V3（0.14 美元/0.28 美元），Gemini 2.0 Flash 似乎是最物有所值的。

Gemini 2.0 Pro 已进入实验阶段，提供 200 万个 token 上下文窗口

对于需要更高级 AI 功能的用户，Gemini 2.0 Pro（实验）模型现已可供测试。

Google DeepMind 将此描述为其编码性能最强的模型，能够处理复杂的提示。它具有 200 万个标记上下文窗口和改进的推理能力，能够集成 Google 搜索和代码执行等外部工具。

Red Dragon AI 联合创始人兼首席执行官 Sam Witteveen 是 Google 机器学习的外部开发专家，他在 YouTube 评论中讨论了 Pro 模型。“新的 Gemini 2.0 Pro 模型有一个 200 万个令牌上下文窗口，支持工具、代码执行、函数调用和 Google 搜索基础——我们在 Pro 1.5 中拥有的一切，但有所改进。”

他还提到了谷歌在人工智能开发方面的迭代方法：“谷歌战略的一个关键区别是，他们会在模型正式发布（GA，普遍可访问）之前发布实验版本，从而根据反馈进行快速迭代。”

性能基准测试进一步证明了 Gemini 2.0 模型系列的能力。例如，Gemini 2.0 Pro 在推理、多语言理解和长上下文处理等任务上的表现优于 Flash 和 Flash-Lite。

人工智能安全及未来发展

除了这些更新之外，Google DeepMind 还为其 Gemini 2.0 模型实施了新的安全措施。该公司正在利用强化学习技术来提高响应准确性，使用人工智能来批评和改进自己的输出。此外，还使用自动安全测试来识别漏洞，包括间接提示注入威胁。

展望未来，Google DeepMind 计划扩展 Gemini 2.0 模型系列的功能，预计未来几个月内将推出除文本之外的其他模式。

通过这些更新，谷歌正在加强其在人工智能开发方面的推动力，提供一系列专为效率、经济性和高级问题解决而设计的模型，并用自己的模型套件来应对 DeepSeek 的崛起，这些模型从功能强大到非常强大且极其实惠，再到稍微便宜（但仍然相当）实惠。

这是否足以帮助谷歌蚕食部分企业 AI 市场？该市场曾被 OpenAI 主导，现在已被 DeepSeek 颠覆。我们将持续跟踪并告诉您最新动态！

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/gu-ge-tui-chu-gemini-2-pro-flashlite-bing-jiang-tui-li-mo

Like (0)

王浩然作者

0 0

量子驱动的生成式人工智能框架问世

Previous 2025年2月5日

平衡成本、功耗和性能，实现生成式人工智能的民主化

Next 2025年2月6日

AI前沿

人工智能视觉搜索登陆 iPhone

该公司在周一的 Apple Event 2024 上宣布，视觉搜索即将登陆 iPhone，由苹果的 AI 功能套件 Apple Intelligence 提供支持。相机控制是iP…

王浩然
2024年9月10日
000
AI前沿

初创公司寻求开发物理人工智能，筹集 4 亿美元

总部位于旧金山的人工智能机器人初创公司 Physical Intelligence 本周宣布已筹集 4 亿美元资金，估值达到 28 亿美元。主要投资者包括亚马逊的杰夫·贝佐斯、O…

王浩然
2024年11月8日
000
AI前沿

Zyphra 的新 Zyda-2 数据集可让企业以高精度训练小型 LLM

Zyphra Technologies是一家致力于开发多模式代理系统的公司，该系统结合了下一代状态空间模型架构、长期记忆和强化学习方面的先进研究，该公司刚刚发布了 Zyda-2，这…

王浩然
2024年10月19日
000
AI前沿

TikTok 所有者字节跳动为电子阅读器疯狂的人工智能助手提供支持

Kindle 的一款热门电子阅读器竞争对手引发的轩然大波表明，美国产品中使用中国人工智能模型可能会在不知不觉中传播中国的宣传。根据 Reddit 上分享的有关该人工智能的截图，T…

王浩然
2025年1月16日
000
AI前沿

AI 是销售的未来吗？Salesforce 的新模式可能会改变游戏规则

Salesforce是领先的云端客户关系管理软件提供商，它推出了两种先进的人工智能模型——xGen-Sales和xLAM，旨在帮助企业提高自动化程度和效率。今天发布的这一消息反映了…

王浩然
2024年9月9日
000
AI前沿

智能适配，成就AI成功应用的关键：精准计算的力量

在当今这个技术日新月异的时代，人工智能（AI）已成为推动企业转型和创新的重要力量。然而，尽管AI技术潜力巨大，但其在实际应用中的成功却往往受到诸多因素的制约。其中，一个至关重要却常…

王浩然
2025年3月21日
000
AI前沿

人工智能能力的增长速度快于硬件：去中心化可以缩小差距吗？

过去两年，人工智能能力呈爆炸式增长，ChatGPT、Dall-E 和 Midjourney 等大型语言模型 (LLM) 已成为日常使用的工具。当您阅读本文时，生成式人工智能程序正在…

AI News
2024年8月27日
000
AI前沿

OpenAI推出5000万美元联盟，推动教育与科研领域AI应用‌

在人工智能（AI）技术日新月异的今天，OpenAI再次迈出了重要的一步，宣布成立一个旨在加速AI在教育和科研领域应用的联盟。该联盟名为“NextGenAI”，OpenAI承诺将向包…

王浩然
2025年3月14日
000
AI前沿

卡曼筹集2000万美元，打造小行星采矿自主航天器

近日，卡曼公司宣布成功筹集2000万美元资金，旨在开发一款用于小行星采矿的自主航天器。这一雄心勃勃的项目旨在利用先进的自主技术和太空探索经验，从小行星上开采宝贵资源，为未来的太空经…

王浩然
2025年2月24日
000
AI前沿

低致幻性人工智能微剂量给药

Agentforce已经到来。今年 9 月，Salesforce 结束了又一次年度Dreamforce 大会。加入众多与会者——以及在格外干净的旧金山穿梭的 Waymos 大军——…

点点
2024年10月8日
000
AI前沿

Noma 正在构建工具来发现 AI 应用程序的安全问题

公司担心，他们急于采用人工智能会使他们更容易受到网络威胁。根据最近对 350 多名 IT 领导者的调查，超过一半的受访高管表示，人工智能应用程序的复杂性削弱了他们组织的网络安全态势…

王浩然
2024年11月2日
000
AI前沿

人工智能驱动的制造业和机器人创新技术揭晓

工业自动化开发商 Vention 宣布推出基于人工智能的增强功能以及用于先进制造和机器人技术的新产品

点点
2024年9月18日
000
AI前沿

DeepSeek AI 未通过多项安全测试，给企业敲响警钟

研究人员发现，流行的生成式人工智能模型允许出现幻觉、容易避开的护栏、易受越狱和恶意软件创建请求等，而且出现的频率极高在将中国生成式人工智能DeepSeek应用于商业应用之前，企业…

王浩然
2025年2月18日
000
AI前沿

无需再训练：Sakana 的新 AI 模型改变了机器学习的方式

Sakana AI是一家专注于研究自然启发算法的人工智能研究实验室，其研究人员开发了一种自适应语言模型，该模型无需微调即可学习新任务。该模型称为Transformer² (Tran…

王浩然
2025年1月25日
000
AI前沿

Stable Diffusion 3.5 登陆 Amazon Bedrock：这对企业 AI 工作流程意味着什么

创建精美的生成式 AI 图像可能很有趣也很有用，但这并不是企业所需要的全部。企业文本转图像生成不仅仅是创建图像。它还涉及与现有工作流程和其他企业 AI 工具的集成。这是Stabl…

王浩然
2024年12月20日
000
AI前沿

随着“AlphaChip”的兴起，谷歌和 Meta 更新了他们的人工智能模型

于 OpenAI 的影响，本周人工智能新闻异常繁忙，包括首席执行官 Sam Altman 发表的一篇有争议的博客文章、高级语音模式的广泛推出、5GW数据中心的传闻、重大员工变动以及…

点点
2024年9月30日
000
AI前沿

腾讯的 EzAudio AI 将文本转换为逼真的声音，引发创新和争论

约翰霍普金斯大学和腾讯 AI 实验室的研究人员推出了EzAudio，这是一种新的文本转音频 (T2A) 生成模型，有望以前所未有的效率从文本提示中产生高质量的音效。这一进步标志着人…

王浩然
2024年9月22日
000
AI前沿

ServiceNow 开源 Fast-LLM，旨在帮助企业以 20% 的速度训练 AI 模型

训练大型语言模型 (LLM) 是企业最昂贵且最耗时的练习之一。ServiceNow 今天发布的新开源模型可能会带来巨大的改变，有望将训练速度提高 20%，从而为企业节省时间和金钱。…

王浩然
2024年12月11日
000
AI前沿

Beyond Scripts:视频游戏 NPC 与生成式 AI 的未来

非玩家角色 (NPC)在电子游戏中必不可少，它们为我们探索的虚拟世界提供了深度和互动性。NPC（例如提供商品的店主或分配任务的任务提供者）丰富了游戏体验。然而，传统的 NPC 通常…

王浩然
2024年8月23日
010
AI前沿

Sakana AI 的 CycleQD 优于多技能语言模型的传统微调方法

Sakana AI的研究人员开发了一种资源高效的框架，可以创建数百种专门用于不同任务的语言模型。该技术称为CycleQD，它使用进化算法来结合不同模型的技能，而无需昂贵且缓慢的训练…

王浩然
2024年12月7日
000