Google Gemini 2.0：这会是真正自主人工智能的开始吗？

王浩然 • 2024年12月12日上午10:00 • AI前沿 • 84 views

谷歌今天发布了Gemini 2.0，标志着其向能够独立完成复杂任务的 AI 系统迈出了雄心勃勃的一步，并引入了原生图像生成和多语言音频功能——这些功能使这家科技巨头在日益激烈的 AI 主导地位争夺战中与OpenAI和Anthropic展开直接竞争。

此次发布恰逢谷歌首次推出 Gemini一周年，正值人工智能发展的关键时刻。这些新的“代理”人工智能系统不仅可以简单地响应查询，还可以理解细微的上下文，提前规划多个步骤，并代表用户采取监督行动。

谷歌的新人工智能助手将如何重塑日常数字生活

在最近的一次新闻发布会上，Gemini 产品管理总监 Tulsee Doshi 概述了该系统的增强功能，同时演示了实时图像生成和多语言对话。“Gemini 2.0 带来了增强的性能和新功能，例如原生图像和多语言音频生成，”Doshi 解释道。“它还具有原生智能工具使用功能，这意味着它可以直接访问 Google 产品，例如搜索，甚至可以执行代码。”

初始版本以Gemini 2.0 Flash为中心，这是一个实验版本，谷歌声称其运行速度是其前代产品的两倍，同时超越了更强大型号的功能。这代表了一项重大的技术成就，因为之前的速度提升通常是以功能减少为代价的。

新一代人工智能代理有望改变我们的工作方式

或许最重要的是，谷歌推出了三个基于 Gemini 2.0 架构的原型 AI 代理，展示了该公司对 AI 未来的愿景。Project Astra是一款升级版通用 AI 助手，展示了其在访问谷歌工具和保留先前交互的上下文记忆的同时，能够跨多种语言进行复杂对话的能力。

Google DeepMind 集团产品经理徐碧波在现场演示中解释道：“Project Astra 现在拥有长达 10 分钟的会话记忆，可以记住您过去与之进行的对话，因此您可以获得更有帮助、更个性化的体验。”该系统可以在语言之间顺利转换，并通过 Google 搜索和地图访问实时信息，这表明其集成度在消费级 AI 产品中前所未有。

谷歌瞄准开发者社区，企业 AI 之争愈演愈烈

对于开发者和企业客户，谷歌推出了Project Mariner和Jules，这是两个专门用于自动执行复杂技术任务的 AI 代理。Project Mariner 以 Chrome 扩展程序的形式进行演示，在针对真实网络任务的 WebVoyager 基准测试中取得了令人印象深刻的 83.5% 的成功率 — — 与之前自主网络导航的尝试相比，这是一个显着的进步。

“Project Mariner 是一个早期研究原型，旨在探索代理浏览网页和采取行动的能力，”Google 实验室产品管理总监 Jaclyn Konzelmann 表示。“根据WebVoyager 基准测试，Project Mariner 取得了令人印象深刻的 83.5% 的成绩，该基准测试了代理在端到端、真实网络任务上的表现。”

定制硅片和大规模：谷歌 AI 雄心背后的基础设施

支持这些进步的是谷歌第六代张量处理单元 (TPU) Trillium ，它现已向云客户全面开放。定制的 AI 加速器代表了对计算基础设施的巨额投资，谷歌在单个网络结构中部署了超过 100,000 个 Trillium 芯片。

AI 工作室和 Gemini API 团队的产品经理 Logan Kilpatrick 在新闻发布会上强调了这项基础设施投资的实际影响。“闪存使用量增长了 900% 以上，这真是令人难以置信，”Kilpatrick 说道。“你知道，我们在过去几个月里推出了六个实验模型，现在有数百万开发人员正在使用 Gemini。”

未来之路：自主人工智能时代的安全问题和竞争

谷歌向自主代理的转变或许是自 OpenAI 发布ChatGPT以来人工智能领域最重要的战略转折点。虽然竞争对手专注于增强大型语言模型的功能，但谷歌认为，未来属于能够主动导航数字环境并在最少人工干预的情况下完成复杂任务的人工智能系统。

这种能够思考、计划和行动的人工智能代理的愿景标志着对当前反应式人工智能助手范式的背离。这是一个冒险的赌注——自主系统本身会带来更大的安全问题和技术挑战——但如果成功，它可能会重塑竞争格局。该公司在定制硅片和基础设施方面的巨额投资表明，它已准备好在这个新方向上积极竞争。

然而，向更自主的人工智能系统过渡引发了新的安全和道德问题。谷歌强调了其对负责任开发的承诺，包括与可信赖的用户进行广泛的测试和内置安全措施。该公司逐步推出这些功能的方法，从开发人员访问和可信赖的测试人员开始，表明该公司意识到部署自主人工智能系统所涉及的潜在风险。

此次发布对谷歌来说正值关键时刻，因为它面临着来自竞争对手越来越大的压力，以及对人工智能安全性的严格审查。微软和OpenAI今年在人工智能开发方面取得了重大进展，而Anthropic等其他公司也获得了企业客户的青睐。

Gemini API 集团产品经理 Shrestha Basu Mallick 在新闻发布会上强调：“我们坚信，打造人工智能的唯一方法是从一开始就负责任。随着我们改进模型和代理，我们将继续优先考虑将安全和责任作为我们模型开发流程的关键要素。”

随着这些系统在现实世界中采取行动的能力越来越强，它们可能会从根本上重塑人们与技术的互动方式。 Gemini 2.0 的成功不仅可能决定谷歌在人工智能市场的地位，也可能决定人工智能发展的更广阔轨迹，因为整个行业正在向更加自主的系统迈进。

一年前，当谷歌推出 Gemini 的第一版时，人工智能领域被聊天机器人所主导，这些聊天机器人可以进行巧妙的对话，但在处理现实世界的任务时却举步维艰。现在，随着人工智能代理开始迈出走向自主的第一步，该行业正处于另一个转折点。问题不再是人工智能是否能理解我们，而是我们是否准备好让人工智能代表我们行事。谷歌押注我们能够理解——而且押注很大。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/google-gemini-2-zhe-hui-shi-zhen-zheng-zi-zhu-ren-gong-zhi

Like (0)

王浩然作者

0 0

ServiceNow 开源 Fast-LLM，旨在帮助企业以 20% 的速度训练 AI 模型

Previous 2024年12月11日

谷歌推出人工智能编码助手“Jules”，承诺自动修复错误并加快开发周期

Next 2024年12月12日

AI前沿

Manus或许并非中国的第二个“DeepSeek时刻”‌

近期，有关Manus的热烈讨论在中国科技界掀起了波澜，许多人将其视为继DeepSeek之后的又一里程碑事件。然而，深入剖析后不难发现，Manus可能并未达到DeepSeek那样的高…

王浩然
2025年3月11日
000
AI前沿

Dottxt 获 1190 万美元融资，帮助 AI 模型回答问题

正如我们之前报道的那样，企业 CIO 正在缓慢地推进生成式 AI。其中一个原因是 AI 不适合现有的软件工程工作流程，因为它实际上使用的不是同一种语言。例如，LLM（又称大型语言模…

点点
2024年10月18日
000
AI前沿

OpenAI 推出 o3-mini 高级推理模型，对抗 DeepSeek 的崛起

OpenAI 及时发布了新的专有 AI 模型，以对抗开源竞争对手 DeepSeek-R1 的快速崛起——但这足以削弱后者的成功吗？今天，经过几天的谣言和社交媒体上人工智能用户的日…

王浩然
2025年2月2日
000
AI前沿

Kimi创始人杨植麟最新分享：关于OpenAI o1新范式的深度思考

OpenAI o1的发布，又一次引发了行业内关于大模型进化新范式的讨论。讨论的焦点是两个公认的大模型进化瓶颈：数据瓶颈——数据不够用了；以及算力瓶颈——3.2万张卡已是目前的天花…

点点
2024年9月16日
000
AI前沿

Cosmos 研究所启动资助计划和 AI 实验室

宇宙研究所(Cosmos Institute ) 是一家非营利性机构，其创始研究员包括 Anthropic 联合创始人杰克·克拉克 (Jack Clark) 和前国防部技术专家布伦…

王浩然
2024年9月5日
000
AI前沿

亚马逊首席执行官安迪·贾西暗示将推出“代理” Alexa

亚马逊首席执行官安迪·贾西 (Andy Jassy) 周四暗示，该公司的 Alexa 助手将推出改进的“代理”版本，可以代表用户采取行动。 “我认为下一代的这些助手和生成式人工智能…

王浩然
2024年11月2日
000
AI前沿

拜登总统发布首份关于人工智能的国家安全备忘录

拜登总统发布了美国首份关于人工智能的国家安全备忘录 (NSM)，阐述了美国如何从安全角度对待这项技术。该备忘录以拜登早先关于人工智能的行政命令为基础，其前提是尖端人工智能发展将在…

点点
2024年10月26日
000
AI前沿

增强开源 AI 并改善数据治理

在欧洲人工智能与大数据博览会召开之前，AI News 采访了Databricks高级解决方案架构师 Ivo Everts ，讨论了影响开源人工智能和数据治理未来的几个关键发展。 D…

点点
2024年9月28日
000
AI前沿

Gemini Extensions 将帮助谷歌的人工智能接管你的 Android 手机

谷歌承诺其 Gemini AI 不会成为 Google Assistant 的简单聊天机器人替代品。未来几周，我们将看到这一承诺是否能实现。Gemini 扩展将允许 AI 访问更…

王浩然
2024年10月6日
000
AI前沿

Hugging Face 的 SmolVLM 可以大幅降低企业的 AI 成本

Hugging Face 刚刚发布了SmolVLM，这是一种紧凑型视觉语言 AI 模型，可能会改变企业在运营过程中使用人工智能的方式。新模型以惊人的效率处理图像和文本，而所需的…

王浩然
2024年11月28日
000
AI前沿

Nvidia 刚刚爆料：其新 AI 模型开放、规模庞大，可与 GPT-4 竞争

Nvidia发布了强大的开源人工智能模型，可与 OpenAI 和 Google 等行业领导者的专有系统竞争。该公司新推出的NVLM 1.0系列大型多模态语言模型，以 720 亿参…

点点
2024年10月2日
000
AI前沿

Salesforce 放弃 Agentforce 2.0，为企业带来推理 AI

Salesforce周二公布了其人工智能平台的重大升级，引入了使人工智能代理能够进行更深入的推理并在企业工作流程中采取更自主行动的技术——这是该公司首席执行官雄心勃勃的“数字化劳动…

王浩然
2024年12月21日
000
AI前沿

“不受限制”的人工智能集团 Nous Research 推出首个聊天机器人

Nous Research是一家致力于创建“个性化、不受限制”的人工智能模型的人工智能研究机构，旨在替代 OpenAI、Anthropic、Google、Meta 等较为保守的企业…

王浩然
2024年11月9日
000
AI前沿

孤星与Phison数据中心基础设施将登陆月球‌

近日，孤星（Lonestar）与Phison宣布了一项令人瞩目的计划：他们将携手将数据中心基础设施送往月球。这一创举预示着太空技术在商业应用领域的又一重大突破。 ‌一、计划背景‌ …

王浩然
2025年3月1日
000
AI前沿

推理框架 Archon 有望加快 LLM 进程，且无需额外成本

斯坦福大学扩展智能实验室的研究人员介绍了一种新的推理框架，可以帮助大型语言模型 (LLM) 更快地处理潜在的响应。该框架 Archon 使用推理时间架构搜索 (ITAS) 算法…

王浩然
2024年10月3日
000
AI前沿

人工智能代理入门（第 2 部分）：自主性、保障措施和陷阱

在我们的第一部分中，我们概述了利用 AI 代理提高企业效率的关键策略。我解释了与独立 AI 模型不同，代理如何使用上下文和工具迭代地优化任务以增强代码生成等结果。我还讨论了多代理系…

王浩然
2024年11月27日
000
AI前沿

2024 年证明控制人工智能是可能的

今年几乎所有的人工智能重大新闻都是关于该技术发展速度有多快、它造成的危害，以及关于它多久会发展到人类无法控制的程度的猜测。但 2024 年，各国政府也在监管算法系统方面取得了重大进…

王浩然
2024年12月26日
000
AI前沿

利用人工智能加速运营，更快取得成功

效率不再只是一种竞争优势，而是一种商业必需品。实现卓越运营不仅仅意味着采用新工具，它需要彻底重新思考运营方式。这就是人工智能发挥作用的地方。人工智能不仅仅是自动化日常任务，它还改…

点点
2024年10月23日
000
AI前沿

OpenAI 称其商业用户已达 100 万

OpenAI 的付费商业产品达到了一个里程碑，ChatGPT Enterprise、Team 和 Edu 产品的付费商业用户达到一百万。 100 万用户大关较该公司今年 4 月公…

王浩然
2024年9月9日
000
AI前沿

解锁人工智能的投资回报率：成功实施人工智能的策略

企业越来越多地使用人工智能来增强运营，但实现强劲的投资回报率仍然是一项挑战。为了评估人工智能的真正价值，行业领导者应该采取创新和前瞻性的方法。人工智能在收入增长、成本降低、决策、客…

王浩然
2024年8月25日
000