Google Lens 现在可以回答有关视频的问题

王浩然 • 2024年10月6日下午7:00 • 技术评测 • 140 views

谷歌正在升级其视觉搜索应用程序 Lens，使其能够近乎实时地回答有关您周围环境的问题。

安装了Google 应用的英语 Android 和 iOS 用户现在可以开始通过 Lens 拍摄视频并询问有关视频中感兴趣的对象的问题。

Lens 产品管理总监 Lou Wang 表示，该功能使用“定制”的Gemini模型来理解视频和相关问题。Gemini是 Google 的 AI 模型系列，为公司产品组合中的多种产品提供支持。

“假设你想进一步了解一些有趣的鱼，”王在新闻发布会上说。“[Lens 将] 制作一份概述，解释为什么它们会绕圈游动，并提供更多资源和有用信息。”

要使用 Lens 的新视频分析功能，您必须注册 Google 的搜索实验室计划，并选择实验室中的“AI 概览及更多”实验功能。在 Google 应用中，按住智能手机的快门按钮即可激活 Lens 的视频拍摄模式。

在录制视频时提出问题，Lens 就会链接到AI Overviews提供的答案。AI Overview 是 Google 搜索中的一项功能，它使用 AI 来汇总来自网络的信息。

据王先生介绍，Lens 使用人工智能来确定视频中哪些帧最“有趣”、最突出——最重要的是，与所提出的问题最相关——并利用这些帧来“巩固”人工智能概览中的答案。

“所有这些都来自于对人们现在如何使用 Lens 等产品的观察，”王说。“如果你降低提出这些问题的门槛，帮助人们满足他们的好奇心，人们就会很自然地接受它。”

在 Lens 推出视频功能之前， Meta 上个月曾为其 AR 眼镜 Ray-Ban Meta 预告了类似功能。Meta 计划为这款眼镜带来实时 AI 视频功能，让佩戴者可以询问周围的事物（例如，“这是什么花？”）。

OpenAI 还透露了一项功能，可以让其高级语音模式工具理解视频。最终，高级语音模式（ChatGPT的一项高级功能）将能够实时分析视频，并在回答您的问题时考虑上下文。

看来，谷歌已经抢先了这两家公司——除了 Lens 是异步的（你不能实时聊天），并且假设视频功能如广告中所说的那样有效。我们在新闻发布会上没有看到现场演示，而且谷歌在 AI 功能方面一向是夸大其词。

除了视频分析，Lens 现在还可以同时进行图片和文字搜索。英语用户（包括未加入 Labs 的用户）可以启动 Google 应用并按住快门按钮拍照，然后大声提出问题。

最后，Lens 获得了新的电子商务专用功能。

从今天开始，当 Android 或 iOS 上的 Lens 识别出某件商品时，它会显示有关该商品的信息，包括价格和优惠、品牌、评论和库存。商品 ID 适用于上传和新拍摄的照片（但不适用于视频），目前仅限于特定国家/地区和某些购物类别，包括电子产品、玩具和美容产品。

“假设你看到一个背包，并且很喜欢它，”王说。“你可以使用 Lens 识别该产品，并且能够立即看到你可能想知道的细节。”

这也包含广告元素。谷歌表示，Lens 识别产品的结果页面还会显示带有选项和价格的“相关”购物广告。

为什么要在 Lens 中植入广告？因为根据 Google 的数据，每月大约有 40 亿次 Lens 搜索与购物有关。对于一家以广告为命脉的科技巨头来说，这实在是一个不容错过的丰厚机会。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/google-lens-xian-zai-ke-yi-hui-da-you-guan-shi-pin-de-wen-ti

AI Overviews AI 模型 Android AR 眼镜 ChatGPT Gemini Google 应用 iOS Lens

Like (0)

王浩然作者

0 0

投资者争相入股 ElevenLabs，该公司估值或很快达到 30 亿美元

Previous 2024年10月6日

OpenAI 推出全新“Canvas”ChatGPT 界面，专门针对写作和编码项目

Next 2024年10月6日

技术评测

Raspberry Pi 推出用于基于视觉的 AI 应用的相机模块

Raspberry Pi是一家销售微型廉价单板计算机的公司，它正在发布一款附加组件，该组件将开辟多种使用场景——没错，因为现在是 2024 年，所以它有 AI 角度。这款图像传感器…

王浩然
2024年10月2日
000
技术评测

Grok 真的比 Midjourney 好吗？以下是两者的比较

说到 AI 图像生成器，如今有几十种选择。该系列中的两款佼佼者（包括 Dall-E、 Firefly、Stable Diffusion 和 Playground AI）是Midjo…

王浩然
2024年9月16日
000
技术评测

AI一键生成“类黑神话”，腾讯推出游戏视频模型GameGen-O，业内人士：游戏工作室的ChatGPT时刻

什么？大模型也许很快就能生成《黑神话·悟空》这种3A大作了？！直接看一则demo，《西游记》这就上桌：搭配BGM，是不是有内味儿了（doge）。这就是腾讯近日推出的GameG…

点点
2024年9月16日
000
技术评测

iPad 上最强的绘画应用，宣布拒绝生成式 AI

小公司，大底气。

点点
2024年8月21日
000
技术评测

Vidyo AI 评论：将 1 小时的视频制作成 22 个热门短片

您是否曾发现自己被长达数小时的视频片段所淹没，希望能够弹指一挥就将其变成引人入胜的社交媒体剪辑？如果您曾经面临将长视频剪辑成简短、引人入胜的内容这一艰巨任务，那么您并不孤单。这个…

王浩然
2024年8月22日
000
技术评测

5 个最佳大型语言模型 (LLM)（2024 年 9 月）

人工智能领域正在以惊人的速度发展，大型语言模型 (LLM) 在自然语言处理和理解领域处于领先地位。随着我们不断探索这一领域，新一代 LLM 应运而生，它们都在不断突破 AI 的极限…

AI评测师
2024年9月19日
000
技术评测

Agility Robotics 的 Digit：自动化劳动力的未来

在当今瞬息万变的世界，自动化正在以惊人的速度重塑行业，使机器人成为劳动力的重要组成部分。Agility Robotics凭借其先进的人形机器人引领着这一激动人心的变革。其旗舰产品D…

AI评测师
2024年8月27日
000
技术评测

微软更安全的 Windows Recall 功能也可被用户卸载

为了回应安全问题，微软详细介绍了如何彻底改造其备受争议的人工智能 Recall 功能，该功能可以截取您在计算机上看到或执行的几乎所有操作的屏幕截图。Recall 最初应该在 6 月…

王浩然
2024年9月30日
000
技术评测

【EAGLE揭秘】多模态大型语言模型，探索编码器设计新境界

准确解释复杂视觉信息的能力是多模态大型语言模型 (MLLM) 的关键重点。最近的研究表明，增强的视觉感知可显著减少幻觉并提高分辨率敏感任务（例如光学字符识别和文档分析）的性能。最近…

AI评测师
2024年9月11日
000
技术评测

AI 语言对决：比较 C++、Python、Java 和 Rust 的性能

在人工智能 (AI)开发中，编程语言的选择对于确定项目的效率和成功起着至关重要的作用。C++、Python、Java 和 Rust 各自具有独特的优势和特性，可以显著影响结果。这些…

AI评测师
2024年8月30日
000
技术评测

Phrasly 评论：它真的能让 AI 内容听起来像人类吗？

您是否想过，人工智能生成的内容是否真的听起来像人类？我最近遇到了Phrasly，事实证明，它可以将人工智能的效率与人类写作的真实性融为一体！在这篇 Phrasly 评论中，我将讨…

王浩然
2025年1月14日
000
技术评测

AI这个「狗头军师」，教年轻人说「土味情话」贼油腻

AI伊能静，专治「话题终结者」。娱乐圈中，伊能静绝对是情商王者。她曾在节目现场进行恋爱教学，被网友封为「行走的教科书」。比如，聊天时不要只讲动作，要表达情绪和需求。男生问：…

AI评测师
2024年9月12日
000
技术评测

使用 JPEG 压缩来改善神经网络训练

加拿大的一篇新研究论文提出了一个框架，该框架有意将 JPEG 压缩引入神经网络的训练方案中，并设法获得更好的结果以及更好的抵抗对抗性攻击的能力。这是一个相当激进的想法，因为目前的…

AI评测师
2024年10月11日
000
技术评测

【秘方】用AI打造视觉盛宴，Visme让你的创意起飞！

对于许多人来说，创建具有视觉吸引力的内容可能很困难，无论是工作演示还是社交媒体帖子。除非您拥有平面设计学位或有钱聘请专业人士，否则您通常很难独立制作高质量的视觉效果。有了Vism…

AI评测师
2024年9月11日
000
技术评测

三星新款笔记本电脑的人工智能功能实际上翻了一番

三星在新闻发布室发布了一篇帖子，宣布其最新的 Galaxy Book 型号 Galaxy Book5 Pro 360 将成为其首款新型“强力 AI PC”。这是一款Copilot+…

王浩然
2024年9月9日
000
技术评测

抢先OpenAI，Hume AI发布第二代情感智能AI，支持自定义语音，在线可玩

据VentureBeat今日报道，AI情感创企Hume AI于9月11日发布了Empathic Voice Interface 2（EVI 2）。 EVI被宣称为全球首个具有情商的…

AI评测师
2024年9月22日
000
技术评测

欧洲居民如何访问新的 AI 视频生成器 Google VEO

谷歌最近推出了一款名为Veo的尖端人工智能工具，它允许用户从文本生成视频。这款创新工具目前处于限量发布阶段，仅供美国用户使用。然而，对于渴望尽早使用 Veo 的欧洲居民来说，可以使…

AI评测师
2024年9月4日
000
技术评测

在几秒钟内生成 AI 商业计划

你知道吗，23.2% 的新企业在第一年就倒闭了？因此，制定一个清晰、结构良好的计划对于跨越这一艰难的门槛至关重要。我最近偶然发现了 Upmetrics。这是一款基于云的业务规划工…

AI评测师
2024年11月5日
000
技术评测

iPhone 16、Apple Intelligence、AirPods 4 等：2024 年 Apple Event 上揭晓的一切

苹果今年最大的活动已经到来，随之而来的是 iPhone 16 系列和一系列与 iOS 18 相关的 AI 更新。Apple Intelligence 是今年苹果活动的明星，就像 6…

王浩然
2024年9月10日
000
技术评测

这款 AI 音乐生成器好得吓人

每位音乐家都曾面临过这些令人沮丧的时刻：在创作中浪费了无数的时间，并与创作障碍进行了无休止的斗争。作为一名创意人士，我知道创意瓶颈会让人多么沮丧。但如果有一种工具可以立即将您的想…

AI评测师
2024年9月10日
000

发表回复

Please Login to Comment

Google Lens 现在可以回答有关视频的问题

相关推荐

发表回复

Share To :