谷歌正在升级其视觉搜索应用程序 Lens,使其能够近乎实时地回答有关您周围环境的问题。
安装了Google 应用的英语 Android 和 iOS 用户现在可以开始通过 Lens 拍摄视频并询问有关视频中感兴趣的对象的问题。
Lens 产品管理总监 Lou Wang 表示,该功能使用“定制”的Gemini模型来理解视频和相关问题。Gemini是 Google 的 AI 模型系列,为公司产品组合中的多种产品提供支持。
“假设你想进一步了解一些有趣的鱼,”王在新闻发布会上说。“[Lens 将] 制作一份概述,解释为什么它们会绕圈游动,并提供更多资源和有用信息。”
要使用 Lens 的新视频分析功能,您必须注册 Google 的搜索实验室计划,并选择实验室中的“AI 概览及更多”实验功能。在 Google 应用中,按住智能手机的快门按钮即可激活 Lens 的视频拍摄模式。
在录制视频时提出问题,Lens 就会链接到AI Overviews提供的答案。AI Overview 是 Google 搜索中的一项功能,它使用 AI 来汇总来自网络的信息。
据王先生介绍,Lens 使用人工智能来确定视频中哪些帧最“有趣”、最突出——最重要的是,与所提出的问题最相关——并利用这些帧来“巩固”人工智能概览中的答案。
“所有这些都来自于对人们现在如何使用 Lens 等产品的观察,”王说。“如果你降低提出这些问题的门槛,帮助人们满足他们的好奇心,人们就会很自然地接受它。”
在 Lens 推出视频功能之前, Meta 上个月曾为其 AR 眼镜 Ray-Ban Meta 预告了类似功能。Meta 计划为这款眼镜带来实时 AI 视频功能,让佩戴者可以询问周围的事物(例如,“这是什么花?”)。
OpenAI 还透露了一项功能,可以让其高级语音模式工具理解视频。最终,高级语音模式(ChatGPT的一项高级功能)将能够实时分析视频,并在回答您的问题时考虑上下文。
看来,谷歌已经抢先了这两家公司——除了 Lens 是异步的(你不能实时聊天),并且假设视频功能如广告中所说的那样有效。我们在新闻发布会上没有看到现场演示,而且谷歌在 AI 功能方面一向是夸大其词。
除了视频分析,Lens 现在还可以同时进行图片和文字搜索。英语用户(包括未加入 Labs 的用户)可以启动 Google 应用并按住快门按钮拍照,然后大声提出问题。
最后,Lens 获得了新的电子商务专用功能。
从今天开始,当 Android 或 iOS 上的 Lens 识别出某件商品时,它会显示有关该商品的信息,包括价格和优惠、品牌、评论和库存。商品 ID 适用于上传和新拍摄的照片(但不适用于视频),目前仅限于特定国家/地区和某些购物类别,包括电子产品、玩具和美容产品。
“假设你看到一个背包,并且很喜欢它,”王说。“你可以使用 Lens 识别该产品,并且能够立即看到你可能想知道的细节。”
这也包含广告元素。谷歌表示,Lens 识别产品的结果页面还会显示带有选项和价格的“相关”购物广告。
为什么要在 Lens 中植入广告?因为根据 Google 的数据,每月大约有 40 亿次 Lens 搜索与购物有关。对于一家以广告为命脉的科技巨头来说,这实在是一个不容错过的丰厚机会。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/google-lens-xian-zai-ke-yi-hui-da-you-guan-shi-pin-de-wen-ti