ChatGPT 获得屏幕共享和实时视频分析功能，可与 Gemini 2 相媲美

王浩然 • 2024年12月13日下午6:00 • AI前沿 • 290 views

OpenAI终于在其先进的语音模式中添加了期待已久的视频和屏幕共享功能，允许用户以不同的方式与聊天机器人进行交互。

目前，ChatGPT Teams、Plus 和 Pro 用户的。iOS 和。Android 移动应用均可使用这两项功能，并将于 1 月向 ChatGPT Enterprise 和 Edu 用户推出。不过，欧盟、瑞士、冰岛、挪威和列支敦士登的用户将无法使用高级语音模式。

OpenAI 于 5 月首次透露了该功能，当时该公司发布了 GPT-4o，并讨论了 ChatGPT 学习“观看”比赛并解释正在发生的事情。高级语音模式于 9 月向用户推出。

OpenAI 的视频模式感觉就像 Facetime 这样的视频通话，因为 ChatGPT 会实时响应用户在视频中展示的内容。它可以看到用户周围的事物，识别物体，甚至记住自我介绍的人。在 OpenAI 的“12 Days of Shipmas”活动的一部分中，ChatGPT 使用视频功能帮助冲泡咖啡。ChatGPT 看到了咖啡用具，指示何时放入过滤器并对结果进行评论。

它也与谷歌最近宣布的 Project Astra非常相似，用户可以在其中打开视频聊天，Gemini 2.0 将回答有关它所看到内容的问题，例如识别在伦敦街头发现的雕塑。从很多方面来看，这些功能都是 Humane Pin 和Rabbit r1等 AI 设备宣传的更高级版本：让 AI 语音助手回答有关它在视频中看到的内容的问题。

新的屏幕共享功能将 ChatGPT 从应用程序带入浏览器领域。

对于屏幕共享，三点菜单允许用户退出 ChatGPT 应用。他们可以在手机上打开应用并询问 ChatGPT 所看到的内容。在演示中，OpenAI 研究人员触发了屏幕共享，然后打开消息应用，请求 ChatGPT 帮助回复通过短信发送的照片。

不过，高级语音模式下的屏幕共享功能与微软和谷歌最近发布的功能有相似之处。

上周，微软发布了Copilot Vision 的预览版，Pro 订阅用户可在浏览网页时打开 Copilot 聊天。Copilot Vision 可查看商店网站上的照片，甚至可帮助玩地图猜谜游戏 Geoguessr。谷歌的 Project Astra 也能以同样的方式读取浏览器。

谷歌和 OpenAI 都发布了手机屏幕共享 AI 聊天功能，以瞄准可能在旅途中更多地使用 ChatGPT 或 Gemini 的消费者群体。但这些类型的功能可能预示着企业与 AI 代理进行更多合作的一种方式，因为代理可以看到人们在屏幕上看到的内容。它可以成为使用计算机的模型的前身，例如Anthropic 的 Computer Use，其中 AI 模型不仅会查看屏幕，还会主动为用户打开标签和程序。

呵呵呵呵，问圣诞老人一个问题

为了增加趣味性，OpenAI 还在高级语音模式中推出了“圣诞老人模式”。新的预设声音听起来很像穿着红色西装的快乐老人。

与仅限于特定用户的新功能不同，“圣诞老人模式”现已向拥有移动应用程序、ChatGPT 网络版本以及 Windows 和 MacOS 应用程序高级语音模式访问权限的用户开放，有效期至 1 月初。

不过，与圣诞老人的聊天不会保存在聊天记录中，也不会影响 ChatGPT 的记忆。

甚至连 OpenAI 也感受到了圣诞气氛。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/chatgpt-huo-de-ping-mu-gong-xiang-he-shi-shi-shi-pin-fen-xi

Like (0)

王浩然作者

0 0

RapidCanvas 如何为 gen AI 项目自动执行 70% 的数据任务

Previous 2024年12月13日

Anthropic 最快的型号 Claude 3.5 Haiku 现已全面上市

Next 2024年12月13日

AI前沿

起底AIGC概念股：退潮之后，谁在裸泳？

生成式AI技术狂飙一年多以后，A股市场的「AIGC概念股」正在经历一场集体的「去泡沫」。截至9月12日收盘，相比去年的涨幅，今年以来，万得AIGC概念指数(8841660.WI)…

点点
2024年9月13日
000
AI前沿

Spotify携手Eleven Labs，拓展AI有声读物库

近日，全球领先的流媒体音乐服务平台Spotify宣布与Eleven Labs达成合作，旨在进一步扩大其AI有声读物库的规模。此次合作标志着Spotify在音频内容领域的又一重要布局…

王浩然
2025年2月24日
000
AI前沿

Snowflake 与 Anthropic 合作扩展 AI 工具——这对企业意味着什么

Snowflake和Anthropic宣布达成重要合作伙伴关系，将人工智能代理直接嵌入企业数据环境，使企业能够分析大量信息，同时保持严格的安全控制。两家公司将把 Anthropi…

王浩然
2025年2月17日
000
AI前沿

Meta推出Llama 4系列模型，应对DeepSeek挑战‌

Meta公司近日正式发布了其最新的Llama 4系列模型，包括Scout和Maverick两款现可下载使用的模型，以及一款仍在训练中的2万亿参数巨型模型——Behemoth。这一系…

王浩然
9小时前
000
AI前沿

Nvidia 首席执行官吹捧印度在自主 AI 方面取得的进步，并培训了超过 10 万名 AI 开发人员

Nvidia CEO黄仁勋在印度Nvidia AI峰会上表示，印度在AI领域取得了长足进步，目前印度已有2000多家Nvidia Inception AI公司，接受过AI培训的开发…

王浩然
2024年10月25日
000
AI前沿

据报道，谷歌正在开发一种“使用计算机的代理”人工智能系统

据报道，谷歌最早可能在 12 月预览其对 Rabbit 大型动作模型概念的看法。据该媒体采访的三位直接了解该项目的人士称，该项目的代号为“Project Jarvis”，将为用户执…

王浩然
2024年10月29日
000
AI前沿

Canva 希望你为其 AI 功能支付更多费用

Canva 大幅提高了部分客户的价格。对于使用旧定价计划的 Canva Teams 用户，五人计划的价格将上涨 300%，从每年 119.99 美元上涨至每年 500 美元。用户在…

点点
2024年9月8日
000
AI前沿

OpenAI 联合创始人的 Safe Superintelligence Inc 获得 10 亿美元融资

成立仅三个月，由 OpenAI 联合创始人 Ilya Sutskever 创办的 AI 新创公司Safe Superintelligence (SSI) 就已筹集 10 亿美元资金…

点点
2024年9月10日
000
AI前沿

NVIDIA助力推出AI平台，教授美国手语

NVIDIA携手合作伙伴，共同推出了一款创新的AI平台，旨在通过人工智能技术教授美国手语。该平台集成了先进的深度学习算法和高效的图形处理能力，为用户提供了一种直观、互动的学习方式，…

王浩然
2025年2月23日
000
AI前沿

前谷歌CEO泄露AI高级机密，英伟达将引爆“抢购潮”

上个周末，前谷歌CEO 埃里克·施密特在斯坦福大学进行了一场关于如果更智能的重要讲座，在不知道全程直播的情况下泄露了“AI行业的高级机密”，其中就包括了英伟达接下来的重磅利好消息。…

点点
2024年8月21日
000
AI前沿

人工智能有助于缩小公司与客户之间的“信任差距”

沃达丰商业公司发布的一份新报告发现，人工智能可以帮助企业缩小与客户之间的信任差距。大多数受访者认为，精通人工智能的企业更有可能做出准确的预测。与伦敦政治经济学院合作进行的《适应未…

点点
2024年10月8日
000
AI前沿

OpenAI 推出 o3-mini 高级推理模型，对抗 DeepSeek 的崛起

OpenAI 及时发布了新的专有 AI 模型，以对抗开源竞争对手 DeepSeek-R1 的快速崛起——但这足以削弱后者的成功吗？今天，经过几天的谣言和社交媒体上人工智能用户的日…

王浩然
2025年2月2日
000
AI前沿

多式联运 RAG 正在发展，这是开始的最佳方式

随着公司开始尝试多模态检索增强生成 (RAG)，提供多模态嵌入（一种将数据转换为 RAG 可读文件的方法）的公司建议企业在嵌入图像和视频时从小处着手。多模态 RAG 还可以显示…

王浩然
2024年11月11日
000
AI前沿

微软的代理 AI 工具 OmniParser 在开源排行榜上名列前茅

微软的OmniParser正在做一些事情。本月早些时候，雷德蒙德发布了一种新的开源模型，可以将屏幕截图转换为 AI 代理更容易理解的格式，但就在本周，它成为了 AI 代码库 Hu…

王浩然
2024年11月3日
000
AI前沿

Hugging Face 推出用于机器人命令的自然语言 AI 模型

模型使得构建和部署能够执行复杂任务的人工智能机器人变得更加容易。开源代码库Hugging Face推出了一种机器人基础人工智能模型，可将自然语言命令转化为身体动作。该模型名为…

王浩然
2025年2月19日
000
AI前沿

前 Google、Meta 领导人推出 Palona AI，为非技术型企业提供个性化、情感化的客服代理

就我个人而言，与商家网站上的任何人工智能聊天机器人互动通常都是一件令人沮丧的事情。带有机器人声音的电话树通常更糟糕。我敢打赌，我并不是唯一一个有这种想法的人。我们当中谁没有经历过长…

王浩然
2025年2月2日
000
AI前沿

“我们今天在生物 AI 领域所处的位置与 2020 年的 GPT 类似”：对非洲最大 AI 初创公司 CEO 的采访

去年 1 月，德国生物科技公司 BioNTech 以超过 5.5 亿美元的价格收购了非洲人工智能初创公司 Instadeep，该交易于同年 7 月完成。Instadeep 是目前非…

点点
2024年10月13日
000
AI前沿

Zeekr 将使用 Nvidia 超级芯片；向 Waymo 交付自动驾驶出租车：CES 2025

中国高端品牌 Zeekr在CES 上发布了几项重要公告，表明其将成为自动驾驶汽车(AV) 市场中一股不容忽视的力量。首先，该公司确认将推出一款采用 Nvidia Drive…

王浩然
2025年1月12日
000
AI前沿

畅销书作家批评全国小说写作月的人工智能中立立场

全国小说写作月（NaNoWriMo）是一个已有 25 年历史的非营利组织，旨在鼓励任何有兴趣的人每年 11 月创作一本小说。该组织最近宣布将接受使用人工智能 (AI)作为写作过程的…

王浩然
2024年9月5日
000
AI前沿

人工智能活了过来：从调酒师到手术助手再到小狗，未来的机器人正在路上

人形机器人不再是科幻小说中的东西。想象一下这样一个世界：机器人不仅能在工厂与我们合作，还能在商店迎接我们、协助手术并照顾我们所爱的人。特斯拉计划在2026 年部署数千台 Optim…

王浩然
2025年1月20日
000