Microsoft Copilot 现在可以读取你的屏幕、深入思考并大声向你说话

Microsoft Copilot 现在可以读取你的屏幕、深入思考并大声向你说话

在宣布对其由 AI 驱动的产品企业套件Copilot进行一系列更新一周后,微软Windows 上为所有用户推出了新的 Copilot 功能,其中包括一个可以理解并回答屏幕内容问题的工具。

适用于 iOSAndroid、Windows 和 Web 的全新 Copilot 应用今日推出,所有应用均采用微软所描述的更“温暖”和“独特”风格的 Copilot。微软还将聊天机器人引入 WhatsApp,让用户通过 DM 与 Copilot 聊天,类似于您在 Meta 消息平台上使用其他机器人的体验。

副驾驶视野

Copilot Vision 可以查看您在 PC 上查看的内容 — 更具体地说,可以查看您使用 Microsoft Edge 访问的网站。Copilot Vision 受 Copilot Labs 的保护,Copilot Labs 是针对实验性 Copilot 功能的新Copilot Pro独家选择加入计划,可以分析网页上的文本和图像并回答有关它们的问题(例如,“这张图片中食物的食谱是什么?”)。

Vision 可以通过在 Edge 的地址栏中输入“@copilot”来调用,它并不是什么技术奇迹。Google在 Android 上提供了类似的搜索技术,最近还将该技术的某些部分引入了 Chrome。

但微软表示,Copilot Vision 比之前的屏幕分析功能更强大,也更注重隐私。

微软在与 TechCrunch 分享的博客文章中写道:“Copilot Vision 可以……建议下一步行动、回答问题、帮助导航您想要做的事情,并协助完成任务,而您只需用自然语言与它对话即可。”“想象一下,您正在布置一间新公寓。Copilot Vision 可以帮助您搜索家具、找到合适的调色板、考虑从地毯到毯子等所有物品的选择,甚至建议您如何布置正在看的东西。”

Microsoft Copilot 现在可以读取你的屏幕、深入思考并大声向你说话

微软无疑急于避免因人工智能隐私失误而再次招致负面报道,因此强调 Copilot Vision 的设计目的是在对话后立即删除数据。该公司声称,处理过的音频、图像或文本不会被存储或用于训练模型——至少在这个预览版本中不会。

Copilot Vision 能够解析的网站类型也受到限制。目前,微软阻止该功能处理付费墙和“敏感”内容,将 Vision 限制在预先批准的“热门”网站列表中。

“敏感”内容到底指什么?色情?暴力?目前微软还未透露。

最近,微软因使用人工智能工具绕过付费墙而陷入法律纠纷。在一场正在进行的诉讼中,《纽约时报》指控微软允许用户通过Bing 上的 Copilot 聊天机器人提供《纽约时报》文章,从而绕过付费墙。据《纽约时报》报道,当以某种方式提示时,Copilot(由微软的密切合作伙伴 OpenAI 的模型提供支持)会提供付费故事的逐字(或接近逐字)片段。

微软表示,目前仅在美国运营的 Copilot Vision 将尊重网站的“机器可读 AI 控制”——例如禁止机器人抓取用于 AI 训练的数据的规则。但该公司尚未明确说明Vision 将尊重哪些控制;目前有几种控制正在使用中。我们已要求微软澄清。

许多大型出版商选择阻止人工智能工具搜索其网站,不仅是因为他们担心自己的数据会被未经许可使用,也是为了防止这些工具导致其服务器成本飙升。如果目前的趋势持续下去,Copilot Vision 可能无法在某些顶级新闻网站上使用。

微软表示,它致力于“听取反馈”以消除疑虑。

微软在博客文章中表示:“在广泛推出之前,我们将继续……完善我们的安全措施,并将隐私和责任置于我们所做的一切的中心。”“使用 Copilot,不会对您浏览的网站内容进行任何特殊处理,也不会进行任何 AI 训练——Copilot Vision 只是与您一起读取和解释它在页面上第一次看到的图像和文本。”

深入思考

与 Vision 一样,Copilot 的新功能 Think Deeper 也旨在让微软的助手变得更加多功能。

微软表示,Think Deeper 使 Copilot 能够推理更复杂的问题,这要归功于“推理模型”,它需要更多时间才能逐步给出答案。

哪种推理模型?当我问到这个问题时,微软有些谨慎,只说 Think Deeper 使用的是“OpenAI 的最新模型,由微软进行了微调”。从字里行间可以看出,它们是 OpenAI 的o1模型的定制版本。

微软在一篇博文中写道:“我们设计 Think Deeper 是为了帮助解决各种实际的日常挑战,比如并排比较两个复杂的选项。从解决棘手的数学问题到权衡管理家庭项目的成本,Think Deeper 都可以提供帮助。”

微软在其新闻材料中多次谈到了 Think Deeper 的潜力。但假设下面的模型是 o1,它肯定会在某些方面有所不足。我们很想知道微软对基础模型进行了哪些改进,以及 Think Deeper 对其局限性的坦诚程度如何。

Think Deeper 将于今日起向澳大利亚、加拿大、新西兰、美国和英国的 Copilot Labs 有限数量的用户开放

副驾驶的声音

Copilot 的一项新功能是 Copilot Voice(不要与 GitHub 的Copilot Voice混淆)。Voice 首先在新西兰、加拿大、澳大利亚、英国和美国推出英语版本,添加了四种合成声音,让您可以与 Copilot 交谈并让其大声回答。

Microsoft Copilot 现在可以读取你的屏幕、深入思考并大声向你说话

与 OpenAI 为 ChatGPT 提供的高级语音模式一样,Copilot Voice 可以在对话过程中识别你的语气并做出相应的回应,而且你可以在 Copilot Voice 接听时随时插话。微软的一位发言人告诉我,该模式使用“最新的语音技术,以及针对 Copilot 应用进行了微调的新模型”。什么技术?哪种模型?关于具体细节,我们只字未提。

需要注意的是:Copilot Voice 有时间限制。微软告诉我,Copilot Pro 订户可以获得更多通话时间,但数量“可变”,取决于需求。

个性化

微软表示,得益于新的个性化设置,Copilot 很快将变得更加符合您的喜好和偏好。

启用该设置后,Copilot 将利用您过去的交互和历史记录,以及您与其他 Microsoft 应用和服务(Microsoft 不会透露哪些)的交互来推荐使用 Copilot 的方法。

微软在一篇博客文章中写道:“这将帮助你开始使用,既提供了 Copilot 实用功能的便捷指南,也提供了对话的开场白。”

Copilot 中的个性化功能可以在 Windows 的 Copilot 设置菜单中关闭,近期不会在英国或欧盟推出。但其他地方的用户应该会在今天下午开始看到该设置。

微软和欧盟在该公司推出人工智能产品方面的关系一直很紧张。今年 5 月,欧盟警告微软,根据欧盟的在线治理制度《数字服务法案》,该公司可能被处以最高相当于其全球年营业额 1% 的罚款,因为该公司未能回应一份关于其生成式人工智能工具的信息请求。

除了微软之外,包括苹果和Meta在内的许多科技巨头都对在欧盟推出人工智能工具持谨慎态度,担心违反欧盟有关数据隐私和模型部署的法律。

微软发言人表示:“对于欧洲经济区 (EEA) 和少数其他国家/地区的用户,我们正在评估各种选项,然后再为这些用户提供这种级别的 Copilot 个性化服务。”“某些功能要等到晚些时候才会在 EEA 推出。”

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/microsoft-copilot-xian-zai-ke-yi-du-qu-ni-de-ping-mu-shen

Like (0)
王 浩然的头像王 浩然作者
Previous 2024年10月2日 下午6:00
Next 2024年10月2日

相关推荐

发表回复

Please Login to Comment