Microsoft Copilot日益智能化。这家由萨蒂亚·纳德拉 (Satya Nadella) 领导的公司刚刚宣布,其人工智能助手现在具有“视觉”功能,可与用户一起浏览互联网。
虽然该功能于今年 10 月首次公布,但该公司目前正在向部分 Pro 订阅用户预览该功能。据微软称,这些用户将能够在 Edge 浏览器上打开的网页上触发 Copilot Vision,并就屏幕上可见的内容与其进行交互。
该功能仍处于开发的早期阶段,且受到相当大的限制,但一旦全面发展,它可能会成为微软企业客户的游戏规则改变者——帮助他们在与公司生态系统中的产品(OneDrive、Excel、SharePoint 等)交互时进行分析和决策。
从长远来看,看看 Copilot Vision 与更开放、更强大的代理产品(如Anthropic和Emergence AI 的产品)相比如何也是一件有趣的事情,这些产品允许开发人员集成代理来查看、推理和采取行动,跨越来自不同供应商的应用程序。
Copilot Vision 有何用途?
用户打开网站时,他们可能有或可能没有预期目标。但是,当他们这样做时,例如研究学术论文,执行所需任务的过程围绕着浏览网站、阅读其所有内容然后做出判断(例如是否应将网站内容用作论文的参考)。这同样适用于购物等其他日常网络任务。
借助全新的 Copilot Vision 体验,微软旨在让整个过程更加简单。从本质上讲,用户现在拥有一个位于浏览器底部的助手,可以随时调用它来阅读网站内容(涵盖所有文本和图像),并帮助做出决策。
它可以立即扫描、分析并提供所有所需的信息,考虑到用户的预期目标——就像第二双眼睛一样。
该功能具有深远的好处——它可以在短时间内加速您的工作流程——以及重大影响,因为代理正在阅读和评估您正在浏览的内容。但是,微软保证,一旦 Vision 会话关闭,用户共享的所有上下文和信息都会被删除。它还指出,网站的数据不会被捕获/存储以用于训练底层模型。
Copilot 团队在宣布该功能预览的博客文章中写道:“简而言之,我们优先考虑版权、创作者以及用户的隐私和安全,并把他们放在首位。”
根据反馈进行扩展
目前,美国部分已注册 Copilot Labs 抢先体验计划的Copilot Pro 用户将能够在 Edge 浏览器中使用视觉功能。该功能是可选的,这意味着他们不必担心 AI 会一直读取他们的屏幕。
此外,现阶段,该功能仅适用于部分网站。微软表示,它将听取早期用户的反馈,逐步改进功能,同时将支持范围扩大到更多专业用户和其他网站。
从长远来看,该公司甚至可能将这些功能扩展到其生态系统中的其他产品,例如 OneDrive 和 Excel,让企业用户能够更轻松地工作和做出决策。不过,目前尚未得到官方确认。更不用说,鉴于这里暗示的谨慎态度,这可能需要一段时间才能成为现实。
微软推出 Copilot Vision 预览版之际,竞争对手正在推动代理 AI 领域的发展。Salesforce 已在其 Customer 360 产品中 推出 AgentForce ,以实现销售、营销和服务等领域的工作流程自动化。
与此同时,Anthropic 推出了“计算机使用”功能,允许开发人员整合 Claude 与计算机桌面环境进行交互,执行以前只能由人类处理的任务,例如打开应用程序、与界面交互和填写表格。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/microsoft-copilot-vision-xian-yi-tui-chu-rang-ai-neng-gou