今天,作为首席执行官黄仁勋 (Jensen Huang)在CES 2025开幕主题演讲的一部分, Nvidia推出了可分析视频的 AI 代理蓝图。
由 Metropolis 提供支持的全新 Nvidia AI 蓝图可让组织和个人提高生产力和安全性,甚至可以帮助 Nvidia 的首席执行官提高他的快球投球水平。
人工智能的下一个重大时刻即将到来——确实如此。
如今,全球部署了超过 15 亿台企业级摄像头,每年生成约 7 万亿小时的视频。然而,只有一小部分视频得到了分析。
据估计,只有不到 1% 的工业摄像机视频被人类实时观看,这意味着关键的操作事件可能在很大程度上被忽视。
但这需要付出高昂的代价。例如,制造商每年因产品质量低劣或缺陷而损失数万亿美元,而如果使用能够感知、分析并帮助人类采取行动的人工智能代理,他们本可以更早地发现甚至预测到这些缺陷。
具有内置视觉感知功能的交互式人工智能代理可以充当始终在线的视频分析师,帮助工厂更高效地运行、增强工人安全、跟踪一切是否顺利进行,甚至提高运动员的比赛水平。
为了加速此类代理的创建,Nvidia 今天宣布提前获得 Nvidia AI 视频搜索和摘要蓝图的新版本。该蓝图建立在 Nvidia Metropolis 平台之上,现在由 Nvidia Cosmos Nemotron 视觉语言模型 (VLM)、Nvidia Llama Nemotron 大型语言模型 (LLM) 和 Nvidia NeMo Retriever 提供支持,为开发人员提供了构建和部署可分析大量视频和图像内容的 AI 代理的工具。
该蓝图集成了 Nvidia AI Enterprise 软件平台(包括用于 VLM、LLM 的 Nvidia NIM 微服务以及用于检索增强生成的高级 AI 框架),以实现比实时观看快 30 倍的批量视频处理速度。
该蓝图包含多种代理 AI 功能,例如思路链推理、任务规划和工具调用,可帮助开发人员简化强大而多样的视觉代理的创建,以解决一系列问题。
具有视频分析能力的人工智能代理可以与具有不同技能的代理相结合,以实现更加复杂的代理人工智能服务。
企业可以灵活地从边缘到云端构建和部署他们的 AI 代理。
视频分析 AI 代理如何帮助工业企业
具有视觉感知和分析技能的人工智能代理可以通过以下方式进行微调,帮助企业进行工业运营:
● 提高生产力并减少浪费:代理可以帮助确保
在产品组装等复杂的工业流程中遵循标准操作程序
。它们还可以进行微调,以仔细
观察和理解细微的动作及其执行顺序
。
● 通过更好地利用空间来提高资产管理效率:
代理可以通过执行 3D
体积估算和集中了解各种摄像机
流来帮助优化仓库中的库存存储。
● 通过自动生成事故报告和
摘要来提高安全性:代理可以处理大量视频并将其总结为具有上下文信息的事故报告。它们还可以帮助确保
工厂遵守个人防护设备规定,从而提高
工业环境中工人的安全性。
● 预防事故和生产问题:无论是在仓库、工厂、机场,还是在十字路口或其他市政环境中,人工智能代理可以识别
非典型活动,以快速减轻运营和安全风险。
● 从过去学习:代理可以搜索
过去的操作视频档案和相关信息,并使用它来解决问题或创建新流程。
体育、娱乐等行业的视频分析师
视频分析 AI 代理可以大展身手的另一个行业是体育——这个全球市场规模达 5000 亿美元,预计未来几年将增长数千亿美元。
教练、球队和联盟(无论是职业还是业余)都依赖视频分析来评估和提高球员的表现,优先考虑安全性,并通过球员分析平台和数据可视化来提高球迷的参与度。借助具有视觉感知能力的 AI 代理,运动员现在可以获得前所未有的更深入的见解和改进机会。
在 CES 开幕主题演讲中,Nvidia 的黄仁勋演示了一款 AI 视频分析代理,该代理可以评估业余棒球运动员与专业棒球运动员的快球投球技巧。
该视频分析 AI 代理利用黄仁勋为旧金山巨人棒球队投出仪式性第一球的视频,提出了需要改进的地方。
价值 3 万亿美元的媒体和娱乐行业也将受益于视频分析 AI 代理。通过 Nvidia Media2 计划,这些代理将有助于推动创建更智能、更具定制化、更具影响力的内容,以适应个人观众的偏好。
全球采用和可用性
来自世界各地的合作伙伴正在将构建用于视频分析的 AI 代理的蓝图整合到他们自己的开发人员工作流程中,其中包括埃森哲、印孚瑟斯、Linker Vision、和硕、塔塔咨询服务公司 (TCS)、Telit Cinterion 和 VAST。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/nvidia-fa-bu-le-ke-fen-xi-shi-pin-de-ai-dai-li-lan-tu