一种新的代理可靠性方法：AgentSpec强制代理遵循规则

王浩然 • 2025年3月31日下午8:00 • AI前沿 • 68 views

在人工智能领域，随着AI代理（Agent）在企业流程和自动驾驶等应用中的日益普及，其安全性和可靠性问题也日益凸显。AI代理在执行任务时可能会采取意外行动，缺乏灵活性且难以控制，这给企业带来了潜在的风险。为了应对这一挑战，新加坡管理大学（SMU）的研究人员提出了一种名为AgentSpec的新方法，旨在通过强制代理遵循规则来提高其可靠性。

AgentSpec：定义结构化规则的新框架

AgentSpec是一种领域特定的框架，它允许用户定义包含触发器、谓词和执行机制的结构化规则。这些规则旨在确保代理在执行任务时始终在用户设定的参数范围内运行。研究人员表示，AgentSpec不仅适用于企业环境中的代理，还可用于自动驾驶等应用场景。

AgentSpec并非一个全新的大型语言模型（LLM），而是用于指导基于LLM的AI代理的一种方法。它通过拦截代理在执行任务时的行为，并添加人类设定或由提示生成的安全规则，从而确保代理的合规性。这种方法在实验中被证明非常有效，能够防止超过90%的不安全代码执行，确保自动驾驶中的法律合规性，消除实体代理任务中的危险行为，并且仅产生毫秒级的开销。

现有方法的不足与AgentSpec的优势

在AgentSpec出现之前，已经存在一些帮助开发人员提高代理可靠性和控制力的方法，如ToolEmu和GuardAgent等。然而，这些方法在识别风险方面虽有一定效果，但缺乏可解释性，且没有提供安全执行机制，因此容易受到对抗性操纵的影响。

相比之下，AgentSpec具有显著的优势。它不仅能够识别潜在的风险行为，还能够通过预设的规则来阻止这些行为的发生。此外，AgentSpec还支持自定义规则，使得用户可以根据实际需求来设定代理的行为边界。这种灵活性使得AgentSpec能够适应不同的应用场景和任务需求。

AgentSpec的工作原理与应用前景

AgentSpec的工作原理可以概括为三个步骤：定义规则、拦截行为和执行规则。首先，用户需要定义一组规则，包括触发器、谓词和执行机制。然后，当代理执行任务时，AgentSpec会拦截其行为，并根据预设的规则进行评估。如果代理的行为违反了规则，AgentSpec将执行相应的措施来阻止或纠正该行为。

AgentSpec的应用前景非常广阔。在企业环境中，它可以帮助确保代理在执行自动化任务时的合规性和安全性。在自动驾驶领域，AgentSpec可以防止车辆违反交通规则或采取危险行为。此外，随着AI代理在医疗、金融等领域的广泛应用，AgentSpec也将为这些领域提供强有力的支持。

结语：提高AI代理可靠性的重要一步

AgentSpec的出现为提高AI代理的可靠性迈出了重要的一步。通过强制代理遵循预设的规则，AgentSpec能够有效地减少意外行为的发生，提高代理的安全性和可控性。随着AI技术的不断发展，我们有理由相信，AgentSpec将在未来发挥越来越重要的作用，为AI代理的广泛应用提供有力的保障。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/yi-zhong-xin-de-dai-li-ke-kao-xing-fang-fa-agentspec-qiang

AgentSpec AI代理企业环境医疗可解释性可靠性安全性对抗性操纵自动化任务自动驾驶规则金融

Like (0)

王浩然作者

0 0

大型语言模型中的灾难性过度训练：研究人员的警告

Previous 2025年3月31日

超越基准：Gemini 2.5 Pro或成最强推理模型

Next 2025年3月31日

AI前沿

谷歌绘制人工智能代理的未来：给企业的五大教训

谷歌新发布的一份名为《代理》的白皮书设想了未来人工智能将在商业领域扮演更积极、更独立的角色。这份长达 42 页的文件于 9 月悄然发布，目前已在 X.com（原 Twitter）和…

王浩然
2025年1月7日
000
AI前沿

IBM 希望凭借其新的开源 Granite 3.1 模型成为企业 LLM 之王

IBM 今天发布了新的 Granite 3.1 系列，从而巩固了其在开源 AI 排行榜上的领先地位。 Granite 3.1大型语言模型(LLM) 为企业用户提供了 128K 标记…

王浩然
2024年12月22日
000
AI前沿

Box 继续拓展数据共享以外的业务，推出代理驱动的企业 AI 工作室和无代码应用程序

对于许多企业来说，Box是一个知名的文件共享和数据协作应用程序。尤其是过去一年，Box 凭借其在生成式 AI 方面的努力，取得了长足进步。如今，这些努力正通过技术获得巨大推动，…

王浩然
2024年11月13日
000
AI前沿

Gemini 现在可以判断你的手机屏幕上是否有 PDF

据Android Police报道，在最新版本的 Files by Google 应用中，在查看 PDF 时召唤 Gemini 可让你选择询问文件。不过，据 Mishaal Rah…

王浩然
2024年12月28日
000
AI前沿

苹果两颗自研芯片，将发布

苹果或自研Wi-Fi及5G芯片，减少对供应商依赖。据台湾行业刊物《电子时报》报道，传闻苹果自主研发的 Wi-Fi 芯片可能最早于明年在设备中首次亮相。报道援引苹果供应链内部人士…

点点
2024年9月20日
000
AI前沿

让董事会接受 GRC – 尤其是随着 AI 的采用不断增加

随着法规的增多和新技术的融合，治理、风险和合规 (GRC) 功能对于当今企业的健康、财务和安全而言正变得越来越重要。然而，GRC 需要支持才能很好地完成工作，而这需要自上而下的支持…

点点
2024年9月12日
000
AI前沿

利用人类注意力可以改善人工智能生成的图像

来自中国的一项新研究提出了一种提高稳定扩散等潜在扩散模型（LDM）生成的图像质量的方法。该方法专注于优化图像的显著区域——最有可能吸引人类注意力的区域。新研究发现，显著性图（左…

点点
2024年10月17日
000
AI前沿

人工智能悖论：未来的尖端工具如何成为危险的网络威胁（以及需要做好哪些准备）

人工智能正在改变企业的运营方式。虽然这种转变在很大程度上是积极的，但它也带来了一些独特的网络安全问题。像agentic AI这样的下一代人工智能应用对组织的安全态势构成了特别值得注…

王浩然
2025年2月4日
000
AI前沿

《纽约时报》就人工智能向 Perplexity 发出停止侵权通知函

据《华尔街日报》报道，该报称该公司未经许可使用其文章

点点
2024年10月23日
000
AI前沿

Black Forest Labs 发布 Flux 1.1 Pro 和 API

Black Forest Labs (BFL)是一家初创公司，由流行的 Stable Diffusion AI 图像生成模型的创建者创立，该模型是许多 AI 图像生成应用程序和服务…

王浩然
2024年10月7日
000
AI前沿

为了安全起见，我们必须停止接听电话

您如何知道电话另一端的人确实是他们所说的那个人？ 7 月初，法拉利的一位高管收到了大量 WhatsApp 消息，这些消息似乎来自他的老板——法拉利汽车公司的首席执行官贝…

点点
2024年9月8日
000
AI前沿

“这是一个游戏规则的改变者”：Runway 发布新的 AI 面部表情动作捕捉功能 Act-One

自2022 年底首批模型首次亮相以来，人工智能视频在过去几年中取得了令人难以置信的进步，其真实感、分辨率、保真度、提示依从性（与用户输入的文本提示或视频描述的匹配程度）和数量都有所…

王浩然
2024年10月25日
000
AI前沿

利用云加速您的 AI 创新

专为人工智能打造的综合云平台可以提供强大的计算资源、先进的人工智能工具和内置的安全性概览 AI 不仅仅是未来——它现在就在这里，推动着各个行业的转型。然而，许多企业在实施 AI …

王浩然
2025年2月21日
000
AI前沿

微软将在德国面临更严格的竞争审查，包括其对人工智能的使用

微软已加入受德国特殊滥用控制制度约束的科技巨头专属俱乐部。德国联邦企业联合办公室 (FCO) 周一证实，如果竞争管理机构认为有必要进行干预，这家软件巨头可能会受到限制。这项为期五…

王浩然
2024年10月1日
000
AI前沿

Meta 向研究人员开放其 MobileLLM，并发布完整权重

Meta AI 宣布开源MobileLLM，这是一套针对移动设备优化的语言模型，其模型检查点和代码现已在 Hugging Face 上提供。不过，目前它仅在 Creative Co…

王浩然
2024年11月3日
000
AI前沿

Meta 的 Llama AI 模型现在也支持图像

本杰明·富兰克林曾经写道，除了死亡和税收，没有什么是确定的。让我修改一下这句话，以反映当前的人工智能淘金热：除了死亡、税收和新的人工智能模型，没有什么是确定的，其中最后一种模式正在…

王浩然
2024年9月29日
000
AI前沿

Sakana AI 的 CycleQD 优于多技能语言模型的传统微调方法

Sakana AI的研究人员开发了一种资源高效的框架，可以创建数百种专门用于不同任务的语言模型。该技术称为CycleQD，它使用进化算法来结合不同模型的技能，而无需昂贵且缓慢的训练…

王浩然
2024年12月7日
000
AI前沿

毫秒级突破：补丁自动化如何堵住攻击者的最快漏洞

在当今的数字世界中，拖延打补丁已成为导致网络崩溃和公司受损的主要原因，其危害甚至超过了零日漏洞利用或高级网络攻击。忽视补丁管理，就如同敞开了网络的大门，让攻击者轻易得逞。无论是数据…

王浩然
2025年2月23日
000
AI前沿

AWS 推出计划帮助客户开始使用量子技术

AWS推出了 Quantum Embark，这是一项无术语的咨询服务计划，旨在帮助组织探索量子计算如何支持他们的业务。它由三个模块组成，旨在鼓励客户从最关键和计算密集型的用例开始…

王浩然
2024年12月3日
000
AI前沿

蒂姆·库克的其他工作

今年 5 月，苹果首席执行官蒂姆·库克 (Tim Cook) 在一次活动上发布最新款 iPad 时，穿了一双定制的、独一无二的耐克运动鞋，鞋上的装饰针脚上印有“Made on iP…

王浩然
2024年10月23日
000