谷歌云安全主管警告：网络防御必须不断发展以应对人工智能滥用

王浩然 • 2024年11月3日下午8:00 • AI前沿 • 84 views

虽然许多现有的风险和控制可以应用于生成人工智能，但这项突破性的技术也有许多细微差别，需要新的策略。

模型容易产生幻觉或产生不准确的内容。其他风险包括通过模型输出泄露敏感数据、模型被污染，从而允许迅速操纵和由于训练数据选择不当或微调和训练控制不足而产生偏差。

谷歌云首席信息安全官 Phil Venables 表示，最终，传统的网络检测和响应需要扩展以监控人工智能的滥用，而人工智能则应该反过来用于防御优势。

维纳布尔斯在最近举行的云安全联盟全球人工智能研讨会的一次虚拟会议上指出：“人工智能的安全、可靠和可信使用涵盖了许多团队过去从未整合过的一系列技术。”

Google Cloud 的经验教训

维纳布尔斯强调提供控制和通用框架的重要性，以便每个人工智能实例或部署不会从头开始。

他说道：“请记住，问题是一个端到端的业务流程或任务目标，而不仅仅是环境中的技术问题。”

现在几乎每个人都已经了解了滥用训练数据和微调数据所带来的诸多风险。“降低数据中毒风险至关重要，确保数据适合其他风险也同样重要，”Venables 说道。

重要的是，企业应确保用于训练和调整的数据得到清理和保护，并且数据的谱系或来源保持“强完整性”。

“现在，显然你不能只是希望这是真的，”维纳布尔斯承认。“你必须实际做些工作来管理和跟踪数据的使用情况。”

这需要实施内置安全性的特定控件和工具，它们共同作用以提供模型训练、微调和测试。Venables 指出，这对于确保模型不被篡改（无论是软件、权重还是任何其他参数）尤为重要。

他说：“如果我们不注意这一点，我们就会面临多种不同类型的后门风险，这些风险可能会危及已部署的业务或任务流程的安全性。”

过滤以防止即时注入

另一个大问题是外部人员滥用模型。Venables表示，模型可能会通过训练数据或其他参数受到污染，从而导致其行为违反更广泛的控制。这可能包括即时操纵和颠覆等对抗性策略。

维纳布尔斯指出，有很多例子表明，人们在“天真防御或完全不受保护的模型”面前，直接或间接地操纵提示，导致意想不到的结果。

这可能是嵌入在图像中的文本，或单模或多模模型中的其他输入，其中有问题的提示“扰乱输出”。

维纳布尔斯说：“很多引人注目的新闻都是由不安全的内容生成引发的，其中一些可能相当有趣。”

他说，确保输入经过一系列信任、安全和保障目标的过滤非常重要。这应该包括“普遍日志记录”和可观察性，以及对模型、代码、数据和测试数据维护的强大访问控制。

“测试数据可以以有趣且具有潜在风险的方式影响模型行为，”维纳布尔斯说。

控制输出

Venables 指出，用户让模型出现问题表明不仅需要管理输入，还需要管理输出。企业可以围绕模型如何操纵数据或启动物理过程创建过滤器和出站控制（或“断路器”）。

“这不仅仅是对抗驱动的行为，也是偶然的模范行为，”维纳布尔斯说。

Venables 建议，组织应监控并解决支持基础设施本身的软件漏洞。端到端平台可以控制数据和软件生命周期，并帮助管理 AI 集成到业务和任务关键型流程和应用程序中的运营风险。

“归根结底，这是为了减轻模型输出操作的操作风险，本质上是为了控制代理行为，为意外行动提供防御深度，”维纳布尔斯说。

他建议对所有 AI 应用程序进行沙盒化和强制执行最低权限。应通过独立监控 API 过滤器或构造来管理和保护模型，并对其进行严格屏蔽，以验证和规范行为。应用程序还应在锁定负载下运行，企业需要关注可观察性和日志记录操作。

最终，“一切都是为了清理、保护和管理您的训练、调整和测试数据。这是为了对模型、数据、软件和部署的基础设施实施强大的访问控制。这是为了过滤这些模型的输入和输出，最后确保您在某些提供纵深防御的风险和控制框架中对更多使用和应用程序进行沙盒处理。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/gu-ge-yun-an-quan-zhu-guan-jing-gao-wang-luo-fang-yu-bi-xu

Google Cloud 生成人工智能谷歌

Like (0)

王浩然作者

0 0

在 OpenAI 推出 ChatGPT Search 几个小时前，谷歌刚刚授予其 AI 搜索访问权限

Previous 2024年11月3日

伟大的人工智能伪装：当自动化穿上特工服装时

Next 2024年11月3日

AI前沿

微软的全新Magnetic-One 系统可指挥多个 AI 代理完成用户任务

希望部署多个 AI 代理的企业通常需要实施一个框架来管理它们。为此，微软研究人员最近推出了一种名为Magnetic-One 的新型多智能体基础设施，该基础设施允许单个 AI 模…

王浩然
2024年11月6日
000
AI前沿

投资者争相入股 ElevenLabs，该公司估值或很快达到 30 亿美元

据悉，专门为音频应用开发 AI 工具的初创公司 ElevenLabs 正在接受现有和新投资者的接洽，商讨新一轮融资事宜，此轮融资可能令该公司的估值高达 30 亿美元。这家成立两…

王浩然
2024年10月6日
000
AI前沿

AI 是否能通过妨碍安全检查来故意破坏用户？可以，但目前做得不太好

人工智能公司声称已经实施了严格的安全检查，以确保模型不会说或做奇怪、非法或不安全的事情。但如果模型能够逃避这些检查，并出于某种原因试图破坏或误导用户，该怎么办？据 Anthropi…

王浩然
2024年10月21日
000
AI前沿

谷歌购物标签新增AI工具：根据你的时尚理念推荐相似服饰‌

在追求个性化时尚的道路上，谷歌近日为其购物标签（Shopping Tab）增添了一位得力助手——一款创新的AI工具。这款工具能够捕捉你的时尚灵感，并将其转化为具体的服饰推荐，让你的…

王浩然
2025年3月8日
000
AI前沿

Scope3 开始追踪人工智能的碳足迹

是香蕉起了作用。布莱恩·奥凯利 (Brian O’Kelley) 最近以 16 亿美元的价格将他之前的创业公司广告平台 AppNexus 卖给了 AT&T。在…

王浩然
2024年10月12日
000
AI前沿

GPT-4o：OpenAI推出原生图像生成功能，惊艳用户

引言‌ 自OpenAI在2024年5月发布其首款“全能”或多模态模型GPT-4o以来，近一年的时间里，这款模型始终保持着强大的竞争力。而今，OpenAI再次为ChatGPT的Plu…

王浩然
2025年3月27日
000
AI前沿

人类新视野：Anthropic科学家揭示AI的“思考”方式，发现其秘密规划并偶尔说谎‌

在人工智能领域，科学家们一直致力于探索和理解大型语言模型（LLMs）如何处理信息并做出决策。近日，Anthropic公司的一项新研究为我们揭示了这些AI系统内部工作的惊人细节，发现…

王浩然
2025年3月31日
000
AI前沿

史上最大的一笔风险投资，跌跌撞撞的来了

如果只从资本层面计较利弊的话，那OpenAI依然是最火的人工智能大模型超级独角兽，没有之一。 8月底，各大财经媒体纷纷爆料人工智能的头号玩家OpenAI即将完成最新一轮融资，本轮的…

点点
2024年10月7日
000
AI前沿

今年的智能手机不只具备人工智能

苹果周一发布了iPhone 16 系列，最大的卖点是 Apple Intelligence。苹果的设备内置 AI 系统提供了一些炫酷的功能，比如重写电子邮件、生成自定义表情符号以及…

王浩然
2024年9月14日
000
AI前沿

OpenAI 将 o1 AI 模型扩展到企业和教育领域，与Anthropic直接竞争

发布 o1 AI 模型后，OpenAI 引入了「Self-Play」训练方法，让模型与自身不同版本进行对话和推理。为了提升用户体验，OpenAI 又于近日重磅推出了o1-previ…

点点
2024年9月22日
000
AI前沿

“Studio Ghibli” 风格 AI 图像趋势席卷 OpenAI 新 GPT-4o 功能，导致免费版上线延迟

在人工智能界，一股新的潮流正悄然兴起，它以Studio Ghibli的AI图像为灵感，迅速席卷了整个行业，甚至对OpenAI新推出的GPT-4o功能产生了不小的影响，导致其免费层级…

王浩然
2025年3月29日
000
AI前沿

2纳米，台积电又赢了

英特尔工艺遇挫，三星撬不动客户。

点点
2024年9月6日
000
AI前沿

伊隆马斯克的 X 正在改变其隐私政策，允许第三方在你的帖子上训练人工智能

周三，社交网络 X（前身为 Twitter）更新了其隐私政策，表明它将允许第三方“合作者”使用 X 数据训练他们的 AI 模型，除非用户选择退出。虽然 X 所有者埃隆·马斯克使用 …

点点
2024年10月18日
000
AI前沿

Meta 为其下一代Orion AR 眼镜开发了“神经接口”

在Meta Connect 2024 大会上，首席执行官马克·扎克伯格表示，公司正在开发一种“神经接口”，可用于控制其原型Orion AR 眼镜。该界面似乎受到CTRL-labs…

王浩然
2024年9月27日
000
AI前沿

研究发现法学硕士可以识别自己的错误

大型语言模型 (LLM) 的一个众所周知的问题是它们倾向于生成不正确或无意义的输出，通常被称为“幻觉”。虽然许多研究都集中于从用户的角度分析这些错误，但由以色列理工学院、谷歌研究院…

王浩然
2024年11月1日
000
AI前沿

人工智能中的幻觉：葛兰素史克如何解决药物开发中的关键问题

生成式人工智能已成为许多行业的关键基础设施，医疗保健也不例外。然而，随着葛兰素史克等组织不断突破生成式人工智能所能实现的界限，它们面临着重大挑战——尤其是在可靠性方面。幻觉，即人工…

王浩然
2025年1月15日
000
AI前沿

人工智能为组织转型的挑战带来了全新的维度生成式人工智能的快速工程

首先，改变对每个人来说都很难。对于大型组织来说，大规模改变就更难了。过去 15 年来，我们看到许多大型组织试图拥抱移动、大数据、云和一般数字化转型，其中许多组织在实施这些技术时一次…

王浩然
2024年9月1日
000
AI前沿

人工智能编排：创造和谐还是创造依赖？

随着人工智能工具越来越多地融入我们的日常生活，我们面临一个关键问题：我们是在利用它们的力量来增强我们的能力，还是在慢慢地外包我们的思想——或者两者兼而有之？作为 DALL-E、C…

王浩然
2024年9月9日
000
AI前沿

小型 AI 模型需求激增，阿联酋猎鹰 3 号向开源领导者发起挑战

阿联酋政府支持的技术创新研究所(TII) 宣布推出 Falcon 3，这是一系列开源小型语言模型 (SLM)，旨在在轻量级、基于单 GPU 的基础设施上高效运行。 Falcon 3…

王浩然
2024年12月18日
000
AI前沿

Google发布开源Gemma 3模型：128K上下文窗口引领新潮流

在人工智能领域，大型语言模型（LLMs）一直以其强大的语言理解和生成能力吸引着广泛关注。然而，随着对能源效率和成本效益的关注日益增加，小型语言模型（SLMs）逐渐崭露头角，成为替代…

王浩然
2025年3月16日
000