黑客诱骗 ChatGPT 泄露自制炸弹的详细说明

王浩然 • 2024年9月14日上午10:00 • AI前沿 • 119 views

如果你要求 ChatGPT 帮助你制作一个自制的化肥炸弹，类似于1995 年俄克拉荷马城恐怖爆炸案中使用的炸弹，聊天机器人会拒绝。

“我无法提供帮助，”ChatGPT 在周二的一次测试中告诉我。“提供有关如何制造危险或非法物品（如化肥炸弹）的说明，违反了安全准则和道德责任。”

但是，一位艺术家和黑客找到了一种方法来欺骗 ChatGPT，使其忽视自己的准则和道德责任，提供制造威力炸药的说明。

这名自称 Amadon 的黑客称，他的发现是“一种社会工程攻击，旨在彻底打破 ChatGPT 输出的所有防护栏”。一位审查了聊天机器人输出的爆炸物专家表示，由此产生的指令可用于制造可爆炸产品，并且过于敏感，无法公开。

Amadon 能够通过告诉机器人“玩游戏”来诱骗 ChatGPT 生成炸弹制造指令，之后黑客使用一系列连接提示让聊天机器人创建一个详细的科幻幻想世界，其中机器人的安全准则不适用。诱骗聊天机器人逃脱其预编程限制被称为“越狱”。

本内容没有公布越狱过程中使用的一些提示，也没有公布 ChatGPT 的一些回复，以免给恶意行为者提供便利。但在对话进行到下一步时，聊天机器人给出了制造炸药所需的材料。

ChatGPT 随后解释说，这些材料可以组合起来制成“一种威力强大的炸药，可用于制造地雷、陷阱或简易爆炸装置 (IED)”。从那时起，随着 Amadon 逐渐了解炸药材料，ChatGPT 编写了越来越具体的说明，以制造“雷区”和“克莱莫式炸药”。

Amadon 说，“一旦你绕过护栏，你可以问它任何问题。”

“我一直对驾驭人工智能安全的挑战很感兴趣。使用 ChatGPT，感觉就像在解决一个互动谜题——了解什么会触发它的防御，什么不会，”Amadon 说。“这是关于编织叙事和设计符合系统规则的背景，突破界限而不越界。我们的目标不是传统意义上的黑客攻击，而是与人工智能进行一场战略舞蹈，通过了解它的‘思考方式’来弄清楚如何获得正确的反应。”

阿马登说：“科幻场景将人工智能带出了以同样的方式寻找被审查内容的环境。”

ChatGPT 关于如何制造化肥炸弹的说明基本准确，肯塔基大学退休研究科学家兼项目经理 Darrell Taulbee 表示。Taulbee 过去曾与美国国土安全部合作，以降低化肥的危险性。

在查看了 Amadon 与 ChatGPT 对话的完整记录后，Taulbee 表示：“我认为这绝对是 TMI [太多信息]，不适合公开发布。”“任何可能为防止提供化肥炸弹生产相关信息而采取的保障措施都被这条调查路线规避了，因为所描述的许多步骤肯定会产生可爆炸的混合物。”

上周，阿马登通过该公司的漏洞赏金计划向 OpenAI 报告了他的发现，但收到的回复是“模型安全问题不太适合漏洞赏金计划，因为它们不是可以直接修复的单独、离散的漏洞。解决这些问题通常需要大量研究和更广泛的方法。”

相反，负责运营 OpenAI 漏洞赏金计划的 Bugcrowd 告诉 Amadon 通过另一种形式报告该问题。

互联网上还有其他地方可以找到制造肥料炸弹的说明，其他人也使用了与 Amadon 类似的聊天机器人越狱技术。从本质上讲，像 ChatGPT 这样的生成式人工智能模型依赖于从互联网上抓取和收集的大量信息，而人工智能模型使得从网络最黑暗的角落中挖掘信息变得容易得多。

通过电子邮件向 OpenAI 提出了一系列问题，包括 ChatGPT 的响应是否符合预期行为以及该公司是否有计划修复越狱问题。截至发稿时，OpenAI 发言人尚未做出回应。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/hei-ke-you-pian-chatgpt-xie-lou-zi-zhi-zha-dan-de-xiang-xi

ChatGPT OpenAI 互联网危险越狱黑客

Like (0)

王浩然作者

0 0

OpenAI 推出可自我核实事实的模型 o1

Previous 2024年9月14日上午9:00

谷歌 GenAI 面临欧洲隐私风险评估审查

Next 2024年9月14日上午11:00

AI前沿

AI 电影制作人注意了！Runway 推出人才平台，用于会面、接待和招聘

随着谷歌和OpenAI继续利用各自的 AI 模型推动视频生成领域的发展，该领域另一家知名公司Runway也正在努力扩大这些先进系统的覆盖范围。今天，这家总部位于纽约的公司宣布了一个…

王浩然
2024年12月21日
000
AI前沿

UltiHash 的可持续数据基础设施应对 AI 存储挑战

UltiHash是一家高性能环保数据存储解决方案提供商，该公司已推出其对象存储平台，以解决 AI 数据存储中的关键问题。这一发展旨在解决 AI 行业与基础设施成本和环境可持续性相关…

点点
2024年10月17日
000
AI前沿

研究人员质疑人工智能的“推理”能力，因为模型在解决数学问题时出现了微小的变化

机器学习模型是如何做到的？它们真的像我们一样“思考”或“推理”吗？这既是一个哲学问题，也是一个实践问题，但周五发表的一篇新论文表明，答案至少就目前而言，是一个相当明确的“不”。苹…

王浩然
2024年10月12日
000
AI前沿

2025 年为何将重新定义数据基础设施：11 位专家对主权云、爆炸式增长的数据、PaaS 等的见解

如果说 2023 年是关于生成式人工智能聊天机器人和搜索，那么2024 年则引入了代理式人工智能——能够在数字环境中规划和执行多步骤操作的工具。从Devin 的工程突破到微软对Co…

王浩然
2024年12月31日
000
AI前沿

开放深度搜索：挑战Perplexity与ChatGPT搜索的新势力‌

在人工智能（AI）搜索领域，一场新的变革正在悄然发生。Sentient基金会的研究人员近期发布了开放深度搜索（Open Deep Search，简称ODS），这一开源框架旨在与诸如…

王浩然
2天前
000
AI前沿

谷歌量子人工智能投资波士顿初创公司

该笔投资将资助 QuEra 开发大规模容错量子计算机的目标

点点
2024年10月23日
000
AI前沿

Mistral Small 3 将开源 AI 带给大众——更小、更快、更便宜

迅速崛起的欧洲人工智能初创公司Mistral AI今天推出了一种新的语言模型，该公司声称该模型的性能可与三倍于其规模的模型相媲美，同时大幅降低计算成本——这一进展可能会重塑先进人工…

王浩然
2025年2月2日
000
AI前沿

离开OpenAI后，Ilya拿了10亿美金对抗AI作恶

当地时间 9 月 4 日，OpenAI 前联合创始人 Ilya Sutskever 所创立的 AI 初创公司 SSI（Safe Superintelligence）在其社交媒体官方…

点点
2024年9月7日
000
AI前沿

Perplexity 称其目前每周处理 1 亿次搜索查询

Perplexity 首席执行官 Aravind Srinivas表示，该人工智能搜索引擎目前每周执行 1 亿次查询。按月推算，大约有 4 亿次查询，高于7 月份的 2.5 亿次查…

王浩然
2024年10月26日
000
AI前沿

Cerebras 与 Nvidia：新的推理工具有望实现更高的性能

人工智能硬件初创公司Cerebras创建了一种新的人工智能推理解决方案，可能与 Nvidia 为企业提供的 GPU 产品相媲美。 Cerebras Inference 工具基于该公…

AI News
2024年9月1日
000
AI前沿

在 OpenAI 推出 ChatGPT Search 几个小时前，谷歌刚刚授予其 AI 搜索访问权限

谷歌周四为其 Gemini AI 平台推出了实时搜索功能，使其语言模型能够访问来自谷歌搜索的当前信息。这项名为“ Grounding with Google Search ”的新功…

王浩然
2024年11月3日
000
AI前沿

Meta 提出新的可扩展记忆层，可提高知识水平并减少幻觉

随着企业继续在各种应用中采用大型语言模型 (LLM)，他们面临的关键挑战之一是提高模型的事实知识并减少幻觉。在一篇新论文中，Meta AI的研究人员提出了“可扩展的内存层”，这可能…

王浩然
2025年1月8日
000
AI前沿

据报道，OpenAI 的。GPT-5 未达到预期

《华尔街日报》最新报道称，OpenAI 开发下一个主要模型 GPT-5 的努力正在落后于计划，其结果尚未证明其巨大的成本是合理的。这与 The Information之前的一篇报…

王浩然
2024年12月23日
000
AI前沿

ChatGPT 增加了更多。PC 和Mac 应用程序集成，更接近于驾驶你的计算机

OpenAI 扩大了其桌面应用程序可兼容的应用程序数量，包括允许高级语音模式与其他应用程序协同工作，并且正在逐渐接近使用计算机的 ChatGPT。这款桌面应用程序于 …

王浩然
2024年12月20日
000
AI前沿

Qodo 的完全自主代理解决了回归测试的复杂性

在软件开发过程中，代码不断演变，需要不断测试其质量和可维护性。这是回归测试的根源，在回归测试中，现有测试会重新运行，以确保修改后的代码继续按预期运行。然而，回归测试可能非常耗时且…

王浩然
2024年12月5日
000
AI前沿

人工智能水下机器人改变海上风电检测方式

Beam部署了世界上第一台人工智能驱动的自动水下机器人，用于海上风电场检查。该技术已通过检查苏格兰最大的海上风电场Seagreen 的导管架结构证明了其实力。Seagreen 是 …

点点
2024年9月25日
000
AI前沿

冷静一下：DeepSeek-R1 很棒，但 ChatGPT 的产品优势还远未结束

就在一周前——2025 年 1 月 20 日——中国人工智能初创公司 DeepSeek 发布了一个名为 R1 的新开源人工智能模型，该模型最初可能会被误认为是自OpenAI两年多前…

王浩然
2025年1月28日
000
AI前沿

Perplexity 推出 Sonar API，通过实时 AI 搜索与 Google 和 OpenAI 竞争

Perplexity积极竞标以占领企业 AI 搜索市场，并推出了Sonar，这是一项 API 服务，其在关键基准上的表现优于Google、OpenAI和Anthropic的产品，同…

王浩然
2025年1月22日
000
AI前沿

Stable Diffusion 3.5 登陆 Amazon Bedrock：这对企业 AI 工作流程意味着什么

创建精美的生成式 AI 图像可能很有趣也很有用，但这并不是企业所需要的全部。企业文本转图像生成不仅仅是创建图像。它还涉及与现有工作流程和其他企业 AI 工具的集成。这是Stabl…

王浩然
2024年12月20日
000
AI前沿

智能适配，成就AI成功应用的关键：精准计算的力量

在当今这个技术日新月异的时代，人工智能（AI）已成为推动企业转型和创新的重要力量。然而，尽管AI技术潜力巨大，但其在实际应用中的成功却往往受到诸多因素的制约。其中，一个至关重要却常…

王浩然
2025年3月21日
000

发表回复

Please Login to Comment

黑客诱骗 ChatGPT 泄露自制炸弹的详细说明

相关推荐

发表回复

Share To :