思科警告：微调使大型语言模型成为威胁向量‌

王浩然 • 4天前 • AI前沿 • 41 views

随着人工智能技术的飞速发展，大型语言模型（LLMs）在金融、医疗、法律等众多领域展现出了巨大的潜力。然而，思科公司最近发布的一份报告却揭示了这些模型在微调过程中可能带来的巨大安全风险。微调，这一原本旨在提升模型性能的技术手段，正悄然将LLMs转变为潜在的网络威胁。

微调：LLMs的双刃剑

微调是使LLMs适应特定任务或领域的关键步骤。通过调整模型的参数，开发者可以让LLMs更好地理解特定领域的语言习惯和知识背景，从而提升其在该领域的表现。然而，思科的研究发现，微调过程也可能削弱模型的内置安全控制，使其更容易受到攻击。

思科在《AI安全状态报告》中指出，微调后的LLMs产生有害输出的可能性是基础模型的22倍。这一惊人的数字揭示了微调过程中隐藏的巨大风险。一旦模型被恶意微调，就可能被用于自动化侦察、身份冒充、实时检测规避等网络攻击行为，从而加速大规模社会工程学攻击的发生。

武器化LLMs：网络犯罪的新工具

更令人担忧的是，一些不法分子已经开始利用微调技术将LLMs武器化。这些武器化的LLMs被命名为FraudGPT、GhostGPT和DarkGPT等，它们以每月低至75美元的价格在暗网上出售。这些工具被设计用于执行钓鱼、漏洞利用、代码混淆、漏洞扫描和信用卡验证等攻击策略，为网络犯罪提供了前所未有的便利。

网络犯罪团伙、辛迪加甚至国家背景的黑客组织都看到了这些武器化LLMs背后的巨大商机。他们不仅提供平台和工具包，还出租访问权限，使更多攻击者能够轻易获取并利用这些强大的攻击武器。这些LLMs被包装得与合法的SaaS应用程序无异，提供仪表盘、API、定期更新甚至客户支持，进一步降低了攻击门槛。

合法LLMs：面临被攻击的风险

武器化LLMs的迅速传播不仅威胁到了网络安全，还使合法的LLMs陷入了被攻击的风险之中。思科的研究表明，任何LLM，无论其原始用途如何，一旦经过微调，都有可能成为网络攻击的载体。随着微调技术的普及，合法LLMs的安全防线正变得越来越脆弱。

微调带来的安全挑战

微调过程中引入的安全挑战是多方面的。首先，微调会破坏模型的原始对齐性，使其更容易产生与预期不符的输出。在生物医学和法律等高度敏感的领域，这种对齐性的破坏可能带来严重的后果。其次，微调过程中存在数据投毒、基础设施劫持、代理行为误导和训练数据泄露等风险。攻击者可以利用这些漏洞对LLMs进行渗透和控制，从而将其转变为攻击工具。

应对之策：加强AI安全防护

面对微调带来的安全挑战，企业和组织需要采取一系列措施来加强AI安全防护。首先，他们应该对LLMs的整个生命周期进行持续的安全监控和评估，确保模型在微调和使用过程中始终符合安全标准。其次，企业应该采用独立的安全层来保护LLMs免受攻击者的渗透和控制。此外，加强对抗性测试、提升技术栈的流畅性以及实现实时IT资产可见性也是提高AI安全性的重要手段。

结语：LLMs的安全警钟已经敲响

思科的报告为我们敲响了LLMs安全的警钟。在这个AI技术日新月异的时代，我们必须时刻保持警惕，防范微调等技术手段可能带来的安全风险。只有这样，我们才能确保LLMs在为企业和社会带来便利的同时，不会成为网络攻击的帮凶。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/si-ke-jing-gao-wei-tiao-shi-da-xing-yu-yan-mo-xing-cheng

AI安全防护合法LLMs 大型语言模型安全风险实时可见性对齐性破坏微调数据投毒武器化LLMs 网络犯罪

Like (0)

王浩然作者

0 0

Vibe编码在企业级应用：AI工具全面覆盖开发周期‌

Previous 4天前

Meta推出Llama 4系列模型，应对DeepSeek挑战‌

Next 4天前

AI前沿

马斯克对 OpenAI 的修改后诉讼将微软列为被告

埃隆·马斯克对 OpenAI 提起的诉讼指控该公司放弃了非营利使命，该诉讼于 7 月撤回，但8 月又重新提起。现在，在一份修改后的诉状中，该诉讼将微软、LinkedIn 联合创始人…

王浩然
2024年11月16日
000
AI前沿

这款“AI Granny”黑客利用无聊的闲聊浪费电话诈骗者的时间

电话诈骗并不是什么新鲜事，但随着人工智能的出现，人们比以往任何时候都更难知道他们正在通话的人是否是他们所说的那个人。但英国移动网络 O2 正在扭转局面，创造了所谓的“人工智能奶奶”…

王浩然
2024年11月17日
000
AI前沿

OpenAI 警告加州的人工智能法案威胁美国创新

OpenAI加入了越来越多的科技领袖和政客的行列，反对加州一项有争议的人工智能安全法案。该公司认为，这项名为SB 1047 的法案会扼杀创新，监管应该在联邦层面进行。 OpenAI…

AI News
2024年8月29日
000
AI前沿

Matt Mullenweg 称 WP Engine 是“WordPress 的毒瘤”，并敦促社区更换提供商

Automattic 首席执行官兼 WordPress 联合创始人马特·穆伦维格 (Matt Mullenweg)本周对竞争对手发起了严厉批评，称WP Engine是“WordPr…

点点
2024年9月23日
000
AI前沿

无需再训练：Sakana 的新 AI 模型改变了机器学习的方式

Sakana AI是一家专注于研究自然启发算法的人工智能研究实验室，其研究人员开发了一种自适应语言模型，该模型无需微调即可学习新任务。该模型称为Transformer² (Tran…

王浩然
2025年1月25日
000
AI前沿

Experity 远程放射学首席医疗官 Ron Boucher 博士 – 访谈系列

Ron Boucher 博士担任Experity的远程放射学首席医疗官，Experity 是一家专注于美国紧急护理市场的软件和服务公司。 Experity 提供集成操作系统，包括电…

点点
2024年10月27日
000
AI前沿

Google Gemini 意外超越 OpenAI，跃居第一，但基准测试结果并不能说明全部情况

谷歌凭借其最新实验模型在一项关键的人工智能基准测试中名列前茅，标志着人工智能竞赛发生重大转变——但业内专家警告称，传统的测试方法可能不再有效衡量真正的人工智能能力。该模型名为“ …

王浩然
2024年11月17日
000
AI前沿

人工智能治理差距：95% 的公司尚未实施框架

强有力的治理对于减轻人工智能风险和维护负责任的系统至关重要，但大多数公司尚未实施框架。该报告由Prove AI委托Zogby Analytics进行，调查了来自美国、英国和德国大…

点点
2024年10月18日
000
AI前沿

Chain of Experts（COE）：低成本高效能的大型语言模型框架

引言在人工智能（AI）领域，大型语言模型（LLM）的应用日益广泛，但高昂的成本和复杂的部署流程一直是阻碍其普及的关键因素。近日，一种名为Chain of Experts（COE）…

王浩然
2025年3月19日
000
AI前沿

如何在不入侵任何东西的情况下窃取人工智能模型

人工智能模型的可窃取性令人惊讶——只要你设法嗅出模型的电磁特征。北卡罗来纳州立大学的研究人员在一篇新论文中描述了这种技术，尽管他们一再强调，事实上他们并不想帮助人们攻击神经网络。他…

王浩然
2024年12月29日
000
AI前沿

GPT-4o：OpenAI推出原生图像生成功能，惊艳用户

引言‌ 自OpenAI在2024年5月发布其首款“全能”或多模态模型GPT-4o以来，近一年的时间里，这款模型始终保持着强大的竞争力。而今，OpenAI再次为ChatGPT的Plu…

王浩然
2025年3月27日
000
AI前沿

OpenAI 计划为其。o1“推理”模型注册商标

OpenAI 已为其最新 AI 模型o1提交了商标申请，以保护其知识产权。周二，OpenAI 向美国专利商标局 (USPTO) 提交了文件，注册“OpenAI o1”商标。有趣的…

王浩然
2024年11月28日
000
AI前沿

LinkedIn 创始人 Reid Hoffman 在 TED AI 大会上公布“超级机构”愿景，巧妙抨击埃隆·马斯克

LinkedIn 联合创始人、著名科技投资者Reid Hoffman周二对人工智能做出了乐观的展望，提出了“超级代理”的概念，认为人工智能是增强人类能力的工具，而不是替代人类的工具…

王浩然
2024年10月26日
000
AI前沿

加密货币骗子入侵 OpenAI 在 X 上的新闻账号

OpenAI 在 X 上的官方新闻账号似乎也遭到了加密货币骗子的攻击，前几个月攻击该公司领导层的账号的也是同样的情况。周一下午晚些时候，OpenAI Newsroom（OpenA…

王浩然
2024年9月25日
000
AI前沿

色情生成器、作弊工具和“专家”医疗建议：深入探究OpenAI的定制聊天机器人市场

Gizmodo 对 OpenAI 的 GPT 商店进行的分析发现，超过 100 种工具似乎违反了该公司关于性内容、欺骗、法律和医疗建议、赌博、虚假评论生成和浪漫陪伴的政策。去年 …

王浩然
2024年9月5日
000
AI前沿

DeepSeek 声称其“推理”模型在某些基准上击败了 OpenAI 的 o1

中国人工智能实验室 DeepSeek 发布了其所谓的推理模型 DeepSeek-R1 的开放版本，声称该模型在某些人工智能基准上的表现与 OpenAI 的o1一样好。 R1 可从 …

王浩然
2025年1月21日
000
AI前沿

Mistral 推出了审核 API

人工智能初创公司 Mistral推出了一种用于内容审核的新 API。 Mistral 表示，该 API 与支持 Mistral 的 Le Chat 聊天机器人平台审核的 API 相…

王浩然
2024年11月8日
000
AI前沿

伦敦国王商学院：人工智能如何改变问题解决方式

英国国王商学院和Wazoku研究人员开展的一项新研究表明，人工智能正在改变全球问题的解决方式。报告发现，在过去一年中，Wazoku 70 万名问题解决者网络中近一半（46%）利用…

点点
2024年10月8日
000
AI前沿

SandboxAQ 获 3 亿美元融资，推动大型量化模型创新

SandboxAQ 宣布获得超过 3 亿美元的资金，用于加速其大型量化模型 (LQM) 和其他 AI 应用程序的开发。此轮融资由 Fred Alger Management、T.…

王浩然
2024年12月25日
000
AI前沿

企鹅兰登书屋在其图书的版权页中添加了人工智能警告

商业出版商企鹅兰登书屋正在其图书的版权页中添加语言，禁止使用这些图书来训练人工智能。据《书商》报道，该出版商的新书和旧书的再版现在将包含以下声明：“本书的任何部分不得以任何方式用…

王浩然
2024年10月20日
000