联邦学习如何（以及为什么）增强网络安全

王浩然 • 2024年10月29日上午10:00 • AI前沿 • 45 views

网络攻击每年都越来越频繁，数据泄露的成本也越来越高。无论公司是在开发过程中保护其 AI 系统，还是使用其算法来改善其安全状况，他们都必须减轻网络安全风险。联合学习或许可以同时做到这两点。

什么是联邦学习？

联邦学习是一种人工智能开发方法，其中多方分别训练单个模型。每方都从中央云服务器下载当前的主要算法。他们在本地服务器上独立训练配置，完成后上传。这样，他们可以远程共享数据，而无需暴露原始数据或模型参数。

集中式算法会衡量从各个训练配置中收到的样本数量，然后汇总这些样本以创建单一全局模型。所有信息都保留在每个参与者的本地服务器或设备上 — 集中式存储库会衡量更新，而不是处理原始数据。

联邦学习的受欢迎程度正在迅速提高，因为它解决了常见的与开发相关的安全问题。它还因其性能优势而备受追捧。研究表明，这种技术可以将图像分类模型的准确率提高高达 20% ——这是一个显着的提升。

横向联邦学习

联邦学习有两种类型。传统选择是水平联邦学习。在这种方法中，数据被划分到各个设备中。数据集共享特征空间，但具有不同的样本。这使得边缘节点能够协作训练机器学习 (ML) 模型而无需共享信息。

垂直联邦学习

在垂直联邦学习中，情况正好相反——特征不同，但样本相同。特征在参与者之间垂直分布，每个参与者都拥有同一组实体的不同属性。由于只有一方可以访问完整的样本标签集，因此这种方法可以保护隐私。

联邦学习如何加强网络安全

传统开发容易出现安全漏洞。尽管算法必须具有广泛的相关数据集才能保持准确性，但涉及多个部门或供应商会为威胁行为者创造机会。他们可以利用缺乏可见性和广泛的攻击面来注入偏见、进行及时工程或泄露敏感的训练数据。

当算法被部署在网络安全角色中时，其性能会影响组织的安全态势。研究表明，在处理新数据时，模型准确性可能会突然下降。尽管人工智能系统可能看起来很准确，但它们在其他地方测试时可能会失败，因为它们学会了走捷径来产生令人信服的结果。

由于人工智能无法批判性思考或真正考虑背景，其准确性会随着时间的推移而降低。尽管机器学习模型在吸收新信息时不断发展，但如果其决策技能基于捷径，其性能就会停滞不前。这就是联邦学习的用武之地。

通过分散更新训练集中式模型的其他显著优势包括隐私和安全。由于每个参与者都是独立工作的，因此没有人需要共享专有或敏感信息来推进训练。此外，数据传输越少，中间人攻击 (MITM) 的风险就越低。

所有更新都经过加密，以实现安全聚合。多方计算将它们隐藏在各种加密方案后面，从而降低违规或 MITM 攻击的可能性。这样做可以增强协作，同时最大限度地降低风险，最终改善安全态势。

联邦学习的一个被忽视的优势是速度。与集中式学习相比，它的延迟要低得多。由于训练是在本地而不是在中央服务器上进行的，因此该算法可以更快地检测、分类和应对威胁。最小的延迟和快速的数据传输使网络安全专业人员能够轻松处理不良行为者。

网络安全专业人员的注意事项

在利用这种训练技术之前，人工智能工程师和网络安全团队应该考虑几个技术、安全和操作因素。

资源使用情况

人工智能开发成本高昂。构建自己的模型的团队预计前期投入在500 万至 2 亿美元之间，每年维护费用高达 500 万美元。即使成本分摊到多方，财务投入也是巨大的。企业领导者应该考虑云计算和边缘计算成本。

联邦学习也需要大量计算，这可能会带来带宽、存储空间或计算限制。虽然云可以实现按需扩展，但如果网络安全团队不小心，就会面临供应商锁定的风险。战略性硬件和供应商选择至关重要。

参与者信任

虽然分散训练是安全的，但它缺乏透明度，因此存在故意偏见和恶意注入的问题。在集中算法汇总模型更新之前，共识机制对于批准模型更新至关重要。这样，他们可以在不牺牲机密性或泄露敏感信息的情况下最大限度地降低威胁风险。

训练数据安全

虽然这种机器学习训练技术可以改善公司的安全状况，但 100% 安全是不存在的。在云端开发模型存在内部威胁、人为错误和数据丢失的风险。冗余是关键。团队应创建备份以防止中断，并在必要时回滚更新。

决策者应该重新审视其训练数据集的来源。在 ML 社区中，大量借用数据集的情况很普遍，这引发了人们对模型错位的担忧。在 Papers With Code 上，超过50% 的任务社区至少在 57.8% 的时间里使用借用的数据集。此外，50% 的数据集仅来自 12 所大学。

联邦学习在网络安全中的应用

一旦主要算法汇总并权衡参与者的更新，就可以将其重新共享给它所训练的任何应用程序。网络安全团队可以用它来检测威胁。这样做的好处是双重的——威胁行为者只能猜测，因为他们无法轻易窃取数据，而专业人士可以汇集见解，获得高度准确的输出。

联合学习非常适合威胁分类或入侵指标检测等相关应用。人工智能的庞大数据集和广泛的训练构建了其知识库，汇集了广泛的专业知识。网络安全专业人员可以使用该模型作为统一的防御机制来保护广泛的攻击面。

随着概念的发展或变量变得不再重要，ML 模型（尤其是那些进行预测的模型）很容易随着时间的推移而发生变化。借助联合学习，团队可以定期使用各种特征或数据样本更新其模型，从而获得更准确、更及时的洞察。

利用联邦学习实现网络安全

无论公司是想保护其训练数据集还是利用 AI 进行威胁检测，他们都应该考虑使用联合学习。只要他们战略性地应对潜在的内部威胁或违规风险，这种技术就可以提高准确性和性能并增强其安全态势。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/lian-bang-xue-xi-ru-he-yi-ji-wei-shen-me-zeng-qiang-wang

AI 系统人工智能增强网络安全安全态势数据泄露网络攻击

Like (0)

王浩然作者

0 0

埃隆·马斯克的 xAI 为 Grok 添加了图像理解功能

Previous 2024年10月29日

生成式人工智能不会主动来找你——你不愿意采用它才是

Next 2024年10月29日

AI前沿

丰田与 NTT 联手推进 33 亿美元 AI 移动出行项目

日本汽车制造商丰田正与电信巨头日本电报电话公司 (NTT) 合作开发使用人工智能预防事故的驾驶辅助系统。两人计划投资 33 亿美元打造一个全新的移动 AI 平台，该平台利用大量数…

王浩然
2024年11月7日
000
AI前沿

Meta 向研究人员开放其 MobileLLM，并发布完整权重

Meta AI 宣布开源MobileLLM，这是一套针对移动设备优化的语言模型，其模型检查点和代码现已在 Hugging Face 上提供。不过，目前它仅在 Creative Co…

王浩然
2024年11月3日
000
AI前沿

AI 能否利用安全检查来破坏用户？是的，但效果不是很好 — 目前来说

人工智能公司声称已经实施了严格的安全检查，以确保模型不会说或做奇怪、非法或不安全的事情。但如果模型能够逃避这些检查，并出于某种原因试图破坏或误导用户，该怎么办？据 Anthropi…

点点
2024年10月21日
000
AI前沿

Adobe 为 AWS 带来生成式 AI 和实时个性化：以下是下一步计划

Adobe正在积极进军亚马逊的云计算领域，将其体验平台扩展到AWS，这一合作标志着企业处理人工智能和客户数据方式的重大转变。 Adobe 领导层表示，该交易于上周在亚马逊网络服务r…

王浩然
2024年12月10日
000
AI前沿

借助 Apple Intelligence，iPhone 用户最终将获得更好的 Siri

Siri 最终会变得有用吗？这是苹果今天在“Glowtime”活动上做出的承诺，该公司在活动中推出了iPhone 16 系列——这是首批搭载人工智能功能的新 iPhone，这要归功…

王浩然
2024年9月10日
000
AI前沿

SambaNova 和 Gradio 让每个人都能使用高速人工智能——其工作原理如下

SambaNova Systems和Gradio推出了一项新的集成，让开发人员只需几行代码即可访问最快的 AI 推理平台之一。此次合作旨在让高性能 AI 模型更易于访问，并加快开发…

王浩然
2024年10月19日
000
AI前沿

Voyage AI 正在构建 RAG 工具，以减少 AI 产生幻觉

人工智能往往会编造事实。这对于几乎所有经常使用人工智能的人来说都是不具吸引力的，尤其是对于企业来说，错误的结果可能会损害企业的利润。在 Salesforce 最近的一项调查中，半数…

王浩然
2024年10月5日
000
AI前沿

随着数据中心使用率不断上升，Submer 筹集 5550 万美元以降低数据中心温度

人们竞相开发更好的芯片和数据中心容量来处理 AI 工作负载，但所有这些活动都存在一个问题。强大的处理能力意味着会产生大量热量，这对服务器的运行和环境都有重大影响。由于…

王浩然
2024年10月5日
000
AI前沿

微软的 Windows Agent Arena：教 AI 助手操作你的 PC

微软推出了一项突破性的基准测试，名为Windows Agent Arena (WAA)，用于在真实的 Windows 操作系统环境中测试人工智能代理。这个新平台旨在加速开发能够在各…

王浩然
2024年9月15日
000
AI前沿

神秘「蓝莓」登顶文生图竞技场，疑似Flux.1续作，网友：都来免费打广告了

都来玩这套。继OpenAI“草莓”之后，又有神秘模型蓝莓来“霸榜”。在文生图模型排行榜上，两个“无人认领”的模型blueberry_0和blueberry_1力压Flux.1、…

点点
2024年9月29日
000
AI前沿

在建立真正的业务关系的同时探索人工智能世界

人工智能 (AI) 的发展速度超乎人们的想象。从提高生产力到改善决策能力和创造力，工作场所中的人工智能不再是一个未来概念，而是我们日常生活中不可或缺的一部分。根据微软的 2024 …

点点
2024年9月21日
000
AI前沿

Insilico Medicine 成功完成 IIa 期治疗肺纤维化研究，人工智能药物研发取得里程碑式进展

在人工智能药物研发方面取得突破性进展的Insilico Medicine宣布其新药 ISM001-055 的IIa 期研究结果呈阳性，该药物旨在治疗特发性肺纤维化(IPF)。这种小…

点点
2024年9月27日
000
AI前沿

利用人类注意力可以改善人工智能生成的图像

来自中国的一项新研究提出了一种提高稳定扩散等潜在扩散模型（LDM）生成的图像质量的方法。该方法专注于优化图像的显著区域——最有可能吸引人类注意力的区域。新研究发现，显著性图（左…

点点
2024年10月17日
000
AI前沿

引导人工智能部署：避免陷阱并确保成功

通往人工智能的道路不是短跑，而是一场马拉松，企业需要调整自己的步伐。那些在学会走路之前就开始跑步的人将会失败，成为那些试图快速到达人工智能终点线的企业的坟墓。事实是，没有终点线。没…

点点
2024年10月12日
000
AI前沿

为什么人工智能是万事通，却一无所知

每月有超过 5 亿人信任 Gemini 和ChatGPT ，相信它们能让他们了解从意大利面到性或家庭作业等所有信息。但如果人工智能告诉你用汽油煮意大利面，那么你可能也不应该听从它在…

点点
2024年9月30日
000
AI前沿

谷歌：人工智能代理、多模式人工智能、企业搜索将在 2025 年占据主导地位

根据 Google Cloud 今天发布的新趋势报告，如果说 2024 年是实验的一年，那么 2025 年将真正成为企业扩展AI 的一年。值得注意的是，复杂的多模式人工智能将支…

王浩然
4天前
000
AI前沿

小型 AI 模型需求激增，阿联酋猎鹰 3 号向开源领导者发起挑战

阿联酋政府支持的技术创新研究所(TII) 宣布推出 Falcon 3，这是一系列开源小型语言模型 (SLM)，旨在在轻量级、基于单 GPU 的基础设施上高效运行。 Falcon 3…

王浩然
4天前
000
AI前沿

亚马逊因人类投资避开英国反垄断审查

英国反垄断机构得出结论：由于交易的规模和范围，亚马逊与人工智能初创公司 Anthropic 的合作和股权投资不能根据现行的合并规则进行调查。英国竞争与市场管理局 (CMA) 宣布…

王浩然
2024年9月29日
000
AI前沿

推理框架 Archon 有望加快 LLM 进程，且无需额外成本

斯坦福大学扩展智能实验室的研究人员介绍了一种新的推理框架，可以帮助大型语言模型 (LLM) 更快地处理潜在的响应。该框架 Archon 使用推理时间架构搜索 (ITAS) 算法…

王浩然
2024年10月3日
000
AI前沿

Google Gemini 的 Imagen 3 让玩家可以设计自己的棋子

谷歌实验室是科技巨头谷歌旗下的实验部门，它推出了一项新的在线项目，提供一种有趣的国际象棋游戏变体。该网络实验名为 GenChess，顾名思义，它采用了谷歌的图像生成模型 Gemi…

王浩然
2024年11月28日
000