Meta 计划限制发布有风险的人工智能系统

王浩然 • 2025年2月18日下午5:00 • AI前沿 • 47 views

Frontier AI 框架描述了 Meta 如何将 AI 模型分为高风险组和严重风险组

Meta发布了一个新的风险政策框架，概述了其计划如何评估和减轻新前沿 AI 模型带来的风险，以及何时停止开发、限制访问或不发布系统。

为了解决围绕人工智能日益增长的安全问题，Frontier AI Framework 描述了 Meta 如何将人工智能模型分为高风险和关键风险组，然后采取相应措施将相关风险降低到“可容忍水平”。

例如，严重风险被定义为能够唯一地实现所概述的威胁情景。高风险意味着该模型可以为威胁情景的执行提供显著的提升，但无法实现执行。

威胁情景包括高影响力生物武器的扩散，其能力相当于已知药剂，并通过大规模的长期欺诈和诈骗对个人或公司造成广泛的经济损失。

对于达到严重风险阈值的模型，Meta 将停止开发，将模型的访问权限限制为少数专家，并输入安全保护以防止黑客攻击或泄露，“只要技术上可行且商业上可行”。

对于高风险，它将限制访问并实施缓解措施以将风险降低到中等水平，从而该模型不会对威胁场景的执行提供显著的提升。

Meta 表示，风险评估过程涉及多学科参与，包括内部和“适当情况下”来自各个学科的外部专家以及来自多个学科的公司领导。

新框架仅与该公司最先进的、达到或超过当前能力的模型和系统有关。

Meta 表示：“我们希望分享我们目前开发先进人工智能系统的方法，不仅可以促进我们决策过程的透明度，还可以鼓励关于如何改进人工智能评估科学以及风险和收益量化的讨论和研究。”

其评估和降低风险的方法将随着时间的推移而发展和成熟。然而，它补充说，由于人工智能评估仍处于发展阶段，因此

Meta 表示，它计划专注于提高评估的稳健性和可靠性，包括努力确保其测试环境产生的结果能够反映该模型投入生产后的表现。

该公司还补充道：“我们开发和发布前沿人工智能的决策过程受到内部人工智能治理计划、风险阈值以及支撑这些计划的严格评估和缓解计划的指导。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/meta-ji-hua-xian-zhi-fa-bu-you-feng-xian-de-ren-gong-zhi

AI 模型 Meta

Like (0)

王浩然作者

0 0

DeepSeek AI 未通过多项安全测试，给企业敲响警钟

Previous 2025年2月18日

Nvidia 人工智能人形机器人在拉斯维加斯提供咖啡

Next 2025年2月18日

AI前沿

小型 AI 模型需求激增，阿联酋猎鹰 3 号向开源领导者发起挑战

阿联酋政府支持的技术创新研究所(TII) 宣布推出 Falcon 3，这是一系列开源小型语言模型 (SLM)，旨在在轻量级、基于单 GPU 的基础设施上高效运行。 Falcon 3…

王浩然
2024年12月18日
000
AI前沿

使用 LlamaIndex 和 Gemini 实现 REAcT Agent

在过去的 2-3 年里，我们见证了人工智能领域的非凡发展，主要体现在大型语言模型、扩散模型、多模态模型等方面。我最喜欢的兴趣之一是代理工作流。今年早些时候，Coursera 的创始…

王浩然
2024年10月20日
000
AI前沿

阿里巴巴的Qwen2.5-Max挑战美国科技巨头，重塑企业人工智能

阿里云今天发布了Qwen2.5-Max型号，这是中国在不到一周的时间内第二次在人工智能方面取得重大突破，这震动了美国科技市场，并加剧了人们对美国人工智能领导地位逐渐减弱的担忧。新…

王浩然
2025年1月29日
000
AI前沿

Opera浏览器宣布推出全新代理功能‌

在浏览器市场日益激烈的竞争中，Opera再次展现其创新精神，为用户带来了一项突破性的新功能。近日，Opera官方宣布，其最新版本的浏览器中将集成一个全新的代理特性，旨在为用户提供更…

王浩然
2025年3月4日
000
AI前沿

苹果发布专为人工智能打造的 iPhone 16；Apple Intelligence 即将加入产品阵容

苹果正在将人工智能引入其产品线，从周一发布的新款 iPhone 16 和新的个人智能系统开始。苹果表示，公司的Apple Intelligence将为新机型提供“易于使用的个人智…

点点
2024年9月11日
000
AI前沿

Pika 2.0 继 Sora 之后推出，将用户自己的角色、物体和场景整合到新的 AI 视频中

Pika是一家总部位于帕洛阿尔托的初创公司，也是创造逼真的 AI 视频生成工具的早期领导者之一，它推出了最新的 AI 视频生成器模型 Pika 2.0，它称这是一次重大更新，承诺为…

王浩然
2024年12月16日
000
AI前沿

一种新的代理可靠性方法：AgentSpec强制代理遵循规则

在人工智能领域，随着AI代理（Agent）在企业流程和自动驾驶等应用中的日益普及，其安全性和可靠性问题也日益凸显。AI代理在执行任务时可能会采取意外行动，缺乏灵活性且难以控制，这给…

王浩然
2025年3月31日
000
AI前沿

聊天机器人成为老师

史蒂文·约翰逊是一位非常注重元理论的作家。他经常撰写有关科学和技术的文章，喜欢沉浸在他所报道的事物中，甚至利用它们来改变他写书的方式。几年前，在 ChatGPT 推出和人工智能热潮…

王浩然
2024年9月24日
000
AI前沿

微软的代理 AI 工具 OmniParser 在开源排行榜上名列前茅

微软的OmniParser正在做一些事情。本月早些时候，雷德蒙德发布了一种新的开源模型，可以将屏幕截图转换为 AI 代理更容易理解的格式，但就在本周，它成为了 AI 代码库 Hu…

王浩然
2024年11月3日
000
AI前沿

人工智能训练研究货币化：风险与最佳实践

随着对生成式人工智能的需求不断增长，对用于训练这些系统的高质量数据的需求也在不断增长。学术出版商已经开始将其研究内容货币化，为大型语言模型 (LLM) 提供训练数据。虽然这一发展为…

王浩然
2024年12月26日
000
AI前沿

冷静一下：DeepSeek-R1 很棒，但 ChatGPT 的产品优势还远未结束

就在一周前——2025 年 1 月 20 日——中国人工智能初创公司 DeepSeek 发布了一个名为 R1 的新开源人工智能模型，该模型最初可能会被误认为是自OpenAI两年多前…

王浩然
2025年1月28日
000
AI前沿

Arize AI：期望在AI可观测性领域抢占先机

Arize AI，一家专注于人工智能可观测性的创新企业，近期表达了其对于在AI可观测性领域取得先发优势的热切期望。该企业深知，在AI技术日新月异的当下，如何有效监测、评估和优化AI…

王浩然
2025年2月24日
000
AI前沿

Mistral AI发布新型开源AI模型，性能超越GPT-4o Mini，参数量却大幅减少‌

法国人工智能创新企业Mistral AI近期揭晓了其最新的开源AI模型——Mistral Small 3.1。据Mistral AI宣称，该模型在性能上超越了行业内的其他佼佼者，包…

王浩然
2025年3月20日
000
AI前沿

开始使用 AI 代理（第 1 部分）：捕获流程、角色和连接

现代的 AI 代理至少包含一个能够调用某些工具的大型语言模型(LLM)。有了合适的编码工具集，它就可以开始生成代码，能够在容器中运行代码，观察结果，修改代码，从而更有可能生成有用的…

王浩然
2024年11月27日
000
AI前沿

Gartner预测：2025年全球生成式AI支出将达到6440亿美元，对企业IT领导者意味着什么？

Gartner最新发布的一份报告预测，到2025年，全球生成式AI（Generative AI）的支出将达到惊人的6440亿美元。这一数字相比2024年增长了76.4%，凸显了生成…

王浩然
2025年4月1日
000
AI前沿

Vera AI 推出“AI Gateway”，帮助企业安全无风险地扩展 AI

专注于负责任的人工智能部署的初创公司Vera AI Inc.今天宣布其AI Gateway平台全面上市。该系统旨在通过提供可定制的护栏和模型路由功能，帮助组织更快、更安全地实施人工…

王浩然
2024年10月4日
000
AI前沿

Microsoft Copilot Vision 现已推出，让 AI 能够看到你在线做什么

Microsoft Copilot日益智能化。这家由萨蒂亚·纳德拉 (Satya Nadella) 领导的公司刚刚宣布，其人工智能助手现在具有“视觉”功能，可与用户一起浏览互联网。…

王浩然
2024年12月8日
000
AI前沿

德勤：74% 的企业已达到或超过人工智能计划（但挑战依然存在）

世界各地各种规模的企业都在尝试理解生成式人工智能，并确定其可能带来哪些价值。好消息是：大多数组织实际上都在努力实现这一目标。根据德勤今天发布的一份新报告，大多数企业实际上都达到或…

王浩然
2025年1月22日
000
AI前沿

利用云加速您的 AI 创新

专为人工智能打造的综合云平台可以提供强大的计算资源、先进的人工智能工具和内置的安全性概览 AI 不仅仅是未来——它现在就在这里，推动着各个行业的转型。然而，许多企业在实施 AI …

王浩然
2025年2月21日
000
AI前沿

LlamaIndex 超越了 RAG，因此代理可以做出复杂的决策

流行的 AI 编排框架LlamaIndex引入了代理文档工作流 (ADW)，这是一种新架构，该公司表示，它超越了检索增强生成 (RAG) 流程并提高了代理的工作效率。随着编排框…

王浩然
2025年1月10日
000

发表回复

Please Login to Comment

Meta 计划限制发布有风险的人工智能系统

相关推荐

发表回复

Share To :