欧盟人工智能法案：通用人工智能指导草案为大型人工智能遵守规定迈出了第一步

王浩然 • 2024年11月16日下午5:00 • AI前沿 • 95 views

根据欧盟《人工智能法案》，适用于通用人工智能模型提供商的行为准则初稿已经发布，同时还发布了反馈邀请——反馈截止日期为 11 月 28 日——起草过程将持续到明年，正式的合规期限将在未来几年内到来。

今年夏天生效的泛欧盟法律在基于风险的框架下规范人工智能的应用。但它也针对更强大的基础或通用人工智能模型（GPAI）制定了一些措施。这就是本《行为准则》的用武之地。

可能加入的包括GPT 模型制造商 OpenAI （该模型是人工智能聊天机器人ChatGPT 的基础）、谷歌及其Gemini GPAI、Meta 及其Llama、Anthropic 及其Claude ，以及法国的Mistral等其他公司。如果他们想确保自己遵守《人工智能法案》，从而避免因不合规而受到执法风险，他们将被要求遵守《通用人工智能行为准则》。

需要明确的是，该准则旨在为履行《欧盟人工智能法案》的义务提供指导。如果 GPAI 提供商认为他们可以通过其他措施证明合规性，他们可以选择偏离最佳实践建议。

该准则的初稿长达 36 页，但可能会更长——甚至可能很长——因为起草者警告说，它缺乏细节，因为这是“一个概述我们制定准则的指导原则和目标的高级起草计划”。

草案中充斥着一些“未解决的问题”，负责制定该准则的工作组尚未解决这些问题。征求来自行业和民间社会的反馈意见显然将在塑造尚未纳入的具体分项措施和关键绩效指标 (KPI) 内容方面发挥关键作用。

但该文件让人们了解，一旦相关合规期限适用，GPAI 制造商将会面临哪些情况（就期望而言）。

针对 GPAI 制定者的透明度要求将于 2025 年 8 月 1 日生效。

但对于最强大的 GPAI（法律定义为具有“系统性风险”），预期它们必须在生效后 36 个月（或 2027 年 8 月 1 日）遵守风险评估和缓解要求。

还有一个需要注意的问题是，该准则草案是在假设只有“少数”GPAI 制定者和 GPAI 具有系统性风险的情况下制定的。“如果这一假设被证明是错误的，未来的草案可能需要进行重大修改，例如，引入更详细的分层措施体系，主要针对那些提供最大系统性风险的模型，”起草者警告说。

版权

在透明度方面，该准则将规定 GPAI 必须如何遵守信息规定，包括在版权材料领域。

其中一个例子是“子措施 5.2”，该措施目前要求签署方提供用于开发 GPAI 的所有网络爬虫的名称及其相关的 robots.txt 功能的详细信息，“包括在爬取时”。

GPAI 模型制定者继续面临有关他们如何获取数据来训练模型的质疑，版权持有者提起多起诉讼，指控 AI 公司非法处理受版权保护的信息。

草案中规定的另一项承诺是要求 GPAI 提供商设立单一联系点和投诉处理机构，以便权利人能够“直接、迅速”地表达不满。

与版权相关的其他拟议措施涵盖 GPAI 需要提供的有关用于“训练、测试和验证”的数据源的文件，以及有关访问和使用受保护内容以开发通用 AI 的授权的文件。

系统性风险

最强大的 GPAI 还受《欧盟人工智能法案》的约束，旨在减轻所谓的“系统性风险”。这些人工智能系统目前被定义为使用总计算能力超过 10^25 FLOPs 进行训练的模型。

《准则》列出了签署方应视为系统性风险的风险类型，包括：

攻击性网络安全风险（例如漏洞发现）。
化学、生物、放射和核风险。
“失去控制”（这里指的是无法控制“强大的自主通用人工智能”）和自动使用模型进行人工智能研发。
说服和操纵，包括大规模的虚假信息/错误信息，可能对民主进程构成风险或导致对媒体失去信任。
大规模歧视。

该版本的准则还建议，GPAI 制定者可以识别未明确列出的其他类型的系统性风险，例如“大规模”侵犯隐私和监视，或可能对公共健康构成风险的用途。该文件提出的一个未解决的问题是，哪些风险应优先添加到主要分类法中。另一个问题是系统性风险分类法应如何应对深度伪造风险（与人工智能生成的儿童性虐待材料和非自愿的亲密图像有关）。

该准则还旨在提供指导，以识别可能导致模型产生系统性风险的关键属性，例如“危险的模型能力”（例如网络攻击或“武器获取或扩散能力”）和“危险的模型倾向”（例如与人类意图和/或价值观不一致；有欺骗倾向；偏见；虚构；缺乏可靠性和安全性；以及抵制目标修改）。

虽然起草过程仍在继续，但仍有许多细节有待完善，但《准则》的作者写道，其措施、子措施和关键绩效指标应“相称”，特别注重“根据特定提供商的规模和能力量身定制，特别是资金资源不如人工智能发展前沿的中小企业和初创企业”。他们还补充道，还应注意“在适当情况下采用不同的分销策略（例如开源），以体现比例原则，同时兼顾利益和风险”。

草案提出的许多悬而未决的问题涉及如何将具体措施应用于开源模式。

框架内的安全性和保障性

该准则中的另一项措施涉及“安全与保障框架”（SSF）。GPAI 制定者将被要求详细说明其风险管理政策，并“持续、彻底地”识别其 GPAI 可能产生的系统性风险。

这里有一个有趣的子措施“预测风险”。这将要求签署方在 SSF 中“尽最大努力估计”他们预计何时开发一个触发系统性风险指标的模型的时间表——例如前面提到的危险模型能力和倾向。这可能意味着，从 2027 年开始，我们将看到尖端人工智能开发人员制定他们预计模型开发何时会跨越某些风险阈值的时间表。

此外，《准则草案》重点关注具有系统性风险的 GPAI，使用“最佳评估”评估其模型的能力和局限性，并应用“一系列合适的方法”来实现这一点。列举的例子包括：问答集、基准、红队和其他对抗性测试方法、人类提升研究、模型生物、模拟和机密材料的代理评估。

另一项关于“重大系统性风险通知”的子措施要求签署方在“有充分理由相信可能发生重大系统性风险”时，通知AI办公室（根据该法案设立的监督和指导机构）。

该法规还规定了“严重事件报告”的措施。

“签署方承诺识别和跟踪严重事件，只要这些事件源自具有系统性风险的通用人工智能模型，则应毫不拖延地记录和报告任何相关信息和可能的纠正措施，并向人工智能办公室和国家主管部门（视情况而定）报告，”协议写道——尽管有一个相关的未决问题要求就“严重事件意味着什么”征求意见。因此，在确定定义方面似乎还有更多工作要做。

准则草案还提出了针对严重事件可能采取的“纠正措施”等问题。其中还提出了“哪些严重事件响应流程适合公开重量或开源提供商？”等寻求反馈的措辞。

起草者最后总结道：“该准则的初稿是四个专业工作组对现有最佳实践进行初步审查的结果，是利益相关者对近 430 份意见书的咨询意见、提供商研讨会的回应、国际方法（包括 G7 行为准则、前沿人工智能安全承诺、布莱切利宣言以及相关政府和标准制定机构的成果），以及最重要的人工智能法案本身。”

“我们强调，这只是初稿，因此《守则》草案中的建议是临时的，可能会发生变化，”他们补充道。“因此，我们诚邀您提出建设性意见，我们将进一步制定和更新《守则》的内容，并努力在 2025 年 5 月 1 日之前制定出更详细的最终版本。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/ou-meng-ren-gong-zhi-neng-fa-an-tong-yong-ren-gong-zhi-neng

Like (0)

王浩然作者

0 0

人工智能先驱 François Chollet 离开谷歌

Previous 2024年11月16日

Google 在全球推出适用于 iOS 的 Gemini 应用

Next 2024年11月16日

AI前沿

人工智能模拟让人们看见未来的你

通过让用户与年长的自己聊天，“未来的你”旨在减轻焦虑并引导年轻人做出更好的选择。你是否曾经想过穿越时空，看看未来的自己会是什么样子？现在，借助生成式人工智能的力量，你可以实现这个…

王浩然
2024年10月3日
000
AI前沿

Snowflake以2亿美元新资本扩大初创企业加速器‌

数据云服务商Snowflake宣布，将投入2亿美元新资本，进一步扩大其初创企业加速器项目。此举旨在支持具有创新技术的初创企业，推动大数据和云计算领域的发展。 ‌一、加速器项目扩展‌…

王浩然
2025年3月2日
000
AI前沿

谷歌量子人工智能投资波士顿初创公司

该笔投资将资助 QuEra 开发大规模容错量子计算机的目标

点点
2024年10月23日
000
AI前沿

为什么人工智能无法拼写“草莓”

在“strawberry”这个词中，字母“r”出现了多少次？根据GPT-4o和Claude等强大的 AI 产品的说法，答案是两次。大型语言模型 (LLM) 可以在几秒钟内写出论文…

王浩然
2024年8月28日
000
AI前沿

Qodo 融资 4000 万美元，用于增强 AI 驱动的代码完整性和开发人员效率

Qodo （前身为 CodiumAI）最近在由Susa Ventures和Square Peg领投的 A 轮融资中获得了 4000 万美元， Firestreak Ventures…

点点
2024年10月1日
000
AI前沿

2025年，1X将在数百户家庭中测试人形机器人

随着科技的飞速发展，人形机器人正逐渐成为现实生活中的一部分。据最新消息，创新科技公司1X计划在2025年启动一项雄心勃勃的项目：在数百户家庭中测试其人形机器人的实际应用。这一举措标…

王浩然
2025年3月25日
000
AI前沿

NVIDIA推出Llama Nemotron开放推理模型，加速自主AI发展

在人工智能（AI）领域，NVIDIA始终走在创新的前沿。近日，在NVIDIA GTC大会上，这家AI巨头宣布了一系列硬件和软件更新，其中最为引人注目的莫过于其全新推出的Llama …

王浩然
2025年3月22日
000
AI前沿

“个性化、不受限制”的人工智能实验室 Nous Research 推出首个开启推理模型：DeepHermes-3

人工智能推理模型——在文本中产生“思路链”（CoT）并反思自己的分析以尝试在输出响应之前中途捕捉错误的模型——现在风靡一时，这要归功于DeepSeek和OpenAI 的“o”系列。…

王浩然
2025年2月18日
000
AI前沿

DeepSeek震撼AI行业：AI的下一次飞跃或不再依赖更多数据，而是推理时的更强计算能力‌

人工智能领域正以前所未有的速度发展，而近期的突破更是颠覆了已有的认知。2025年初，中国AI实验室DeepSeek发布的新模型，在AI行业内引起了巨大震动，导致Nvidia等AI数…

王浩然
14小时前
000
AI前沿

Nvidia 人工智能人形机器人在拉斯维加斯提供咖啡

Richtech Robotics 公司生产的 Adam 机器人将于周日在 Town Square 的 Clouffee and Tea 开始工作采用 Nvidia AI 技术的…

王浩然
2025年2月18日
000
AI前沿

Pictionary 和 Minecraft 可以测试 AI 模型的创造力吗？

大多数人工智能基准测试并没有告诉我们太多信息。它们提出的问题可以通过死记硬背来解决，或者涉及与大多数用户不相关的主题。因此一些人工智能爱好者开始通过游戏来测试人工智能解决问题的能…

王浩然
2024年11月6日
000
AI前沿

微软严厉打击副驾驶人工智能的恶意使用

微软数字犯罪部门正在采取法律行动，打击那些创建恶意工具、逃避生成式人工智能服务的安全护栏和准则并创建有害内容的网络犯罪分子。根据弗吉尼亚州东区一份未密封的投诉，尽管该公司竭尽全力…

王浩然
2025年1月17日
000
AI前沿

华为在人工智能竞赛中胜过苹果了吗？

当这家科技巨头发布其首款人工智能智能手机系列 iPhone 16 系列时，原本应该预示着苹果人工智能新时代的到来，却让许多人感到失望。这款手机目前仍处于测试阶段，预计需要数月甚至数…

点点
2024年9月12日
000
AI前沿

Apple Intelligence 功能还可以为你总结分手短信

当Nick Spreen安装 iOS 18.1 测试版以试用即将推出的 Apple Intelligence 功能时，他可能没想到会收到当时的女友发来的由 AI 生成的分手短信摘要…

王浩然
2024年10月12日
000
AI前沿

沃尔玛和亚马逊利用人工智能推动零售转型

沃尔玛和亚马逊正在利用人工智能推动零售转型，带来全新的消费者体验并提高运营效率。据分析公司GlobalData称，沃尔玛正专注于增强现实和人工智能增强型商店管理。与此同时，亚马逊…

点点
2024年9月17日
000
AI前沿

介绍“叙事指挥”，这一有助于解释 2024 年大选的新商业论点

9 月底，天使投资人亚历克斯·罗伊（Alex Roy）——我曾在已倒闭的自动驾驶汽车初创公司 Argo AI 工作的同事——在他新成立的精品深度科技风险投资公司New Indust…

王浩然
2024年11月9日
000
AI前沿

人工智能研究人员如何获得诺贝尔物理学奖和化学奖：未来科学发现的两个关键教训

2024 年的诺贝尔奖让许多人感到意外，因为人工智能研究人员是物理学和化学领域的杰出获奖者之一。杰弗里·辛顿和约翰·霍普菲尔德因其在神经网络方面的奠基性工作而获得诺贝尔物理学奖。相…

点点
2024年10月21日
000
AI前沿

确保 OT 环境中 AI 的使用安全

随着拥有运营技术 (OT) 的组织开始采用 AI，安全性需要成为其战略的重中之重。AI 的集成大大拓宽了攻击面 — — 这一范围已经因 IT 和 OT 的融合而扩大。大多数 OT …

点点
2024年9月6日
000
AI前沿

AWS 将数据库价格降低近 50%，并增加了分布式扩展功能

AWS正在扩展其云数据库产品组合的功能，同时降低企业成本。在今天的AWS re:invent 2024会议上，这家云计算巨头概述了一系列云数据库创新。其中包括新的 Amazon …

王浩然
2024年12月6日
000
AI前沿

DeepMind 的 Talker-Reasoner 框架为 AI 代理带来了系统 2 思维

人工智能代理必须解决一系列需要不同速度和不同水平的推理和规划能力的任务。理想情况下，代理应该知道何时使用其直接记忆，何时使用更复杂的推理能力。然而，设计能够根据需求正确处理任务的代…

王浩然
2024年10月27日
000