该法学硕士框架首次尝试对 Big AI 是否遵守《欧盟人工智能法案》进行基准测试

王浩然 • 2024年10月17日下午4:00 • AI前沿 • 135 views

当大多数国家的立法者仍在讨论如何为人工智能设置护栏时，欧盟已经走在了前面，并于今年早些时候通过了基于风险的人工智能应用监管框架。

该法律于 8 月生效，尽管泛欧盟人工智能治理制度的全部细节仍在制定中——例如，行为准则正在制定中。但是，在未来的几个月和几年里，该法律的分层规定将开始适用于人工智能应用程序和模型制造商，因此合规倒计时已经开始。

评估人工智能模型是否以及如何履行其法律义务是下一个挑战。大型语言模型 (LLM) 和其他所谓的基础或通用人工智能将支撑大多数人工智能应用。因此，将评估工作重点放在人工智能堆栈的这一层似乎很重要。

进一步发展的是LatticeFlow AI，它是苏黎世联邦理工学院衍生出来的一家公司，专注于人工智能风险管理和合规性。

周三，欧盟发布了对《欧盟人工智能法案》的首个技术解释，这意味着它试图将监管要求映射到技术要求上，同时还推出了一个借鉴这项工作的开源 LLM 验证框架——它称之为Compl-AI（“compl-ai”……看看他们做了什么！）。

据 LatticeFlow 报道，人工智能模型评估计划（他们也称之为“第一个面向法规的 LLM 基准测试套件”）是瑞士联邦理工学院和保加利亚计算机科学、人工智能和技术研究所 (INSAIT) 长期合作的成果。

AI 模型制作者可以使用 Compl-AI 网站请求评估他们的技术是否符合欧盟 AI 法案的要求。

LatticeFlow 还发布了几个主流 LLM 的模型评估，例如 Meta 的 Llama 模型和 OpenAI 的 GPT 的不同版本/大小，以及Big AI 的欧盟 AI 法案合规排行榜。

后者根据法律要求对 Anthropic、Google、OpenAI、Meta 和 Mistral 等模型的表现进行排名——从 0（即不符合）到 1（完全符合）。

如果缺少数据或模型制作者未提供该功能，则其他评估将被标记为 N/A。（注：在撰写本文时，也记录了一些负分，但我们被告知这是由于 Hugging Face 界面存在错误造成的。）

LatticeFlow 的框架根据 27 个基准来评估 LLM 的响应，例如“良性文本的有害完成”、“有偏见的答案”、“遵循有害的指令”、“真实性”和“常识推理”，这些只是它用于评估的几个基准类别。因此，每个模型在每一列中都会获得一定范围的分数（否则为 N/A）。

人工智能合规性好坏参半

那么主要的 LLM 表现如何呢？没有整体模型得分。因此，表现会根据评估的具体内容而有所不同——但在各种基准测试中，有一些明显的高点和低点。

例如，所有模型在不遵循有害指令方面都表现强劲；并且在不产生偏见答案方面全面表现相对较强 – 而推理和常识得分则参差不齐。

在其他方面，该框架用来衡量公平性的推荐一致性在所有模型中都表现得特别差——没有一个模型的得分高于中途水平（大多数模型的得分远低于中途水平）。

其他领域，例如训练数据的适用性和水印的可靠性和稳健性，由于很多结果被标记为 N/A，似乎基本上没有得到评估。

LatticeFlow 确实指出，在某些领域，模型的合规性更难评估，例如版权和隐私等热点问题。因此，它并不假装自己知道所有答案。

在一篇详细介绍该框架工作的论文中，参与该项目的科学家强调，他们评估的大多数小型模型（≤13B 个参数）“在技术稳健性和安全性方面得分较低”。

他们还发现“几乎所有被检验的模型都在努力实现高度的多样性、非歧视性和公平性。”

“我们认为，这些缺陷主要是由于模型提供商过于注重提高模型能力，而忽略了《欧盟人工智能法案》监管要求所强调的其他重要方面，”他们补充道，并表示，随着合规期限的临近，法学硕士将被迫将注意力转移到值得关注的领域——“从而实现法学硕士更加均衡的发展”。

鉴于目前还没有人确切知道遵守欧盟人工智能法案需要什么，LatticeFlow 的框架必然是一个正在进行的工作。它也只是对如何将法律的要求转化为可供基准测试和比较的技术成果的一种解释。但这是一个有趣的开始，需要持续努力探索强大的自动化技术，并试图引导其开发人员走向更安全的实用性。

“该框架是朝着全面合规性为中心评估欧盟人工智能法案迈出的第一步——但其设计方式是，随着法案的更新和各工作组取得进展，该框架可以轻松更新，以便与时俱进，”LatticeFlow 首席执行官 Petar Tsankov 告诉记者。“欧盟委员会支持这一点。我们希望社区和行业继续开发该框架，以打造一个全面而全面的人工智能法案评估平台。”

总结迄今为止的主要结论，Tsankov 表示，很明显，AI 模型“主要针对能力而非合规性进行了优化”。他还指出了“明显的性能差距”——指出一些高能力模型在合规性方面可以与较弱的模型相提并论。

Tsankov 表示，网络攻击恢复力（在模型层面）和公平性是特别令人关注的领域，许多模型在前者方面的得分低于 50%。

他说：“虽然 Anthropic 和 OpenAI 已成功调整其（封闭）模型以防止越狱和提示注入，但 Mistral 等开源供应商却不太重视这一点。”

由于“大多数模型”在公平性基准上的表现同样糟糕，他建议这应该成为未来工作的重点。

关于在版权和隐私等领域对法学硕士绩效进行基准测试的挑战，Tsankov 解释道：“对于版权而言，挑战在于当前的基准测试仅检查版权书籍。这种方法有两个主要限制：(i) 它不考虑涉及除这些特定书籍之外的材料的潜在版权侵权行为，以及 (ii) 它依赖于量化模型记忆，这是出了名的困难。

“对于隐私而言，挑战是类似的：基准仅试图确定模型是否记住了特定的个人信息。”

LatticeFlow 热切希望更广泛的人工智能研究社区能够采用和改进免费开源框架。

苏黎世联邦理工学院教授、INSAIT 创始人兼科学主任 Martin Vechev 也参与了这项工作，他在一份声明中表示：“我们邀请人工智能研究人员、开发者和监管者加入我们，共同推进这一不断发展的项目。我们鼓励其他研究团体和从业者通过完善《人工智能法案》规划、增加新基准和扩展这一开源框架做出贡献。”

“该方法还可以扩展到根据欧盟人工智能法案以外的未来监管法案评估人工智能模型，使其成为跨不同司法管辖区的组织的宝贵工具。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/gai-fa-xue-shuo-shi-kuang-jia-shou-ci-chang-shi-dui-big-ai

Big AI Compl-AI GPT LatticeFlow LLM OpenAI 人工智能大型语言模型欧盟人工智能法案

Like (0)

王浩然作者

0 0

Fable 获 2500 万美元融资，为辅助功能添加认知和听力障碍功能

Previous 2024年10月17日

支持自动化公司的能力随着新现金和收购而增长

Next 2024年10月17日

AI前沿

亚马逊推出针对卖家的人工智能助手 Project Amelia

亚马逊卖家现在可以使用人工智能助手，该助手旨在通过回答有关其指标的问题来帮助他们发展业务，以后可能能够帮助他们直接解决出现的问题。该助手代号为 Project Amelia，基于 …

王浩然
2024年9月20日
000
AI前沿

什么阻碍了数字孪生的演进和应用？

数字孪生技术具有巨大的潜力，它能够创建物理对象、流程和环境的数字复制品，可应用于各个行业，从复制危险环境到展示用于远程培训的航天器。麦肯锡最近的分析表明，人们对数字孪生的兴趣非常浓…

点点
2024年10月24日
000
AI前沿

GitHub 的 Copilot 登陆 Apple 的 Xcode

GitHub 在 Universe 大会上宣布了一系列重要新产品，包括完全使用 AI 编写应用程序的 Spark 项目，以及对其 Copilot 服务的多模型支持。但 Copilo…

王浩然
2024年10月30日
000
AI前沿

埃隆·马斯克再次起诉 OpenAI 对 AI 行业意味着什么

埃隆·马斯克最近对 OpenAI、其首席执行官山姆·奥特曼和联合创始人格雷格·布罗克曼发起了新的联邦诉讼，重新点燃了一场可能对人工智能行业产生重大影响的法律战。这起诉讼于 8 月初…

王浩然
2024年8月23日
012
AI前沿

从伊隆·马斯克到警车追逐，一名软件工程师如何创办一家警用 AI 初创公司

今年早些时候，Abel创始人 Daniel Francis 驾驶一辆汽车在加利福尼亚州奥克兰的高速公路上以每小时 135 英里的速度行驶。司机是一名警察，腿上放着一把枪。弗朗…

点点
2024年10月19日
000
AI前沿

Nvidia 发布更多工具和护栏，推动企业采用人工智能代理

Nvidia 发布了三项新的 NIM 微服务，即大型应用程序一部分的小型独立服务，以帮助企业为其 AI 代理带来额外的控制和安全措施。其中一项新的 NIM 服务针对内容安全，旨在…

王浩然
2025年1月17日
000
AI前沿

腾讯的 EzAudio AI 将文本转换为逼真的声音，引发创新和争论

约翰霍普金斯大学和腾讯 AI 实验室的研究人员推出了EzAudio，这是一种新的文本转音频 (T2A) 生成模型，有望以前所未有的效率从文本提示中产生高质量的音效。这一进步标志着人…

王浩然
2024年9月22日
000
AI前沿

Jony Ive 正在与 OpenAI 合作创办一家 AI 设备初创公司

五年前离开苹果全职职位的传奇设计师乔纳森·艾维 (Jony Ive)正在与 OpenAI 及其首席执行官萨姆·奥特曼 (Sam Altman) 合作创办一家新的创业公司。此次合作…

点点
2024年9月23日
000
AI前沿

Together AI 3.05亿美元赌注：DeepSeek-R1等推理模型正在增加而非减少GPU需求‌重写并翻译后的内容

DeepSeek-R1刚出现时，业界普遍担忧先进推理能力的实现可能会减少对基础设施的需求。然而，事实证明情况并非如此。至少，根据Together AI的说法，DeepSeek和开源…

王浩然
2025年2月22日
000
AI前沿

低致幻性人工智能微剂量给药

Agentforce已经到来。今年 9 月，Salesforce 结束了又一次年度Dreamforce 大会。加入众多与会者——以及在格外干净的旧金山穿梭的 Waymos 大军——…

点点
2024年10月8日
000
AI前沿

人工智能在医疗保健领域的应用，用于药物研发、数据和成像

Nvidia 正在帮助促进数字健康代理的采用，以在美国医疗保健系统中部署人工智能

点点
2024年10月16日
000
AI前沿

Hume 推出语音控制功能，让用户和开发者可以发出自定义 AI 声音

Hume AI是一家专注于情感智能语音界面的初创公司，它推出了语音控制，这是一项实验性功能，使开发人员和用户能够通过精确调节声音特征来创建自定义 AI 声音 – 无需编…

王浩然
2024年12月3日
000
AI前沿

IBM Insights：人工智能如何支持全球生物多样性保护

IBM 探索其技术如何帮助理解生态系统繁荣所依赖的因素人工智能处理海量数据和发现模式的能力可以帮助理解影响当地和全球生物多样性的复杂、相互关联的因果因素。 IBM 最近强调了AI…

王浩然
2024年11月4日
000
AI前沿

人工智能阅读教练初创公司 Ello 现在让孩子们创作自己的故事

Ello是一款旨在帮助阅读困难儿童的人工智能阅读伴侣，它于周一推出了一款新产品，让孩子们可以参与故事创作过程。这项名为“Storytime”的人工智能新功能可以帮助孩子们从一系…

王浩然
2024年10月1日
000
AI前沿

又热闹了，OpenAI的加强版“Her”正式开放，压过了Gemini的“生产级”大升级

今天真是AI圈久违了的热闹一天啊！昨天刚被奥特曼发的那篇AI小作文搞得一头雾水，现在他这波操作的意图就呼之欲出了。奥特曼想临门狙击的正是宿敌Google，更确切地说，是Goog…

点点
2024年9月25日
000
AI前沿

对抗人工智能“永动机”的不同方法

TechCrunch Disrupt 2024的人工智能舞台以一场关于打击虚假信息的小组讨论开场，气氛热烈但富有建设性。但在充满尊重和赞同的激烈意见交流中，三位小组成员都对社交媒体…

王浩然
2024年10月31日
000
AI前沿

亚马逊关闭更多无收银员便利店

亚马逊已关闭另外三家采用“Just Walk Out”技术的商店，但该公司表示，仍致力于将该技术拓展为第三方商家的服务。据The Information周五证实，这家电子商务巨头…

王浩然
2024年10月8日
000
AI前沿

大型语言模型如何揭开“黑箱”人工智能的神秘面纱

人工智能正成为我们日常生活中越来越重要的一部分。然而，尽管人工智能功能强大，但许多人工智能系统仍然像“黑匣子”一样工作。它们会做出决策和预测，但很难理解它们是如何得出这些结论的。这…

王浩然
2024年12月27日
000
AI前沿

人工智能如何塑造民主对话的未来

在当今政治两极分化的世界中，在复杂的社会和政治问题上找到共同点变得越来越困难。随着社会变得越来越多元化，气候变化、移民和经济政策等关键问题上的分歧只会越来越大。让人们聚在一起就复杂…

点点
2024年11月5日
000
AI前沿

Verizon 以 200 亿美元收购 Frontier Communications

此次收购扩大了 Verizon 的覆盖范围，并扩展了其智能边缘网络，以实现包括人工智能和物联网在内的数字创新

点点
2024年9月7日
000