许多公司不愿透露是否会遵守加州的人工智能培训透明度法

王浩然 • 2024年10月7日上午11:00 • AI前沿 • 129 views

周日，加州州长加文·纽瑟姆签署了一项法案AB-2013，要求开发生成式人工智能系统的公司发布用于训练其系统的数据的高级摘要。除其他事项外，摘要必须涵盖谁拥有数据、数据是如何获得或授权的，以及数据是否包含任何版权或个人信息。

很少有人工智能公司愿意表示他们是否会遵守，人工智能领域的主要参与者，包括 OpenAI、Anthropic、微软、谷歌、亚马逊、Meta，以及初创公司 Stability AI、Midjourney、Udio、Suno、Runway 和 Luma Labs。只有不到一半的公司做出了回应，而微软这家供应商明确拒绝发表评论。

只有 Stability、Runway 和 OpenAI 表示他们将遵守 AB-2013。

OpenAI 的一位发言人表示：“OpenAI 遵守我们运营所在司法管辖区的法律，包括这个司法管辖区。”Stability 的一位发言人表示，该公司“支持既能保护公众又不会扼杀创新的周到监管”。

公平地说，AB-2013 的披露要求不会立即生效。虽然它们适用于 2022 年 1 月或之后发布的系统（例如 ChatGPT 和 Stable Diffusion），但公司必须在 2026 年 1 月之前开始发布训练数据摘要。该法律也仅适用于向加州人提供的系统，留下了一些回旋余地。

但供应商对此事保持沉默可能还有另一个原因，这与大多数生成式人工智能系统的训练方式有关。

训练数据通常来自网络。供应商从网站上抓取大量图片、歌曲、视频等，并以此训练他们的系统。

多年前，AI 开发人员通常会在模型发布时附上技术论文，列出其训练数据的来源。例如，谷歌曾透露，它在公开的LAION数据集上训练了其图像生成模型系列Imagen的早期版本。许多较早的论文都提到了 The Pile，这是一个包含学术研究和代码库的开源训练文本集合。

在当今竞争激烈的市场中，训练数据集的构成被视为一种竞争优势，各公司将此作为不披露训练数据集的主要原因之一。但训练数据细节也可能成为开发人员的法律目标。LAION 链接到受版权保护和侵犯隐私的图像，而 The Pile 包含Books3，这是 Stephen King 和其他作者的盗版作品库。

目前已有多起针对滥用训练数据的诉讼，而且每个月都有更多诉讼被提起。

作家和出版商声称OpenAI、Anthropic 和 Meta 使用受版权保护的书籍（其中一些来自 Books3）进行训练。唱片公司已将 Udio 和 Suno 告上法庭，指控他们使用歌曲进行训练却不向音乐家支付报酬。艺术家们已对 Stability 和 Midjourney提起集体诉讼，称他们的数据抓取行为相当于盗窃。

不难看出 AB-2013 可能会给那些试图避免法庭纠纷的供应商带来麻烦。该法律要求公开一系列可能对训练数据集产生影响的规范，包括一份说明这些数据集首次使用时间以及数据收集是否正在进行的通知。

AB-2013 的范围相当广泛。任何“大幅修改”人工智能系统的实体（即对其进行微调或重新训练）也必须发布他们用于这样做的训练数据的信息。该法律有一些例外，但它们主要适用于网络安全和国防中使用的人工智能系统，例如用于“国家领空内飞机运行”的人工智能系统。

当然，许多供应商认为合理使用原则提供了法律保障，他们在法庭和公开声明中都坚持这一点。Meta 和 Google 等一些公司已经更改了其平台的设置和服务条款，以允许他们利用更多用户数据进行培训。

迫于竞争压力，加上相信合理使用辩护最终会胜出，一些公司大肆利用受知识产权保护的数据进行训练。路透社的报道显示，Meta 曾一度使用受版权保护的书籍进行 AI 训练，尽管其律师发出了警告。有证据表明，Runway 采购了 Netflix 和迪士尼的电影来训练其视频生成系统。据报道，OpenAI在未经创作者知情的情况下转录 YouTube 视频以开发模型，包括 GPT-4。

正如我们之前所写，最终的结果是，生成式人工智能供应商可以逍遥法外，无论是否披露系统训练数据。法院最终可能会站在合理使用支持者一边，并判定生成式人工智能具有足够的变革性——而不是《纽约时报》和其他原告所指控的抄袭引擎。

在更戏剧性的情况下，AB-2013 可能会导致供应商在加州扣留某些模型，或向加州人发布仅使用合理使用和授权数据集训练的模型版本。一些供应商可能会认为，AB-2013 最安全的做法是避免泄露信息（并避免引发诉讼）。

假设该法律没有受到挑战或被搁置，那么一年多后，AB-2013 的最后期限一到，我们就会有一个清晰的认识。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/xu-duo-gong-si-bu-yuan-tou-lu-shi-fou-hui-zun-shou-jia-zhou

Like (0)

王浩然作者

0 0

甚至连“人工智能教母”都不知道 AGI 是什么

Previous 2024年10月7日

法规是助力还是阻碍：Cloudflare 的看法

Next 2024年10月7日

AI前沿

亚马逊因人类投资避开英国反垄断审查

英国反垄断机构得出结论：由于交易的规模和范围，亚马逊与人工智能初创公司 Anthropic 的合作和股权投资不能根据现行的合并规则进行调查。英国竞争与市场管理局 (CMA) 宣布…

王浩然
2024年9月29日
000
AI前沿

Uplimit：以AI赋能企业培训，同时培训千名员工

在数字化时代，企业面临着前所未有的挑战和机遇。为了保持竞争力，企业必须不断提升员工的技能和知识。然而，传统的企业培训方式往往效率低下，难以满足大规模、快速培训的需求。近日，Upli…

王浩然
5天前
000
AI前沿

Together AI 有望通过私有云企业 AI 平台实现更快的推理速度和更低的成本

在公共云中运行人工智能可能会给企业带来许多有关数据隐私和安全的担忧。这就是为什么一些企业会选择在私有云或本地环境中部署 AI。Together AI是寻求解决挑战的供应商之一，这…

王浩然
2024年9月24日
000
AI前沿

GibberLink：让AI代理以机器语言互相“通话”‌

在人工智能领域，随着技术的不断进步，AI代理间的通信成为了一个备受关注的课题。近日，一款名为GibberLink的创新技术横空出世，它实现了AI代理之间以一种独特的“机器语言”进行…

王浩然
2025年3月8日
000
AI前沿

文学作品机器翻译的新方法

将《战争与和平》等文学经典翻译成其他语言往往会导致作者的独特风格和文化差异消失。解决文学翻译中这一长期存在的挑战对于保留作品精髓并让其在全球范围内传播至关重要。TransAgent…

点点
2024年10月4日
000
AI前沿

Hume 推出语音控制功能，让用户和开发者可以发出自定义 AI 声音

Hume AI是一家专注于情感智能语音界面的初创公司，它推出了语音控制，这是一项实验性功能，使开发人员和用户能够通过精确调节声音特征来创建自定义 AI 声音 – 无需编…

王浩然
2024年12月3日
000
AI前沿

人形机器人为中国汽车制造商制造汽车

一家中国汽车制造商推出了一款新型轮式人形机器人，据称该机器人将于 2026 年开始应用于汽车制造。国有企业广州汽车集团在上海的一场活动上发布了第三代GoMate。 GoMate…

王浩然
2025年1月3日
000
AI前沿

Meta 引领开源 AI 热潮，Llama 下载量同比增长 10 倍

开源 AI 终于接近闭源 AI 的主导地位。今天，开放模型类别的领先参与者之一Meta分享了一份年中更新，声称其 Llama 系列模型的采用率已飙升至新高，尤其是自上个月发布大型 …

王浩然
2024年9月3日
000
AI前沿

色情生成器、作弊工具和“专家”医疗建议：深入探究OpenAI的定制聊天机器人市场

Gizmodo 对 OpenAI 的 GPT 商店进行的分析发现，超过 100 种工具似乎违反了该公司关于性内容、欺骗、法律和医疗建议、赌博、虚假评论生成和浪漫陪伴的政策。去年 …

王浩然
2024年9月5日
000
AI前沿

研究人员质疑人工智能的“推理”能力，因为模型在解决数学问题时出现了微小的变化

机器学习模型是如何做到的？它们真的像我们一样“思考”或“推理”吗？这既是一个哲学问题，也是一个实践问题，但周五发表的一篇新论文表明，答案至少就目前而言，是一个相当明确的“不”。苹…

王浩然
2024年10月12日
000
AI前沿

未来博物馆设计新范式：对话创意总监布兰登·麦吉特里克

在迪拜的沙漠天际线上，一座银色的环形建筑如同来自科幻电影中的太空站，吸引着全球目光——这便是被誉为“2071年时间胶囊”的迪拜未来博物馆。作为该项目创意总监的布兰登·麦吉特里克，在…

王浩然
2025年4月2日
000
AI前沿

“不受限制”的人工智能集团 Nous Research 推出首个聊天机器人

Nous Research是一家致力于创建“个性化、不受限制”的人工智能模型的人工智能研究机构，旨在替代 OpenAI、Anthropic、Google、Meta 等较为保守的企业…

王浩然
2024年11月9日
000
AI前沿

智能手机上有 AI？Hugging Face 的 SmolLM2 将强大的模型带到你的手掌上

Hugging Face今天发布了SmolLM2，这是一组新的紧凑型语言模型，它实现了令人印象深刻的性能，同时所需的计算资源比大型模型少得多。新模型采用 Apache 2.0 许…

王浩然
2024年11月3日
000
AI前沿

人工智能寒冬：炒作、失望和复苏的循环

术语“人工智能寒冬”指的是人工智能研发资金削减的一段时期，通常是由于过度炒作的预期未能实现所致。从 OpenAI 的 GPT-4o 到谷歌的 AI 概览，最近的生成式 AI 系统…

点点
2024年9月10日
000
AI前沿

CyberHavens的AI数据血统工具：助力安全团队事件响应速度提升80%

一、引言：网络安全的新纪元在当今数字化时代，网络攻击事件频发，给企业和个人带来了前所未有的安全挑战。为了应对这些威胁，安全团队需要高效、精准的工具来监测、分析和响应安全事件。Cy…

王浩然
2025年3月28日
000
AI前沿

因卡马拉·哈里斯深度伪造案，法官阻止加州实施新 AI 法

周三，一名联邦法官阻止了加州一项新的人工智能法律的通过，而该法律刚由州长加文·纽森签署，不到两周。签署 AB 2839 后不久，纽森表示，该法律可能被用来迫使埃隆·马斯克删除他转发…

王浩然
2024年10月4日
000
AI前沿

据报道，前 OpenAI 首席技术官 Mira Murati 正在为一家新的 AI 初创公司筹集资金

据路透社报道，上个月宣布离职的OpenAI 首席技术官米拉·穆拉蒂 (Mira Murati)正在为一家新的人工智能初创公司筹集风险投资资金。据报道，这家初创公司将专注于构建基于…

王浩然
2024年10月20日
000
AI前沿

OpenAI放宽ChatGPT图像创作的安全措施

OpenAI，这家全球领先的人工智能公司，近日宣布对其备受争议的ChatGPT工具进行重大更新。此次更新的核心在于，OpenAI放宽了ChatGPT在图像创作方面的安全限制，这一决…

王浩然
2025年3月29日
000
AI前沿

DeepMind 的 Demis Hassabis 和 John Jumper 因 AlphaFold 荣获诺贝尔化学奖

本周是人工智能领域诺贝尔奖的重要一周。瑞典皇家科学院今天宣布了 2024 年诺贝尔化学奖获奖者，DeepMind 首席执行官Demis Hassabis和主任John Jum…

王浩然
2024年10月10日
000
AI前沿

为什么 2025 年将成为 AI 编排之年

在科技界，我们喜欢将某个时期称为（此处插入里程碑）之年。过去的一年（2024 年）是人工智能和代理用例进行更广泛实验的一年。 2025 年即将到来，采访了行业分析师和 …

王浩然
2024年12月31日
000

发表回复

Please Login to Comment

许多公司不愿透露是否会遵守加州的人工智能培训透明度法

相关推荐

发表回复

Share To :