早在5 月份,OpenAI 就表示正在开发一款工具,让创作者可以指定他们希望自己的作品如何纳入或排除在其 AI 训练数据中。但 7 个月过去了,这项功能仍未面世。
OpenAI 当时表示,该工具名为“媒体管理器”,可以“识别受版权保护的文本、图像、音频和视频”,以反映创作者“跨多个来源”的偏好。它旨在避开公司一些最激烈的 批评者,并可能保护 OpenAI 免受与知识产权相关的法律挑战。
但知情人士表示,该工具在内部很少被视为重要发布。“我不认为这是一个优先事项,”一位前 OpenAI 员工说。“说实话,我不记得有人在开发它。”
一位负责协调公司工作的非员工去年 12 月表示,他们过去曾与 OpenAI 讨论过这款工具,但最近没有任何进展。(由于讨论机密商业事宜,这些人士拒绝公开身份。)
而 OpenAI 法律团队中一位曾担任媒体经理的 Fred von Lohmann 则于 10 月转任兼职顾问。OpenAI PR 通过电子邮件证实了 Von Lohmann 转投的消息。
OpenAI 尚未公布媒体管理器的进展情况,该公司错过了自己设定的“2025 年之前”推出该工具的最后期限。(需要明确的是,“2025 年之前”可以理解为包括 2025 年,但记者将 OpenAI 的语言解读为到 2025 年 1 月 1 日。)
知识产权问题
OpenAI等人工智能模型会学习数据集中的模式,然后做出预测——例如,一个人咬汉堡会留下咬痕。这让模型能够通过观察世界,在一定程度上了解世界是如何运转的。ChatGPT可以写出令人信服的电子邮件和文章,而OpenAI 的视频生成器Sora可以制作相对逼真的镜头。
能够借鉴写作、电影等范例来创作新作品,让人工智能变得异常强大。但它也有反刍性。当以某种方式提示时,模型(其中大多数是在无数网页、视频和图像上进行训练的)会生成这些数据的近似副本,尽管这些数据是“公开的”,但并不适合以这种方式使用。
例如,Sora 可以生成带有 TikTok 徽标和流行视频游戏角色的剪辑。《纽约时报》已让 ChatGPT 逐字引用其文章(OpenAI 将此行为归咎于“黑客攻击”)。
这自然会让那些作品未经许可就被纳入人工智能训练的创作者感到不安。许多人已经聘请了律师。
OpenAI 正在应对艺术家、作家、 YouTube 用户、计算机科学家和新闻机构提起的集体诉讼,所有这些人都声称这家初创公司非法训练他们的作品。原告包括作家 Sarah Silverman 和 Ta Nehisi-Coates、视觉艺术家以及《纽约时报》和加拿大广播公司等媒体集团。
OpenAI 已与精选合作伙伴达成许可 协议 ,但并非所有创造者都认为这些条款具有吸引力。
管理媒体
OpenAI 为创作者提供了几种“退出”人工智能训练的临时方式。去年 9 月,该公司推出了一个提交表单,允许艺术家标记自己的作品,以便从未来的训练集中删除。而且 OpenAI 长期以来一直允许网站管理员阻止其网络爬虫程序在其域中抓取数据。
但创作者批评这些方法杂乱无章,不够充分。对于书面作品、视频或录音,没有具体的退出机制。而对于图像的退出表格则要求提交每张要删除的图像的副本以及说明,这是一个繁琐的过程。
今天,媒体管理器被宣传为 OpenAI 退出解决方案的彻底改进和扩展。
OpenAI 在 5 月份的公告中表示,Media Manager 将使用“尖端机器学习研究”,使创作者和内容所有者能够“告诉 [OpenAI] 他们拥有什么”。OpenAI 声称在开发该工具时正在与监管机构合作,并表示希望 Media Manager 能够“为整个 AI 行业树立标准”。
从那以后,OpenAI 再也没有公开提及过媒体管理器。
一位发言人说,截至 8 月份该工具“仍在开发中”,但没有回应 12 月中旬的后续评论请求。
OpenAI 尚未透露媒体管理器何时推出,甚至没有透露其将具备哪些功能和性能。
合理使用
假设媒体管理器确实在某个时候出现,专家们并不相信它能减轻创作者的担忧,或者在解决围绕人工智能和知识产权使用的法律问题方面发挥很大作用。
Stubbs Alderton & Markiles 的知识产权律师 Adrian Cyhan 指出,Media Manager 是一项雄心勃勃的事业。即使是像 YouTube 和 TikTok 这样的大型平台也难以 大规模实现内容识别。OpenAI 真的能做得更好吗?
西汉说:“确保遵守法律要求的创作者保护和潜在的补偿要求是一项挑战,尤其是考虑到国家和地方司法管辖区内法律环境的快速发展和潜在差异。”
非营利组织 Fairly Trained 的创始人 Ed Newton-Rex 致力于确保人工智能公司尊重创作者的权利。他认为,Media Manager 会不公平地将控制人工智能训练的负担转嫁给创作者;如果不使用这项技术,创作者可能会默许他们的作品被使用。他说:“大多数创作者甚至都不会听说过它,更不用说使用它了。但它仍然会被用来保护创造性作品不受创作者意愿的大规模利用。”
MBHB 人工智能实践小组联合主席 Mike Borella 指出,选择退出系统并不总是考虑到对作品可能进行的转换,例如图像被下采样。Pryor Cashman 的知识产权和媒体律师 Joshua Weigensberg 补充说,它们也可能无法解决第三方平台托管创作者内容副本的常见情况。
“创作者和版权所有者无法控制,甚至通常不知道他们的作品在互联网上出现在哪里,”魏根斯伯格说。“即使创作者告诉每一个人工智能平台他们选择退出训练,这些公司仍可能会继续使用第三方网站和服务上提供的作品副本进行训练。”
至少从法理学的角度来看,Media Manager 对 OpenAI 来说可能并不是特别有利。Dorsey & Whitney 专门从事版权法的合伙人 Evan Everist 表示,虽然 OpenAI 可以使用该工具向法官证明其正在减轻对受知识产权保护的内容的训练,但如果发现公司侵权,Media Manager 可能不会保护该公司免受损害。
“版权所有者没有义务在侵权行为发生之前预先告知他人不要侵犯其作品,”Everist 说。“版权法的基本原则仍然适用——即未经许可不得盗用和复制他人的作品。此功能可能更多地与公关有关,并将 OpenAI 定位为内容的道德用户。”
清算
在没有媒体管理器的情况下,OpenAI 实施了过滤器(尽管并不完善),以防止其模型重复训练示例。在它所面临的诉讼中,该公司继续声称享有合理使用保护,声称其模型创造的是变革性作品,而不是抄袭作品。
OpenAI 很有可能在版权纠纷中获胜。
法院可能会判定该公司的人工智能具有“变革性目的”,这是 大约十年前出版业起诉谷歌的先例 。在那起案件中,法院裁定谷歌复制数百万本图书用于谷歌图书(一种数字档案)是允许的。
OpenAI 曾公开表示,如果不使用受版权保护的材料(无论是否授权),训练具有竞争力的人工智能模型是“不可能的”。该公司在 1 月份提交给英国上议院的一份文件中写道:“将训练数据限制在一个多世纪前创作的公共领域书籍和图画中可能会产生一个有趣的实验,但不会提供满足当今公民需求的人工智能系统。”
如果法院最终宣布 OpenAI 胜诉,那么 Media Manager 就没有什么法律意义了。OpenAI 似乎愿意下这个赌注——或者重新考虑其退出策略。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/openai-wei-neng-zai-2025-nian-zhi-qian-ti-gong-qi-cheng-nuo