DeepMind 和 Hugging Face 发布 SynthID，为 LLM 生成的文本添加水印

王浩然 • 2024年10月26日下午8:00 • AI前沿 • 120 views

Google DeepMind和Hugging Face刚刚发布了SynthID Text，这是一款用于标记和检测大型语言模型(LLM) 生成的文本的工具。SynthID Text 将水印编码到 AI 生成的文本中，以帮助确定它是否由特定的 LLM 生成。更重要的是，它这样做不会修改底层 LLM 的工作方式或降低生成文本的质量。

SynthID Text 背后的技术是由 DeepMind 的研究人员开发的，并在 10 月 23 日发表在《自然》杂志上的一篇论文中进行了介绍。SynthID Text 的实现已添加到 Hugging Face 的 Transformers 库中，该库用于创建基于 LLM 的应用程序。值得注意的是，SynthID 并非用于检测由 LLM 生成的任何文本。它旨在为特定 LLM 的输出添加水印。

使用 SynthID 不需要重新训练底层 LLM。它使用一组参数来配置水印强度和响应保存之间的平衡。使用 LLM 的企业可以针对不同的模型使用不同的水印配置。这些配置应安全且私密地存储，以避免被他人复制。

对于每个水印配置，您必须训练一个分类器模型，该模型接收一个文本序列并确定它是否包含模型的水印。可以使用几千个已使用指定配置加水印的正常文本和响应示例来训练水印检测器。

SynthID Text 的工作原理

水印是一个活跃的研究领域，尤其是随着法学硕士在不同领域和应用中的兴起和采用。公司和机构正在寻找检测人工智能生成的文本的方法，以防止大规模的虚假信息活动、控制人工智能生成的内容并防止在教育中使用人工智能工具。

目前存在多种为 LLM 生成的文本添加水印的技术，每种技术都有局限性。有些技术需要收集和存储敏感信息，而有些技术则需要在模型生成响应后进行计算量很大的处理。

SynthID 使用“生成建模”，这是一类不影响 LLM 训练且仅修改模型采样过程的水印技术。生成水印技术修改下一个标记生成过程，对生成的文本进行细微的、上下文特定的更改。这些修改在生成的文本中创建统计签名，同时保持其质量。

然后训练分类器模型来检测水印的统计特征，以确定响应是否由模型生成。该技术的一个主要优点是检测水印的计算效率高，并且不需要访问底层 LLM。

SynthID Text 以之前关于生成水印的研究为基础，使用一种名为“锦标赛采样”的新型采样算法，该算法使用多阶段过程在创建水印时选择下一个标记。水印技术使用伪随机函数来增强任何 LLM 的生成过程，使得水印对人类来说是不可察觉的，但对经过训练的分类器模型来说是可见的。集成到 Hugging Face 库中将使开发人员可以轻松地将水印功能添加到现有应用程序中。

为了证明水印在大规模生产系统中的可行性，DeepMind 的研究人员进行了一项现场实验，评估了Gemini 模型生成的近 2000 万条响应的反馈。他们的研究结果表明，SynthID 能够保留响应质量，同时仍可被分类器检测到。

据 DeepMind 介绍，SynthID-Text 已被用于为 Gemini 和 Gemini Advanced 加水印。

他们在论文中写道：“这充分证明了生成文本水印可以成功实现并扩展到现实世界的生产系统，为数百万用户提供服务，并在人工智能生成内容的识别和管理中发挥不可或缺的作用。”

限制

据研究人员介绍，SynthID Text 对一些生成后转换（例如裁剪文本片段或修改生成文本中的几个单词）具有很强的鲁棒性。它在一定程度上也能抵御释义。

然而，该技术也有一些局限性。例如，对于需要事实性回答的查询，它的效果较差，而且没有修改的空间，否则准确性会降低。他们还警告说，当文本被彻底重写时，水印检测器的质量可能会大幅下降。

他们写道：“SynthID Text 并非旨在直接阻止有动机的对手造成伤害。但是，它可以使人工智能生成的内容更难用于恶意目的，并且可以与其他方法相结合，以更好地覆盖各种内容类型和平台。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/deepmind-he-hugging-face-fa-bu-synthid-wei-llm-sheng-cheng

Like (0)

王浩然作者

0 0

LinkedIn 创始人 Reid Hoffman 在 TED AI 大会上公布“超级机构”愿景，巧妙抨击埃隆·马斯克

Previous 2024年10月26日

ServiceNow 提倡使用“隐形”人工智能代理来简化工人的采用

Next 2024年10月26日

AI前沿

人工智能如何重塑汽车保险从索赔到合规的全过程

汽车保险行业正在经历一场变革，人工智能正在重塑从索赔处理到合规性的一切。人工智能不仅是一种运营工具，而且是实现客户价值的战略差异化因素。人工智能的进步正在提高承保精度、简化索赔管…

点点
2024年10月11日
000
AI前沿

研究表明，人工智能模型在用西班牙语提问时错误率更高

人工智能模型很难用西班牙语准确回答与选举相关的问题。这是AI Democracy Projects 的一项新研究得出的结论，该项目是 Proof News、事实核查服务 Fact…

王浩然
2024年10月31日
000
AI前沿

谷歌日历新增Gemini面板，助力日程管理‌

近日，谷歌在其广受欢迎的日历应用中引入了一项创新功能——Gemini面板。这一新面板旨在为用户提供更为便捷、高效的日程管理方式，从而帮助用户更好地规划日常生活和工作。 Gemini…

王浩然
2025年3月10日
000
AI前沿

离开OpenAI后，Ilya拿了10亿美金对抗AI作恶

当地时间 9 月 4 日，OpenAI 前联合创始人 Ilya Sutskever 所创立的 AI 初创公司 SSI（Safe Superintelligence）在其社交媒体官方…

点点
2024年9月7日
000
AI前沿

这款人工智能发明机器可自动实现“尤里卡时刻”

在瑞士洛桑郊外，一间贴满专利图纸的会议室里，伊奥尼斯·伊里德斯 (Ioannis Ierides)面临着一个典型的销售挑战：在客户注意力集中的短暂时间内展示其产品的优势。伊里德斯是…

王浩然
2024年10月20日
000
AI前沿

字节跳动的 UI-TARS 可以接管你的电脑，性能优于 GPT-4o 和 Claude

TikTok 母公司推出了一款新的 AI 代理，可以控制您的计算机并执行复杂的工作流程。与 Anthropic 的Computer Use非常相似，字节跳动的新 UI-TARS …

王浩然
2025年1月23日
000
AI前沿

DeepMind 的 Genie 2 可以生成类似视频游戏的交互式世界

谷歌的人工智能研究机构 DeepMind 推出了一个可以生成“无限”可玩 3D 世界的模型。该模型名为 Genie 2，是今年早些时候发布的 DeepMind Genie 的继任…

王浩然
2024年12月5日
000
AI前沿

全新高质量 AI 视频生成器 Pyramid Flow 推出 — — 而且它是完全开源的！

人工智能视频生成模型的数量不断增长，本周推出了一种新的模型Pyramid Flow，它可以提供长达 10 秒的高质量视频片段——速度快，而且全部开源。 Pyramid Flow由北…

王浩然
2024年10月15日
000
AI前沿

亚马逊携手AI机器人，开启仓库自动化新纪元

亚马逊与机器人软件公司Covariant签署了一项新的商业协议，包括聘用该公司的员工，以加速其仓库的自动化进程。通过新协议，亚马逊将获得 Covariant 机器人基础模型的非…

点点
2024年9月7日
000
AI前沿

埃隆·马斯克的 xAI 搬进了 OpenAI 的旧总部

旧金山的 Mission 区并不以公司办公室而闻名，但它现在是两家全球资金最雄厚的人工智能初创公司的所在地。据《旧金山商业时报》报道，埃隆马斯克的人工智能初创公司 xAI 最近搬…

王浩然
2024年10月4日
000
AI前沿

从人工智能炒作转向实用、道德和可持续的实施

无论炒作周期如何，人工智能都不再是一个遥不可及的梦想，而是一个切实存在的现实。几十年来，在生成式人工智能出现之前，这项技术在改变行业和重塑我们的经营方式方面发挥了关键作用。然而，在…

AI News
2024年9月6日
000
AI前沿

通过智能数据映射和检索打破云备份“黑匣子”

自计算机诞生之初，企业就一直使用备份来保护其业务关键信息。成功建立的云备份态势可确保组织在自然灾害或系统故障等不可预见的事件中不受影响。然而，即使企业技术堆栈的规模和复杂性成倍增长…

王浩然
2024年11月28日
000
AI前沿

Android 版 Gmail 用户现可与 Gemini 聊天讨论电子邮件

Android 设备上的 Gmail 用户现在可以直接与 Google 的 AI 助手 Gemini 聊天，讨论 Gmail 应用中的电子邮件。据一篇博客文章称，Google 于周…

王浩然
2024年8月30日
000
AI前沿

企业 AI 从“实验”走向“必要”，支出增长 130%

一项新研究表明，生成式人工智能已迅速从一项实验技术转变为一种重要的商业工具，到 2024 年其采用率将增加一倍以上。这项研究由宾夕法尼亚大学沃顿商学院的研究中心AI …

王浩然
2024年10月29日
000
AI前沿

人工智能增强人力资源，但以人为本的方法不可或缺

随着人工智能 (AI) 在人力资源领域不断开辟新天地，其接受度也越来越高。最近的一项研究显示，近一半接受调查的英国和美国员工认为人工智能有助于减少偏见和不公平的招聘待遇；许多人甚至…

王浩然
2025年1月13日
000
AI前沿

加州州长签署 9 项法案，规范人工智能生成内容

立法旨在解决深度伪造带来的风险

点点
2024年9月27日
000
AI前沿

解读 OpenAI 的超级碗广告和 Sam Altman 的夸张博客文章

如果您是今年收看 NFL 超级碗 LIX 的近4000 万美国家庭之一，那么除了观看费城老鹰队击败堪萨斯城酋长队之外，您可能还会看到 OpenAI 的广告。这是该公司的首个超级碗…

王浩然
2025年2月11日
000
AI前沿

AGI 的到来比我们想象的要快——我们必须做好准备

包括 Anthropic 的 Dario Amodei 和 OpenAI 的 Sam Altman 在内的人工智能领域的领军人物表示，“强大的人工智能”甚至超级智能可能会在未来 2…

王浩然
2024年11月11日
000
AI前沿

为什么 ChatGPT 的数学这么差？

如果你曾经尝试将 ChatGPT 用作计算器，你几乎肯定会注意到它的计算障碍：聊天机器人数学不好。在这方面，它并不是 AI 中独一无二的。 Anthropic 的Claude无法解…

王浩然
2024年10月3日
000
AI前沿

AI谎言探测器：HallOumi的开源幻觉检测方法如何解锁企业AI应用

在推动企业AI部署的竞赛中，一个长期存在的障碍始终阻碍着前进的步伐：幻觉。这些由AI系统产生的虚假响应，已经导致了一系列问题，从律师面临的法律制裁到公司被迫遵守虚构的政策。为了解决…

王浩然
2天前
000

发表回复

Please Login to Comment

DeepMind 和 Hugging Face 发布 SynthID，为 LLM 生成的文本添加水印

SynthID Text 的工作原理

限制

相关推荐

发表回复

Share To :