ChatGPT 引用研究让出版商感到沮丧

王浩然 • 2024年11月30日下午6:00 • AI前沿 • 99 views

随着越来越多的出版商与 ChatGPT 制造商 OpenAI达成内容许可协议，托尔数字新闻中心本周发布的一项研究——研究人工智能聊天机器人如何为出版商的内容生成引文（即来源）——变得有趣，或者说令人担忧。

简而言之，研究结果表明，无论出版商是否允许 OpenAI 抓取其内容，他们仍然受制于生成式 AI 工具捏造或以其他方式歪曲信息的倾向。

这项研究由哥伦比亚大学新闻学院进行，研究了 ChatGPT 生成的引文，研究内容是要求它确定从多家出版商中摘取的样本引文的来源——其中一些出版商与 OpenAI 签署了协议，而一些则没有。

该中心从总共 20 家随机选择的出版商制作的 10 篇文章中摘录了大段引言（总共 200 条不同的引言），其中包括《纽约时报》（目前正在以版权诉讼起诉 OpenAI）、《华盛顿邮报》（与 ChatGPT 制造商无关联）、《金融时报》（已签署许可协议）等媒体的内容。

Tow 研究人员 Klaudia Jaźwińska 和 Aisvarya Chandrasekar 在一篇博客文章中解释了他们的方法并总结了他们的研究结果，文中写道：“我们选择的引文如果粘贴到 Google 或 Bing 中，会在前三个结果中返回源文章，并评估 OpenAI 的新搜索工具是否能够正确识别每个引文的来源文章。 ”

“我们发现，这对新闻出版商来说并不乐观，”他们继续说道。“尽管 OpenAI 强调其能够为用户提供‘及时的答案和相关网络资源的链接’，但该公司并未明确承诺确保这些引用的准确性。对于那些希望其内容被引用和忠实呈现的出版商来说，这是一个明显的疏忽。”

他们补充道：“我们的测试发现，无论与 OpenAI 的关联程度如何，没有任何出版商能够避免在 ChatGPT 中对其内容进行不准确的表述。”

不可靠的来源

研究人员表示，他们发现 ChatGPT 错误引用出版商内容的“大量”案例，同时还发现了他们所称的“响应准确性范围”。因此，虽然他们发现“一些”完全正确的引用（即 ChatGPT 准确地返回了与其共享的区块引用的出版商、日期和 URL），但“许多”引用完全错误；而“一些”引用介于两者之间。

简而言之，ChatGPT 的引用似乎是一个不可靠的混合体。研究人员还发现，聊天机器人很少对自己的（错误）答案表现出完全的信心。

其中一些引文来自主动屏蔽 OpenAI 搜索爬虫的出版商。研究人员表示，在这种情况下，他们预计它会在生成正确引文方面存在问题。但他们发现这种情况引发了另一个问题——因为机器人“很少”承认无法给出答案。相反，它会依靠虚构来生成一些来源（尽管是错误的来源）。

研究人员表示：“总的来说，ChatGPT 在 153 次情况下返回了部分或完全错误的响应，尽管它只承认无法准确回答查询七次。” “只有在这七次输出中，聊天机器人才使用限定词和短语，例如‘似乎’，‘有可能’或‘可能’，或‘我找不到确切的文章’之类的陈述。”

他们将这种不愉快的情况与标准的互联网搜索进行了比较，在标准的互联网搜索中，像谷歌或必应这样的搜索引擎通常会找到一个精确的引语，并将用户引导到他们找到该引语的网站，或者声明他们没有找到完全匹配的结果。

他们认为，ChatGPT“对答案的信心缺乏透明度，这可能会让用户难以评估声明的有效性，也难以了解答案的哪些部分可以信任，哪些部分不能信任”。

他们认为，对于出版商来说，错误引用还可能带来声誉风险，以及读者被引向其他地方的商业风险。

脱离语境的数据

这项研究还强调了另一个问题。它表明 ChatGPT 本质上可能在鼓励抄袭。研究人员讲述了一个例子，ChatGPT 错误地引用了一个抄袭了《纽约时报》一篇“深度报道”新闻的网站，即通过复制粘贴文本而不注明出处，作为《纽约时报》报道的来源——推测在这种情况下，机器人可能生成这个错误的响应是为了填补由于无法抓取《纽约时报》网站而导致的信息空白。

他们认为：“这引发了人们对 OpenAI 过滤和验证其数据源质量和真实性的能力的严重质疑，尤其是在处理未经授权或抄袭的内容时。”

进一步的研究结果可能会让与 OpenAI 签署协议的出版商感到担忧，该研究发现 ChatGPT 的引用在他们的案例中也并不总是可靠的 —— 因此让其爬虫程序进入似乎也不能保证准确性。

研究人员认为，根本问题在于 OpenAI 的技术将新闻视为“脱离语境的内容”，似乎很少考虑其原始制作的情况。

该研究指出的另一个问题是 ChatGPT 的响应变化。研究人员测试多次向机器人询问相同的查询，发现它“通常每次都会返回不同的答案”。虽然这是 GenAI 工具的典型特征，但一般来说，在引用上下文中，如果您追求的是准确性，这种不一致性显然不是最佳选择。

虽然 Tow 的研究规模较小——研究人员承认还需要“更严格”的测试——但考虑到各大出版商正忙于与 OpenAI 达成的高层交易，该研究仍然引人注目。

如果媒体企业希望这些安排能够使他们的内容相对于竞争对手获得特殊待遇，至少在提供准确的来源方面，那么这项研究表明，OpenAI 尚未提供任何这样的一致性。

虽然没有许可协议但也没有完全阻止 OpenAI 爬虫的出版商（也许希望在 ChatGPT 返回有关他们的故事的内容时至少获得一些流量） – 但这项研究也令人沮丧，因为在他们的情况下引用可能也不准确。

换句话说，即使出版商允许爬虫进入 OpenAI 的搜索引擎，也无法保证出版商的“可见性”。

完全屏蔽爬虫并不意味着出版商可以通过避免在 ChatGPT 中提及他们的故事来避免声誉受损的风险。例如，研究发现，尽管诉讼仍在进行中，但该机器人仍然错误地将文章归为《纽约时报》的文章。

“意义不大的机构”

研究人员得出的结论是，就目前情况而言，当 ChatGPT （直接或间接）获得其内容时，出版商对于其内容的去向“几乎没有任何实质性的权力”。

该博客文章包括 OpenAI 对研究结果的回应——指责研究人员对我们的产品进行了“非典型测试”。

OpenAI 还告诉他们：“我们通过帮助每周 2.5 亿 ChatGPT 用户通过摘要、引用、清晰链接和归因发现优质内容来支持出版商和创作者。”并补充道：“我们与合作伙伴合作，以提高内联引用的准确性并尊重出版商的偏好，包括通过管理 robots.txt 中的 OAI-SearchBot 来启用它们在搜索中的显示方式。我们将继续增强搜索结果。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/chatgpt-yin-yong-yan-jiu-rang-chu-ban-shang-gan-dao-ju-sang

ChatGPT OpenAI

Like (0)

王浩然作者

0 0

OpenAI 正在资助“人工智能道德”研究

Previous 2024年11月30日

Linkup 将法学硕士与优质内容源连接起来

Next 2024年11月30日

AI前沿

AI的生态进化：模应一体的终结与新商业逻辑的诞生

9 月 4 日，文心一言大模型的移动端应用发布了 4.0.0 版本，最大的改动是 App 名字从“文心一言”改名为“文小言”；同一天，支付宝旗下 AI 应用“支小宝”最新版本也正式…

点点
2024年9月7日
000
AI前沿

Telefónica 的 Wayra 支持人工智能应答引擎 Perplexity

西班牙电信 (Telefónica) 的企业风险投资部门Wayra宣布投资人工智能解答引擎Perplexity。 Perplexity 的 AI 驱动平台旨在通过使用自然语言处理为…

点点
2024年10月16日
000
AI前沿

中国买家无视美国出口管制，仍在采购NVIDIA Blackwell芯片‌

尽管面临美国严格的出口管制措施，但市场消息显示，中国买家仍在设法获取NVIDIA的Blackwell芯片。这一动态引发了业界对国际贸易环境及高科技产品流通管制的深入讨论。 NVID…

王浩然
2025年3月4日
000
AI前沿

超级马里奥成AI新基准测试工具‌

近年来，人工智能（AI）领域的发展日新月异，各类基准测试工具层出不穷，用于评估AI模型的性能。而近日，一个令人意想不到的角色——超级马里奥，竟也加入了这一行列，成为衡量AI能力的新…

王浩然
2025年3月5日
000
AI前沿

OpenAI的ChatGPT用户激增至4亿，GPT-5即将面世‌

OpenAI的ChatGPT用户量已突破4亿周活跃用户大关，这一里程碑彰显了公司在消费者和企业市场的快速扩张。根据首席运营官Brad Lightcap周四在X平台上的帖子，Chat…

王浩然
2025年2月22日
000
AI前沿

估值超千亿美元，OpenAI还能继续领先吗？

OpenAI重要的三件事

点点
2024年9月6日
000
AI前沿

人工智能深度伪造如何威胁选举公正性——以及如何应对

竞选广告已经变得有点混乱和有争议。现在想象一下，你被一则竞选广告所吸引，其中一位候选人表达了强有力的立场，影响了你的投票——而这则广告甚至不是真的。这是一个深度伪造的广告。这不…

点点
2024年10月21日
000
AI前沿

中国公司利用云计算漏洞获取美国人工智能技术

据路透社根据公开招标文件报道，中国企业正在利用亚马逊及其竞争对手的云服务来获取美国先进的人工智能芯片和功能。路透社在一项全面调查中揭露了中国如何通过中介机构获取美国人工智能芯片。…

AI News
2024年8月31日
000
AI前沿

OpenAI 首席技术官和其他两人离职，Altman 否认与重组计划有关

OpenAI 首席技术官 Mira Murati在社交网络 X 上分享了她令人意外的辞职信，宣布她将离开公司。Murati 于 2018 年加入 OpenAI，在六年半的时间里担任…

点点
2024年10月1日
000
AI前沿

中国游戏开发商突破人工智能极限：从 NPC 到虚拟社会

随着生成式人工智能热潮的放缓，中国 AAA 级游戏《黑神话：悟空》重新引发了有关游戏行业如何利用人工智能的讨论。据 AWS 代表介绍，游戏领域长期以来一直是 AI 创新的试验场，…

王浩然
2024年9月16日
000
AI前沿

Cerebras 成为世界上最快的 DeepSeek R1 主机，速度比 Nvidia GPU 快 57 倍

Cerebras Systems今天宣布，它将在美国服务器上托管 DeepSeek 的突破性 R1 人工智能模型，承诺速度比基于 GPU 的解决方案快 57 倍，同时将敏感数据保留…

王浩然
2025年2月1日
000
AI前沿

了解影子人工智能及其对您的业务的影响

市场正因创新和新的 AI 项目而蓬勃发展。企业纷纷使用 AI 以在当前快节奏的经济中保持领先地位，这并不奇怪。然而，这种快速的 AI 采用也带来了一个隐藏的挑战：“影子 AI ”的…

王浩然
2024年12月26日
000
AI前沿

Napkin AI 的人工智能代理“设计机构”正在改变专业人士创作图形的方式

平面设计公司Napkin AI正在垂直 AI 代理应用这一令人兴奋的前沿领域开辟一条独特的道路。用户可以在 Napkin AI 的网站上输入文本，其模型会在五秒内生成代表文本的图…

王浩然
2025年2月12日
000
AI前沿

OpenAI 为 DeepSeek 竞赛提供 o3-mini 详细推理轨迹

OpenAI 目前正在展示其最新推理模型 o3-mini 的更多推理过程细节。这一变化是在OpenAI 的 X 账户上宣布的，而此时人工智能实验室正面临来自 DeepSeek-R1…

王浩然
2025年2月9日
000
AI前沿

谷歌搜索新推AI模式，支持用户提出复杂多部分问题‌

谷歌搜索近日推出了一个创新的AI模式，该模式允许用户输入更为复杂、包含多个部分的问题，并为用户提供更加精准、有条理的回答。这一功能的推出，标志着谷歌搜索在理解用户意图和提供高质量搜…

王浩然
2025年3月8日
000
AI前沿

随着行业升温，Perplexity AI 估值逼近 80 亿美元

据报道， Perplexity AI正在商讨获得约 5 亿美元的新融资，这是人工智能技术爆炸式增长的重要进展。这轮潜在投资可能会使这家人工智能搜索公司的估值飙升至 80 亿美元，较…

点点
2024年10月22日
000
AI前沿

AWS 将数据库价格降低近 50%，并增加了分布式扩展功能

AWS正在扩展其云数据库产品组合的功能，同时降低企业成本。在今天的AWS re:invent 2024会议上，这家云计算巨头概述了一系列云数据库创新。其中包括新的 Amazon …

王浩然
2024年12月6日
000
AI前沿

DataRobot 推出企业 AI 套件，以弥合 AI 开发与商业价值之间的差距

随着全球企业将资源投入到人工智能领域，许多企业都在努力将其技术投资转化为可衡量的业务成果。这就是DataRobot希望通过今天发布的一系列新产品更新来解决的挑战。Da…

王浩然
2024年11月13日
000
AI前沿

Runway 拨款 500 万美元资助多达 100 部使用 AI 生成视频的电影

AI 视频生成器需要相信电影制作者会在制作过程中使用他们的模型。否则它为何存在？为了启动新的 AI 电影生态系统，Runway拨出 500 万美元现金和更多服务积分，用于资助多达…

王浩然
2024年9月27日
000
AI前沿

阿里巴巴发布 Qwen with Questions，一种超越 o1-preview 的开放式推理模型

中国电子商务巨头阿里巴巴发布了其不断扩展的 Qwen 家族中的最新模型。这个模型被称为 Qwen with Questions (QwQ)，是OpenAI 的 o1推理模型的最新开…

王浩然
2024年12月1日
000

发表回复

Please Login to Comment

ChatGPT 引用研究让出版商感到沮丧

不可靠的来源

脱离语境的数据

“意义不大的机构”

相关推荐

发表回复

Share To :