百度限制谷歌和必应抓取内容用于人工智能训练

AI News • 2024年8月31日下午10:00 • AI前沿 • 109 views

中国互联网搜索提供商百度已更新其类似维基百科的百科服务，以防止谷歌和微软必应抓取其内容。

在百度百科 robots.txt 文件的最新更新中观察到了这一变化，该文件拒绝 Googlebot 和 Bingbot 爬虫程序的访问。

据 Wayback Machine 介绍，这一变化发生于 8 月 8 日。此前，谷歌和必应搜索引擎被允许索引百度百科的中央存储库，该存储库包含近 3000 万个条目，但网站上的一些目标子域受到限制。

百度采取这一举措的背景是，用于训练人工智能模型和应用程序的大型数据集的需求不断增长。此前，其他公司也采取了类似措施来保护其在线内容。今年 7 月，Reddit 屏蔽了谷歌以外的各种搜索引擎，禁止其帖子和讨论收录。与 Reddit 一样，谷歌也与 Reddit 签订了一项财务协议，以获取数据来训练其 AI 服务。

据消息人士透露，过去一年，微软曾考虑限制竞争对手搜索引擎运营商访问互联网搜索数据；这对于那些将数据用于聊天机器人和生成式人工智能服务的人来说最为重要。

与此同时，拥有 143 万个条目的中文维基百科仍可供搜索引擎抓取。《南华早报》进行的一项调查发现，百度百科的条目仍然出现在必应和谷歌搜索中。也许搜索引擎继续使用较旧的缓存内容。

这一举措是在世界各地的生成式人工智能开发者越来越多地与内容出版商合作，以期为他们的项目获取最高质量的内容的背景下出现的。例如，最近，OpenAI 与《时代》杂志签署了一项协议，以访问整个档案，这些档案可以追溯到一个多世纪前该杂志出版的第一天。今年 4 月，OpenAI 与《金融时报》签署了类似的合作伙伴关系。

百度决定限制各大搜索引擎对其百度百科内容的访问，凸显了数据在人工智能时代日益增长的重要性。随着各大公司在人工智能开发方面投入巨资，大型精选数据集的价值显著提升。这导致在线平台管理其内容访问的方式发生了转变，许多平台选择限制或货币化对其数据的访问。

随着人工智能行业的不断发展，可能会有更多公司重新评估其数据共享政策，这可能会导致互联网上信息的索引和访问方式进一步改变。

原创文章，作者：AI News，如若转载，请注明出处：https://www.dian8dian.com/bai-du-xian-zhi-gu-ge-he-bi-ying-zhua-qu-nei-rong-yong-yu

人工智能内容审核微软搜索引擎谷歌

Like (0)

AI News作者

0 0

中国公司利用云计算漏洞获取美国人工智能技术

Previous 2024年8月31日下午8:00

Cerebras 与 Nvidia：新的推理工具有望实现更高的性能

Next 2024年9月1日上午8:00

AI前沿

波士顿动力公司与丰田研究院合作开发人形机器人

合作伙伴关系利用大型行为模型和波士顿动力 Atlas 机器人推进人形机器人研究

点点
2024年10月22日
000
AI前沿

亚马逊利用 Anthropic 的人工智能来改造 Alexa

亚马逊将通过与人工智能公司Anthropic建立战略合作伙伴关系来升级其 Alexa 语音助手。据路透社首次报道，亚马逊计划推出代号为“Remarkable”的新版 Alexa，它…

AI News
2024年9月1日
000
AI前沿

OpenAI 扩展 Realtime API，提供新声音，并为开发人员降低价格

OpenAI今天更新了其 Realtime API，目前处于测试阶段。此更新为其平台添加了用于语音转语音应用程序的新声音，并降低了与缓存提示相关的成本。 Realtime API…

王浩然
2024年10月31日
000
AI前沿

Anthropic 呼吁对人工智能进行监管以避免灾难

Anthropic指出了人工智能系统的潜在风险，并呼吁制定完善的监管措施，以避免潜在的灾难。该组织认为，有针对性的监管对于充分利用人工智能的优势并减轻其风险至关重要。随着人工智能…

点点
2024年11月4日
000
AI前沿

Insilico Medicine 成功完成 IIa 期治疗肺纤维化研究，人工智能药物研发取得里程碑式进展

在人工智能药物研发方面取得突破性进展的Insilico Medicine宣布其新药 ISM001-055 的IIa 期研究结果呈阳性，该药物旨在治疗特发性肺纤维化(IPF)。这种小…

点点
2024年9月27日
000
AI前沿

“strawberry”问题：如何克服人工智能的局限性

到目前为止，ChatGPT 和 Claude 等大型语言模型 ( LLM ) 已成为全球的日常用语。许多人开始担心人工智能会抢走他们的工作，因此，几乎所有基于 LLM 的系统都无法…

王浩然
2024年10月15日
000
AI前沿

2025年，1X将在数百户家庭中测试人形机器人

随着科技的飞速发展，人形机器人正逐渐成为现实生活中的一部分。据最新消息，创新科技公司1X计划在2025年启动一项雄心勃勃的项目：在数百户家庭中测试其人形机器人的实际应用。这一举措标…

王浩然
2025年3月25日
000
AI前沿

Cybord 获得 870 万美元 A 轮融资，通过可追溯性革新电子制造业

Cybord是一家在电子制造领域处于领先地位的视觉 AI 技术公司，该公司在 A 轮融资中筹集了 870 万美元。此次融资由 Capri Ventures 领投，Ocean Azu…

点点
2024年9月18日
000
AI前沿

一款集多模态理解与生成于一体的单一 Transformer

大型语言模型 (LLM) 的重大进步激发了多模态大型语言模型 (MLLM) 的发展。早期的 MLLM 工作，例如 LLaVA、MiniGPT-4 和 InstructBLIP，展示…

点点
2024年10月12日
000
AI前沿

多式联运 RAG 正在发展，这是开始的最佳方式

随着公司开始尝试多模态检索增强生成 (RAG)，提供多模态嵌入（一种将数据转换为 RAG 可读文件的方法）的公司建议企业在嵌入图像和视频时从小处着手。多模态 RAG 还可以显示…

王浩然
2024年11月11日
000
AI前沿

人工智能克隆是明星声音的最大威胁

AI 语音克隆技术专家 Podcastle 进行了一项调查，以发现哪些名人最容易受到 AI 语音克隆滥用的风险。该公司对 1,000 名美国民众进行了调查，以了解他们…

点点
2024年9月11日
000
AI前沿

拥抱变化而不牺牲传统：人工智能代理对信用合作社的承诺

近年来，金融服务业一直引领创新，推出金融科技、数字银行和其他技术解决方案，该行业在风险投资中一直名列前茅。然而，信用合作社等金融机构的情况却并非如此，它们通常依靠与会员的面对面互动…

王浩然
2025年1月15日
000
AI前沿

CNH 首席技术官 Jay Shroeder – 访谈系列

Jay Schroeder 担任CNH的首席技术官 (CTO) ，负责监督公司的全球研发业务。他的职责包括管理技术、创新、车辆和工具、精密技术、用户体验和动力系统等领域。Schro…

点点
2024年9月26日
000
AI前沿

阿里巴巴发布 Qwen with Questions，一种超越 o1-preview 的开放式推理模型

中国电子商务巨头阿里巴巴发布了其不断扩展的 Qwen 家族中的最新模型。这个模型被称为 Qwen with Questions (QwQ)，是OpenAI 的 o1推理模型的最新开…

王浩然
2024年12月1日
000
AI前沿

人工智能如何帮助绘制宇宙地图

人工智能 (AI) 已成为了解世界的重要工具。现在，随着人们对太空探索的兴趣重新升温，人工智能也可能对其他世界产生同样的影响。尽管经过了几十年的研究，科学家们对地球大气层以外的宇…

点点
2024年9月17日
000
AI前沿

为什么人工智能无法让你成为更好的作家

文学界一直充满争议，从《坏艺术朋友》到 BookForum 对长期受到称赞的评论家劳伦·奥勒的报应。然而，最近的争论点不是人际关系的戏剧或吹毛求疵的评论。相反，这是一篇来自 N…

王浩然
2024年11月18日
000
AI前沿

Google发布全新Agent Development Kit，助力企业快速构建与部署AI代理

在人工智能领域日新月异的今天，企业对于能够高效构建AI代理的平台需求激增。为了顺应这一趋势，Google近期宣布推出其全新的Agent Development Kit（ADK），旨…

王浩然
2天前
000
AI前沿

微软严厉打击副驾驶人工智能的恶意使用

微软数字犯罪部门正在采取法律行动，打击那些创建恶意工具、逃避生成式人工智能服务的安全护栏和准则并创建有害内容的网络犯罪分子。根据弗吉尼亚州东区一份未密封的投诉，尽管该公司竭尽全力…

王浩然
2025年1月17日
000
AI前沿

Salesforce豪掷10亿美元投资新加坡，力推AI技术普及‌

在科技日新月异的今天，人工智能（AI）已经成为推动各行各业发展的重要力量。近日，全球领先的客户关系管理软件提供商Salesforce宣布了一项重大投资决策——将在新加坡投入高达10…

王浩然
2025年3月13日
000
AI前沿

在 OpenAI 推出 ChatGPT Search 几个小时前，谷歌刚刚授予其 AI 搜索访问权限

谷歌周四为其 Gemini AI 平台推出了实时搜索功能，使其语言模型能够访问来自谷歌搜索的当前信息。这项名为“ Grounding with Google Search ”的新功…

王浩然
2024年11月3日
000

发表回复

Please Login to Comment

百度限制谷歌和必应抓取内容用于人工智能训练

相关推荐

发表回复

Share To :