Diffbot 的人工智能模型无需猜测——它能够知道，这要归功于万亿事实知识图谱

王浩然 • 2025年1月10日下午2:00 • AI前沿 • 69 views

Diffbot是一家位于硅谷的小公司，以维护世界上最大的网络知识索引之一而闻名，该公司今天宣布发布一种新的人工智能模型，有望解决该领域最大的挑战之一：事实准确性。

新模型是Meta 的 LLama 3.3 的微调版本，是图形检索增强生成 ( GraphRAG)系统的第一个开源实现。

与仅依赖大量预加载训练数据的传统 AI 模型不同，Diffbot 的 LLM利用公司知识图谱中的实时信息，知识图谱是一个不断更新的数据库，包含超过一万亿个相互关联的事实。

Diffbot 创始人兼首席执行官 Mike Tung 在接受 VentureBeat 采访时表示：“我们有一个论点：最终通用推理将被精简为大约 10 亿个参数。你实际上并不希望模型中包含知识。你希望模型擅长使用工具，以便它可以从外部查询知识。”

工作原理

Diffbot 的知识图谱是一个庞大的自动化数据库，自 2016 年以来一直在抓取公共网络。它将网页分类为人物、公司、产品和文章等实体，结合使用计算机视觉和自然语言处理来提取结构化信息。

每四到五天，知识图谱就会更新数百万条新事实，确保其保持最新状态。Diffbot 的AI模型利用这一资源实时查询图谱来检索信息，而不是依赖其训练数据中编码的静态知识。

例如，当被问及最近的新闻事件时，该模型可以在网上搜索最新更新，提取相关事实并引用原始来源。这一过程旨在使系统比传统的 LLM 更准确、更透明。

“想象一下向人工智能询问天气，”Tung 说道。“我们的模型不会根据过时的训练数据生成答案，而是查询实时天气服务并提供基于实时信息的响应。”

Diffbot 的知识图谱如何在寻找事实方面击败传统人工智能

在基准测试中，Diffbot 的方法似乎取得了成效。该公司报告称，其模型在FreshQA（谷歌创建的测试实时事实知识的基准）上的准确率达到 81%，超过了 ChatGPT 和 Gemini。它在MMLU -Pro（一种更难的学术知识标准测试版本）上的得分也达到了 70.36%。

或许最重要的是，Diffbot 正在将其模型完全开源，允许公司在自己的硬件上运行它并根据自己的需求进行定制。这解决了人们对数据隐私和与主要 AI 提供商的供应商锁定日益增长的担忧。

“你可以在自己的机器上本地运行它，”Tung 指出。“如果不将数据发送给 Google 并将其运送到你的场所之外，你就无法运行 Google Gemini。”

开源人工智能可能会改变企业处理敏感数据的方式

此次发布正值人工智能发展的关键时刻。近几个月来，尽管各大公司不断扩大模型规模，但大型语言模型容易“产生幻觉”或产生虚假信息，批评声却与日俱增。Diffbot 的方法提出了一条替代的前进道路，即专注于将人工智能系统建立在可验证的事实之上，而不是试图将所有人类知识编码到神经网络中。

“并不是每个人都只追求越来越大的模型，”Tung 说。“你可以用一种像我们这样的非直观方法，得到一个比大模型更强大的模型。”

行业专家指出，Diffbot 基于知识图谱的方法对于准确性和可审计性至关重要的企业应用尤其有价值。该公司已经为思科、DuckDuckGo和Snapchat等大公司提供数据服务。

该模型可通过GitHub上的开源版本立即获得，并可通过diffy.chat上的公开演示进行测试。对于希望在内部部署该模型的组织，Diffbot 表示，较小的 80 亿参数版本可以在单个Nvidia A100 GPU上运行，而完整的 700 亿参数版本则需要两个H100 GPU。

展望未来，Tung 认为人工智能的未来不在于模型越来越大，而在于更好地组织和获取人类知识：“事实会变得陈旧。很多事实将被转移到明确的地方，在那里你可以真正修改知识，并且可以获得数据来源。”

在人工智能行业努力应对事实准确性和透明度方面的挑战之际，Diffbot 的发布为主流的“越大越好”范式提供了一个引人注目的替代方案。它是否能成功改变该领域的方向还有待观察，但它确实表明，在人工智能方面，规模并不是一切。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/diffbot-de-ren-gong-zhi-neng-mo-xing-wu-xu-cai-ce-ta-neng

Like (0)

王浩然作者

0 0

微软的新 rStar-Math 技术升级小型模型，在数学问题上超越 OpenAI 的 o1 预览版

Previous 2025年1月10日

Cohere 刚刚推出了“North”，这是该公司迄今为止针对注重隐私的企业的最大 AI 赌注

Next 2025年1月10日

AI前沿

aiOla 推出开源AI 音频转录模型，可实时隐藏敏感信息

希望使用人工智能模型来转录高管、员工和客户的音频（特别是人类语音）的企业可能会对人工智能程序监听和记录敏感信息的想法持谨慎态度。然而，以色列音频 AI 初创公司aiOla有一个新…

王浩然
2024年11月23日
000
法规是助力还是阻碍：Cloudflare 的看法

随着人工智能重塑数字格局，科技公司发现自己陷入了一场高风险的监管博弈，每一步都可能改变创新带来的可能性。对于像 Cloudflare 这样的全球基础设施提供商来说，这场博弈尤其复杂…

点点
AI前沿 2024年10月7日
000
AI前沿

Salesforce 推出 Agentforce 测试中心，让座席人员接受测试

代理人工智能的下一阶段可能只是评估和监控，因为企业希望让他们开始部署的代理更具可观察性。虽然AI 代理基准可能会产生误导，但了解代理是否按其期望的方式工作却具有很大的价值。为此，…

王浩然
2024年11月26日
000
AI前沿

这款“AI Granny”黑客利用无聊的闲聊浪费电话诈骗者的时间

电话诈骗并不是什么新鲜事，但随着人工智能的出现，人们比以往任何时候都更难知道他们正在通话的人是否是他们所说的那个人。但英国移动网络 O2 正在扭转局面，创造了所谓的“人工智能奶奶”…

王浩然
2024年11月17日
000
AI前沿

OpenAI 扩展 Realtime API，提供新声音，并为开发人员降低价格

OpenAI今天更新了其 Realtime API，目前处于测试阶段。此更新为其平台添加了用于语音转语音应用程序的新声音，并降低了与缓存提示相关的成本。 Realtime API…

王浩然
2024年10月31日
000
AI前沿

揭秘OpenAI：兴趣驱动的探索，非目标导向的马拉松

我们被倡导要想明白自己的目标是什么、并做出计划。然而，两位人工智能研究者却认为，这只适用于普通的小愿望。一旦涉及过于高远的、不确定能否实现的目标，比如打造 AGI（通…

点点
2024年9月9日
000
AI前沿

Qodo 融资 4000 万美元，用于增强 AI 驱动的代码完整性和开发人员效率

Qodo （前身为 CodiumAI）最近在由Susa Ventures和Square Peg领投的 A 轮融资中获得了 4000 万美元， Firestreak Ventures…

点点
2024年10月1日
000
AI前沿

Uplimit：以AI赋能企业培训，同时培训千名员工

在数字化时代，企业面临着前所未有的挑战和机遇。为了保持竞争力，企业必须不断提升员工的技能和知识。然而，传统的企业培训方式往往效率低下，难以满足大规模、快速培训的需求。近日，Upli…

王浩然
2025年4月4日
000
AI前沿

Babbel 联合创始人 Markus Witte 将再次执掌公司，接替首席执行官 Arne Schepker

总部位于柏林的热门语言学习平台 Babbel 的首席执行官 Arne Schepker 即将卸任，该公司联合创始人兼前首席执行官 Markus Witte 将重返公司，带领公司“进…

点点
2024年10月13日
000
AI前沿

Patronus AI 推出全球首个自助服务 API，旨在阻止 AI 幻觉

客服聊天机器人自信地描述一款并不存在的产品。金融人工智能编造市场数据。医疗保健机器人提供危险的医疗建议。这些人工智能幻觉曾被视为有趣的怪癖，但如今已成为急于部署人工智能的公司面临的…

王浩然
2024年11月3日
000
AI前沿

超越RAG：SEARCH-R1将搜索引擎直接融入推理模型

在人工智能（AI）领域，大型语言模型（LLM）的推理能力取得了显著进步。然而，这些模型在结合推理能力正确引用和使用外部数据——即它们未接受训练的信息——方面仍存在较大不足。这一问题…

王浩然
2025年3月22日
000
AI前沿

如果你认为 SearchGPT 已经准备好取代谷歌，那可能只是幻觉

当OpenAI首次推出SearchGPT时，演示表明人们在网上搜索东西的方式将立即永远改变。但是，当人工智能搜索引擎的运行示例被证明存在一些缺陷时，“哇”变成了“哇，这太尴尬了” …

王浩然
2024年9月9日
000
AI前沿

Okta 的失败对 2025 年身份安全的未来有何启示

2025 年需要成为身份提供者全力改善软件质量和安全各个方面的一年，包括红队，同时使他们的应用程序更加透明，并获得超越标准的结果的客观性。 Anthropic、OpenAI和其他…

王浩然
2024年11月17日
000
AI前沿

SAP 集成 Databricks，通过新的业务数据云增强 AI 准备

德国软件巨头SAP正在推动数据方面的发展，以支持下一代 AI 用例。该公司今天推出了Business Data Cloud (BDC)，这是一款采用 Lakehouse 架构的新型…

王浩然
2025年2月14日
000
AI前沿

人工智能代理入门（第 2 部分）：自主性、保障措施和陷阱

在我们的第一部分中，我们概述了利用 AI 代理提高企业效率的关键策略。我解释了与独立 AI 模型不同，代理如何使用上下文和工具迭代地优化任务以增强代码生成等结果。我还讨论了多代理系…

王浩然
2024年11月27日
000
AI前沿

解读 OpenAI 的超级碗广告和 Sam Altman 的夸张博客文章

如果您是今年收看 NFL 超级碗 LIX 的近4000 万美国家庭之一，那么除了观看费城老鹰队击败堪萨斯城酋长队之外，您可能还会看到 OpenAI 的广告。这是该公司的首个超级碗…

王浩然
2025年2月11日
000
AI前沿

Zenlytic 获得 900 万美元融资，与 AI 数据分析师 Zoë 共同革新商业智能

Zenlytic是人工智能商业智能(BI) 领域的先驱，已成功筹集 900 万美元 A 轮融资，由M13领投，贝恩资本风险投资公司 ( Bain Capital Ventures …

点点
2024年9月27日
000
AI前沿

Pig API：为您的 AI 代理提供虚拟桌面以自动化 Windows 应用程序

在不断发展的人工智能领域，企业面临着将现代解决方案与传统系统集成的挑战，而这些系统往往缺乏无缝集成所需的应用程序编程接口 (API)。约 66%的组织继续依赖传统应用程序进行核心运…

王浩然
2025年2月4日
000
AI前沿

解锁人工智能的投资回报率：成功实施人工智能的策略

企业越来越多地使用人工智能来增强运营，但实现强劲的投资回报率仍然是一项挑战。为了评估人工智能的真正价值，行业领导者应该采取创新和前瞻性的方法。人工智能在收入增长、成本降低、决策、客…

王浩然
2024年8月25日
000
AI前沿

苹果 iOS 18.2 公测版发布，带来全新 AI 功能，但仍有部分用户仍在等待

苹果已向其公开测试版用户发布了其最新移动操作系统 iOS 18.2 的 AI 版本。此次更新包括新功能，例如名为 Genmoji 的 AI 表情符号生成器应用程序、Image Pl…

王浩然
2024年11月8日
000