Patronus AI 推出全球首个自助服务 API，旨在阻止 AI 幻觉

王浩然 • 2024年11月3日下午10:00 • AI前沿 • 133 views

客服聊天机器人自信地描述一款并不存在的产品。金融人工智能编造市场数据。医疗保健机器人提供危险的医疗建议。这些人工智能幻觉曾被视为有趣的怪癖，但如今已成为急于部署人工智能的公司面临的数百万美元问题。

今天，旧金山初创公司Patronus AI推出了所谓的首个自助平台，用于实时检测和预防人工智能故障。Patronus AI 是一家刚刚获得1700 万美元A 轮融资的初创公司。你可以将其视为人工智能系统的复杂拼写检查器，在错误到达用户之前将其捕获。

人工智能安全网内部：其工作原理

Patronus AI 首席执行官 Anand Kannappan 在接受 VentureBeat 采访时表示：“许多公司都在努力应对生产过程中的 AI 故障，面临幻觉、安全漏洞和不可预测的行为等问题。”风险很高：该公司最近的研究发现，GPT-4 等领先的 AI 模型在提示时有 44% 的时间会复制受版权保护的内容，而即使是先进的模型也会在超过 20% 的基本安全测试中产生不安全的响应。

时机至关重要。随着各家公司争相实施生成式人工智能功能（从客户服务聊天机器人到内容生成系统），他们发现现有的安全措施存在不足。目前的评估工具（如 Meta 的LlamaGuard）的准确率低于 50%，与抛硬币的结果差不多。

Patronus AI 的解决方案引入了多项创新，可能会重塑企业部署 AI 的方式。其中最重要的或许是其“评判评估者”功能，该功能允许企业以通俗易懂的英语创建自定义规则。

Patronus AI 的产品负责人 Varun Joshi 说：“您可以自定义评估以准确满足您的产品需求。”“我们让客户用英语写出他们想要评估和检查的内容。”金融服务公司可能会指定有关监管合规性的规则，而医疗保健提供商可以专注于患者隐私和医疗准确性。

从检测到预防：技术突破

该系统的基础是Lynx，这是一种突破性的幻觉检测模型，在检测医疗错误方面比GPT-4 高出8.3%。该平台以两种速度运行：用于实时监控的快速响应版本和用于更深入分析的更彻底的版本。“小型版本可用于实时护栏，大型版本可能更适合离线分析，”Joshi 表示。

除了传统的错误检查之外，该公司还开发了专门的工具，例如CopyrightCatcher，它可以检测 AI 系统何时复制受保护的内容，以及FinanceBench，这是业界首个用于评估 AI 在金融问题上的表现的基准。这些工具与 Lynx 协同工作，可以全面防范 AI 故障。

超越简单的护栏：重塑人工智能安全

该公司采用了按使用量付费的定价模式，小型评估器每 1000 次 API 调用起价为 10 美元，大型评估器每 1000 次 API 调用起价为 20 美元。这种定价结构可以大大增加 AI 安全工具的使用范围，使以前无法负担复杂 AI 监控的初创公司和小型企业能够使用这些工具。

早期采用表明，大型企业将人工智能安全视为一项关键投资，而不仅仅是一项可有可无的功能。该公司已经吸引了惠普、AngelList和Pearson等客户，并与Nvidia、MongoDB和IBM等科技巨头建立了合作伙伴关系。

Patronus AI 的与众不同之处在于它专注于改进而不仅仅是检测。“我们实际上可以突出显示幻觉所在的特定文本的跨度，”Kannappan 解释道。这种精确度使工程师能够快速识别和修复问题，而不仅仅是知道出了什么问题。

与人工智能幻觉的竞赛

此次发布正值人工智能发展的关键时刻。随着GPT-4和Claude等大型语言模型变得越来越强大和广泛应用，人工智能失败的风险也相应增大。产生幻觉的人工智能系统可能会让公司承担法律责任、损害客户信任，甚至更糟。

最近的监管举措，包括拜登总统的人工智能行政命令和欧盟的人工智能法案，表明公司将很快面临法律要求，以确保其人工智能系统安全可靠。像 Patronus AI 平台这样的工具可能成为合规的关键。

Joshi 强调说：“良好的评估不仅仅是为了防止出现不良结果，它还深刻地改善了你的模型和产品。”这一理念反映了人工智能安全方法的成熟，从简单的护栏转向持续改进。

对守护神 AI 的真正考验不仅仅是发现错误——它还将跟上 AI 飞速发展的步伐。随着语言模型变得越来越复杂，它们的幻觉可能越来越难以发现，就像发现越来越令人信服的伪造品一样。

风险再高不过了。每当人工智能系统捏造事实、推荐危险的治疗方法或生成受版权保护的内容时，它都会削弱这些工具改变业务所需的信任。如果没有可靠的护栏，人工智能革命就有可能在真正开始之前就失败。

最后，这是一个简单的事实：如果人工智能不能停止捏造事物，那么最终付出代价的可能是人类。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/patronus-ai-tui-chu-quan-qiu-shou-ge-zi-zhu-fu-wu-api-zhi

AI 幻觉 CopyrightCatcher FinanceBench Lynx MongoDB Nvidia Patronus AI 自助服务 API

Like (0)

王浩然作者

0 0

伟大的人工智能伪装：当自动化穿上特工服装时

Previous 2024年11月3日

OpenAI 聘请了 Twitter 挑战者 Pebble 的联合创始人

Next 2024年11月4日

AI前沿

Bluebricks 融资 450 万美元，利用 Atomic Infrastructure™ 技术革新云基础设施管理

云管理初创公司Bluebricks已筹集 450 万美元种子资金，以加速其尖端Atomic Infrastructure ™技术的开发。此轮融资由Flint Capital和Gli…

点点
2024年9月27日
000
AI前沿

超越基准：DeepSeek-R1 和 o1 在实际任务中的表现如何

DeepSeek-R1无疑引起了很多兴奋和担忧，尤其是对于 OpenAI 的竞争对手模型 o1。因此，我们在几个简单的数据分析和市场研究任务上对它们进行了并排比较测试。为了让这…

王浩然
2025年2月2日
000
AI前沿

AnyChat 整合了 ChatGPT、Google Gemini 等功能，可实现终极 AI 灵活性

一种名为AnyChat的新工具通过在单一界面下统一各种领先的大型语言模型 (LLM)，为开发人员提供了前所未有的灵活性。该平台由人工智能社区的知名人物、Gradio 的机器学习增…

王浩然
2024年11月19日
000
AI前沿

Meta 让企业能够创建嵌入广告的聊天机器人

在周三于门洛帕克举行的Meta Connect 2024 开发者大会上，Meta 宣布将利用点击消息广告将其人工智能商业聊天机器人扩展到 WhatsApp 和 Messenger …

王浩然
2024年9月29日
000
AI前沿

Google Cloud 在 Vertex 上推出 Veo AI 视频生成器模型

随着亚马逊凭借其新的 Nova 系列基础模型向人工智能领域迈出重要一步，谷歌也在加倍加强其自身的多模态人工智能能力。这家科技巨头的云部门宣布，其最新的视频和图像生成模型Veo和Im…

王浩然
2024年12月4日
000
AI前沿

2025 年的生成式人工智能：生产力、网络安全和创造力

全面审视 2025 年生成式人工智能将如何发展并走向成熟生成式人工智能在 2024 年达到了新的水平，并将在 2025 年继续保持这种势头。 AI Business 收集了各行各…

王浩然
2025年1月4日
000
AI前沿

今天是选举日，所有人工智能（除了一个）都采取了负责任的行动

在周二投票结束之前，大多数主要的人工智能聊天机器人都不会回答有关美国总统选举结果的问题。但内置在 X（前身为 Twitter）中的聊天机器人 Grok 却愿意回答，而且经常会出错。…

王浩然
2024年11月6日
000
AI前沿

MIPS 发布用于自动驾驶汽车的 RISC-V CPU

MIPS发布了基于 RISC-V 计算架构的 P8700 CPU，针对驾驶辅助和自动驾驶汽车应用。这家总部位于加利福尼亚州圣何塞的公司专注于开发高效且可配置的知识产权计算，并将其…

王浩然
2024年11月9日
000
AI前沿

从AI代理的热潮到实践：为何企业必须重视适用性而非盲目追求

随着我们全面步入自主转型的时代，AI代理正在重塑企业的运营方式和价值创造途径。然而，在数百家声称提供“AI代理”的供应商中，我们如何穿透炒作迷雾，理解这些系统真正能够实现的成果，以…

王浩然
4小时前
000
AI前沿

无论你喜欢与否，人工智能正在学习如何影响你

当我还是个孩子的时候，我的生活中曾出现过四个人工智能特工。他们的名字分别是 Inky、Blinky、Pinky 和 Clyde，他们竭尽全力追捕我。那是 20 世纪 80 年代…

王浩然
2025年2月18日
000
AI前沿

微软让开发人员更容易构建 AI 应用程序——这对 AWS 来说可能是个坏消息

微软周二公布了其人工智能工具的一项雄心勃勃的扩展，推出了适用于 Azure 的 GitHub Copilot和一套以开发人员为中心的功能，这些功能可能会从根本上改变人工智能时代的软…

王浩然
2024年11月1日
000
AI前沿

Sedric 监控金融机构员工的通信，以确保合规性

对于金融机构来说，遵守法规的成本越来越高。根据最近的一项民意调查，76% 的金融服务公司在 2022 年至 2023 年期间增加了合规支出，其中大多数将此归咎于新法规。如今，合规…

王浩然
2024年9月8日
000
AI前沿

ApertureData 使用多模式数据为企业提供 10 倍速度提升

数据是人工智能的圣杯。从敏捷的初创公司到全球企业集团，世界各地的组织都在投入数十亿美元来调动数据集，以打造高性能的人工智能应用程序和系统。但即使付出了这么多努力，现实情况是，访问…

王浩然
2024年10月15日
000
AI前沿

LLM 反学习如何塑造 AI 隐私的未来

大型语言模型 (LLM)的快速发展带来了人工智能 (AI) 的重大进步。从自动化内容创建到在医疗保健、法律和金融领域提供支持，LLM 正在凭借其理解和生成类似人类的文本的能力重塑行…

点点
2024年10月24日
000
AI前沿

萨姆·奥特曼的世界币成为世界币，并展示新的虹膜扫描球来证明你的人类身份

世界币 (Worldcoin) 是 Sam Altman 共同创办的“人格证明”加密项目，该项目通过扫描人的眼球，周四宣布将“币”从其名称中删除，现在改名为“世界币”。世界币项目背…

点点
2024年10月18日
000
AI前沿

佳士得AI艺术拍卖会据报道超出预期‌

近日，佳士得拍卖行举办的一场AI艺术拍卖会吸引了广泛关注，据报道，此次拍卖的结果远远超出了业界的预期。这场拍卖会不仅展示了AI艺术的无限潜力，也引发了人们对艺术与科技结合的深入思考…

王浩然
2025年3月9日
000
AI前沿

GitHub Spark 让你用简单的英语构建 Web 应用程序

当 GitHub Copilot 推出并开始自动完成代码行（后来是整个代码片段）时，许多人都在问：我们多久才能用自然语言描述一个应用程序，然后 Copilot 会为我们构建它？近几…

王浩然
2024年10月30日
000
AI前沿

微软为 Bing 带来 AI 概览

微软推出了对谷歌人工智能搜索体验的回应：Bing 生成搜索。继 7 月份的试点之后， Bing 生成搜索（尽管仍在开发中）于今天早上开始向所有美国用户推出。调用该功能的最简单方…

王浩然
2024年10月2日
000
AI前沿

对于人工智能来说，耐心是一种美德

自 ChatGPT 推出以来的近两年里，生成式人工智能经历了整个技术炒作周期，从改变社会的崇高期望到推动最近的股市调整。但具体到网络安全行业，人们对生成式人工智能(genAI) 的…

点点
2024年10月6日
000
AI前沿

2025年及以后AI的三大预测‌

近年来，人工智能（AI）的飞速发展令人叹为观止。从协助发现可能拯救生命的药物疗法，到推动自动驾驶汽车技术的革新，AI正深刻影响着我们的日常生活。作为AI的乐观拥趸，我坚信AI将继续…

王浩然
2025年3月14日
000