Anomalo 的非结构化数据解决方案将企业 AI 部署时间缩短了 30%

王浩然 • 2024年11月25日下午5:00 • AI前沿 • 78 views

长期以来用于结构化数据的数据质量工具现在正扩展到企业 AI 的非结构化数据。Anomalo 就是这样一家供应商，该公司多年来一直在开发用于结构化数据的数据质量平台。今天，该公司宣布扩展其平台，以更好地支持非结构化数据质量监控。

Anomalo 的联合创始人兼首席执行官 Elliot Shmukler 相信，他公司的技术能够对组织产生强大的影响。

Shmukler 在接受采访时表示：“我们相信，通过消除数据质量问题，我们可以加速至少 30% 的人工智能部署。”

他指出，企业在概念验证阶段后就放弃了一些 AI 项目。根本问题在于数据质量差、数据缺口大以及企业数据尚未准备好供新一代 AI 使用。

“我们相信，使用 Anomalo 的非结构化监控可以将企业中典型的新一代 AI 项目加速一年之久，”Shmukler 说道。“这是因为它能够非常快速地理解、分析并最终整理这些项目所依赖的数据。”

除了产品更新之外，Anomalo 还宣布将 B 轮融资金额扩大 1000 万美元，使本轮融资金额达到 8200 万美元。

为什么数据质量对企业 AI 如此重要

与传统的结构化数据质量问题不同，非结构化内容对人工智能应用提出了独特的挑战。

“由于它是非结构化数据，所以里面可能包含任何内容，”Shmukler 强调道。“它可能是个人身份信息、电子邮件、姓名、社会保险号……这些文档中可能包含专有机密信息，而这些信息可能你不想发送给大型语言模型。”

Anomalo 平台通过向非结构化文档添加结构化元数据来解决这些挑战。这使组织能够在数据进入 AI 模型之前更好地理解和控制数据。

Anomalo 软件为非结构化数据质量提供了以下关键功能：

自定义问题定义：允许用户定义自己的问题以在文档集合中检测，超出预定义的问题（如个人身份信息（PII）或滥用内容）。

支持私有云模型：使企业能够使用部署在自己的云提供商环境中的大型语言模型 (LLM)，从而对其数据提供更好的控制和舒适度。

元数据标记：向非结构化文档添加结构化元数据，例如有关检测到的问题的信息，以便更好地管理和过滤用于新一代人工智能应用程序的数据。

编辑：即将推出的一项功能将允许软件提供文档的编辑版本，删除敏感信息。

新兴市场中非结构化数据质量的竞争差异化

Anomalo 在非结构化数据质量市场中并不孤单，就像它在结构化数据质量领域中并不孤单一样。

Monte Carlo Data、Collibra和 Qlik等多家数据质量供应商都拥有各种形式的非结构化数据质量技术。Shmukler 看到了他的公司在多个领域和方式上脱颖而出。

他指出，其他一些供应商正在通过集成和监控包含支持检索增强生成 (RAG) 工作流的数据的矢量数据库来接近非结构化数据质量。Shmukler 解释说，这种方法要求已经设置了管道以将适当的数据发送到矢量数据库中。他补充说，它还将应用程序限制为仅限传统的 RAG 方法，而不是大型上下文模型等较新的方法，这些方法甚至可能不需要矢量数据库。

“Anomalo 的不同之处在于，我们在建立任何管道来提取此类数据之前，就对原始的非结构化数据集合进行了分析，”Shmukler 说道。“这使得我们在着手构建管道之前可以更广泛地探索所有可用数据，并且还开辟了超越传统 RAG 技术的所有可能方法来使用这些数据。”

Anomalo 的监控如何适应企业 AI 部署

Anomalo平台可以加速企业AI部署的各个方面。

Shmukler 指出，团队可以在将任何数据发送到模型或矢量数据库之前，将数据质量监控集成到数据准备阶段。从根本上讲，Anomalo 所做的是在非结构化数据之上以元数据的形式提供一些结构。企业可以在训练或微调 genAI 模型时使用结构化元数据来确保高质量、无问题的数据。

Anomalo 的数据质量监控还可以与输入 RAG 的数据管道集成。在 RAG 用例中，非结构化数据被输入到矢量数据库中以供检索。元数据可用于过滤、排序和管理 RAG 中使用的数据，从而确保用于生成输出的信息的质量。

Shmukler 认为数据质量监控影响的另一个核心领域是合规性和风险缓解。Anomalo 的数据标记可帮助企业防止 genAI 泄露敏感信息和违反合规性。

“每家企业都担心法学硕士会提供不该有的数据，泄露敏感信息，”Shmukler 说道。“这其中很大一部分原因在于，当你在构建你的新一代人工智能应用程序时，晚上可以睡得更好，因为你知道，任何敏感数据或你不想让法学硕士知道的数据，实际上不太可能被法学硕士知道。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/anomalo-de-fei-jie-gou-hua-shu-ju-jie-jue-fang-an-jiang-qi

Anomalo 数据质量非结构化数据解决方案

Like (0)

王浩然作者

0 0

xpander.ai 的 Agent Graph System 使 AI 代理更加可靠，并逐步为其提供信息

Previous 2024年11月25日

Ubitium 推出新型通用处理器，解决边缘 AI 等问题

Next 2024年11月25日

AI前沿

Connecty 的 AI 上下文映射如何终结企业数据管道混乱

企业数据堆栈以多样化、混乱和碎片化而闻名。数据从多个来源流入复杂的多云平台，然后分布在各种 AI、BI 和聊天机器人应用程序中，管理这些生态系统已成为一项艰巨而耗时的挑战。今天，总…

王浩然
2024年11月12日
000
AI前沿

人工智能心理健康平台获 82.5 万美元融资

心理健康初创公司 Yung Sidekick 已获得 825,000 美元的种子前资金，用于开发针对心理健康专业人士的人工智能平台。此轮融资由 Altair Capital 和 …

点点
2024年10月8日
000
AI前沿

OpenAI：延长模型“思考时间”有助于对抗新出现的网络漏洞

通常，开发人员专注于减少推理时间（即 AI 收到提示和提供答案之间的时间间隔），以便更快地获得洞察。但谈到对抗鲁棒性，OpenAI 的研究人员表示：不要这么快下结论。…

王浩然
2025年1月25日
000
AI前沿

Google发布Agent2Agent互操作性协议，旨在标准化智能体通信‌

随着组织开始构建智能体网络，智能体之间的互操作性正逐渐受到关注。近几个月来，至少出现了两项智能体互操作性标准：Anthropic的模型上下文协议（Model Context Pro…

王浩然
4小时前
000
AI前沿

人工智能悖论：未来的尖端工具如何成为危险的网络威胁（以及需要做好哪些准备）

人工智能正在改变企业的运营方式。虽然这种转变在很大程度上是积极的，但它也带来了一些独特的网络安全问题。像agentic AI这样的下一代人工智能应用对组织的安全态势构成了特别值得注…

王浩然
2025年2月4日
000
AI前沿

大规模部署 AI：NVIDIA NIM 和 LangChain 如何彻底改变 AI 集成和性能

人工智能 (AI)已从一个未来概念转变为改变全球行业的强大力量。人工智能驱动的解决方案正在改变医疗保健、金融、制造和零售等行业的企业运营方式。它们不仅提高了效率和准确性，还增强了决…

点点
2024年9月25日
000
AI前沿

研究人员质疑人工智能的“推理”能力，因为模型在解决数学问题时出现了微小的变化

机器学习模型是如何做到的？它们真的像我们一样“思考”或“推理”吗？这既是一个哲学问题，也是一个实践问题，但周五发表的一篇新论文表明，答案至少就目前而言，是一个相当明确的“不”。苹…

王浩然
2024年10月12日
000
AI前沿

Manus：来自中国的新一代AI代理系统，被誉为第二个“DeepSeek时刻”

引言在人工智能（AI）领域，每一次技术创新都可能引发行业地震。最近，一款名为Manus的AI代理系统在中国横空出世，并迅速在全球范围内引起了广泛关注。这款被誉为中国第二个“Dee…

王浩然
2025年3月19日
000
AI前沿

超越炒作：揭秘生成式人工智能在药物研发中的真正影响

自从Insilico Medicine利用生成式 AI 开发出一种治疗特发性肺纤维化 (IPF) 的药物以来，人们对这项技术如何改变药物研发的兴趣与日俱增。传统方法缓慢而昂贵，因此…

王浩然
2024年9月24日
000
AI前沿

人工智能初创公司 Humanoid 推出通用人形机器人

这家总部位于英国的公司预计今年将生产出一款具有轮式和双足平台的人形机器人的模块化 alpha 原型英国人工智能和机器人初创公司 Humanoid 在一段新视频中发布了其通用人形机…

王浩然
2025年2月21日
000
AI前沿

色情生成器、作弊工具和“专家”医疗建议：深入探究OpenAI的定制聊天机器人市场

Gizmodo 对 OpenAI 的 GPT 商店进行的分析发现，超过 100 种工具似乎违反了该公司关于性内容、欺骗、法律和医疗建议、赌博、虚假评论生成和浪漫陪伴的政策。去年 …

王浩然
2024年9月5日
000
AI前沿

忘掉 Nvidia：Ndea 希望打造能够不断自我改进且“看不到任何瓶颈”的人工智能

谷歌前工程师、广为使用的 Python 深度学习框架Keras的创建者 François Chollet 与 Zapier 联合创始人 Mike Knoop 共同创立了新的人工智能…

王浩然
2025年1月16日
000
AI前沿

DeepSeek的力量对商业意味着什么

一、引言在人工智能（AI）领域，新兴力量的崛起往往能迅速改变行业格局。近期，中国AI研究公司DeepSeek的突破性进展，不仅挑战了现有AI巨头的地位，还为全球商业环境带来了深远…

王浩然
2025年3月14日
000
AI前沿

为什么人工智能开发人员对 Claude 3.5 的计算机使用功能赞不绝口

Anthropic 刚刚发布了 Claude 3.5，这是其 LLM 系列的一个功能强大的新版本。虽然这个模型带来了改进的推理和编码技能，但真正令人兴奋的是围绕一项名为“计算机使用…

点点
2024年11月5日
000
AI前沿

Web3技术助力增强AI的信任与信心‌

在人工智能（AI）领域，信任始终是一个核心议题。随着技术的不断进步，如何确保AI系统的可靠性、透明度和安全性，成为了业界和公众关注的焦点。近日，Web3技术的兴起为AI领域带来了新…

王浩然
3天前
000
AI前沿

NVIDIA助力推出AI平台，教授美国手语

NVIDIA携手合作伙伴，共同推出了一款创新的AI平台，旨在通过人工智能技术教授美国手语。该平台集成了先进的深度学习算法和高效的图形处理能力，为用户提供了一种直观、互动的学习方式，…

王浩然
2025年2月23日
000
AI前沿

扎克伯格与人工智能克隆人交谈，人类创造者在场观看今年最奇怪的演示

人工智能已经为我们带来了一些奇怪的演示。朋友们，从现在开始，它只会变得越来越奇怪。随着科技界一头扎进恐怖谷，界限将变得模糊，一切都将变得越来越奇怪。以周三的 Meta Conne…

王浩然
2024年9月26日
000
AI前沿

为何各国以主权人工智能的名义竞相建立人工智能工厂

如今，人工智能已成为一项至关重要的技术，世界也陷入了激烈的地缘政治斗争，“主权人工智能”成为国家问题也就不足为奇了。想想看，美国会允许其为人工智能生成的数据在中国存储和处理吗？欧盟…

王浩然
2024年10月2日
000
AI前沿

为你点击的人工智能：微软的研究指出了 GUI 自动化的未来

微软研究人员和学术合作伙伴进行的一项全面的新调查显示，由大型语言模型 (LLM) 驱动的人工智能代理越来越能够控制图形用户界面 (GUI)，从而有可能改变人类与软件的交互方式。这…

王浩然
2024年12月1日
000
AI前沿

Zeekr 将使用 Nvidia 超级芯片；向 Waymo 交付自动驾驶出租车：CES 2025

中国高端品牌 Zeekr在CES 上发布了几项重要公告，表明其将成为自动驾驶汽车(AV) 市场中一股不容忽视的力量。首先，该公司确认将推出一款采用 Nvidia Drive…

王浩然
2025年1月12日
000