小而强大：H2O.ai 的新 AI 模型在文档分析领域挑战科技巨头

王浩然 • 2024年10月19日下午5:00 • AI前沿 • 160 views

开源 AI 平台提供商H2O.ai今天宣布了两种新的视觉语言模型，旨在改进文档分析和光学字符识别 (OCR) 任务。这两个模型名为H2OVL Mississippi-2B和H2OVL-Mississippi-0.8B，与各大科技公司推出的更大规模模型相比，它们表现出了相当强的性能，有可能为处理文档密集型工作流程的企业提供更高效的解决方案。

大卫与歌利亚：H2O.ai 的微型模型如何战胜科技巨头

H2OVL Mississippi-0.8B 模型仅具有 8 亿个参数，但在OCRBench 文本识别任务中却超越了所有其他模型，包括那些具有数十亿个参数的模型。与此同时，具有 20 亿个参数的 H2OVL Mississippi-2B 模型在一系列视觉语言基准测试中表现出色。

H2O.ai 首席执行官兼创始人 Sri Ambati 在接受 VentureBeat 独家采访时表示：“我们将 H2OVL Mississippi 模型设计为一种高性能且经济高效的解决方案，为企业带来 AI 驱动的 OCR、视觉理解和文档 AI。”“通过将先进的多模式 AI 与效率相结合，H2OVL Mississippi 为各行各业提供了精确、可扩展的文档 AI 解决方案。”

这些模型的发布标志着 H2O.ai 让 AI 技术更易于获取的战略迈出了重要一步。通过在流行的机器学习模型共享平台Hugging Face 上免费提供这些模型，H2O.ai 允许开发人员和企业根据特定文档 AI 需求修改和调整这些模型。

效率与效益的结合：文档处理的新方法

Ambati 强调了小型专业模型的经济优势。“我们对生成式预训练转换器的方法源于我们对 Document AI 的深度投资，我们与客户合作从企业文档中提取含义，”他说。“这些模型可以在任何地方运行，占用空间小，高效且可持续，允许以极低的成本对特定领域的图像和文档进行微调。”

这一消息发布之际，各企业正寻求更高效的方法来处理和提取大量文档中的信息。传统的 OCR 和文档分析方法通常难以处理质量较差的扫描件、难以识别的笔迹或经过大量修改的文档。H2O.ai 的新模型旨在解决这些问题，同时为大型语言模型提供一种资源效率更高的替代方案，因为大型语言模型对于特定的文档相关任务来说可能过于繁琐。

行业分析师指出，H2O.ai 的做法可能会颠覆目前由科技巨头主导的格局。通过专注于更小、更专业的模型，H2O.ai 可能能够占领重视效率和成本效益的企业市场的很大一部分。

开源和企业级：H2O.ai 的 AI 应用战略

“在 H2O.ai，让人工智能触手可及不仅仅是一个想法，而是一个运动，”Ambati 告诉 VentureBeat。“通过发布一系列可以轻松微调以适应特定任务的小型基础模型，我们正在扩大创建和使用人工智能的可能性。”

H2O.ai 已从Commonwealth Bank、Nvidia、高盛和富国银行等投资者那里筹集了 2.56 亿美元。该公司的开源方法和对实用、企业级 AI 解决方案的关注帮助它建立了一个由 20,000 多个组织和超过一半的财富 500 强公司作为客户的社区。

随着企业继续努力应对数字化转型以及从非结构化数据中提取价值的需求，H2O.ai 的新视觉语言模型可以为那些希望实施文档 AI 解决方案而无需大型模型的计算开销的人提供一个引人注目的选择。真正的考验将在实际应用中，但 H2O.ai 使用小得多的模型展示的竞争性能表明了企业 AI 未来的光明方向。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/xiao-er-qiang-da-h2o-ai-de-xin-ai-mo-xing-zai-wen-dang-fen

AI 模型 Commonwealth Bank H2O.ai Nvidia OCR 字符识别视觉语言模型高盛

Like (0)

王浩然作者

0 0

模组制作者正在利用人工智能在《天际》和《星露谷物语》中创造聊天伙伴

Previous 2024年10月19日

SambaNova 和 Gradio 让每个人都能使用高速人工智能——其工作原理如下

Next 2024年10月19日

AI前沿

人工智能失散已久的孪生兄弟：工程智能

我们正面临第四次人工智能寒冬，人们开始动摇对人工智能将产生足够的实际价值来证明其成本合理的信心。随着高盛和其他研究机构的文章纷纷落叶归根，我们仍然有时间阻止下一个人工智能寒冬，而…

王浩然
2024年9月2日
000
AI前沿

中国公司利用云计算漏洞获取美国人工智能技术

据路透社根据公开招标文件报道，中国企业正在利用亚马逊及其竞争对手的云服务来获取美国先进的人工智能芯片和功能。路透社在一项全面调查中揭露了中国如何通过中介机构获取美国人工智能芯片。…

AI News
2024年8月31日
000
AI前沿

Pedego 的 Cargo 电动自行车：运动、时尚、动力强劲，售价 4,000 美元

Pedego的 Cargo 电动自行车被宣传为一款强劲而运动的自行车，主要面向带着孩子在城里走动的父母和任何需要携带重型装备的人。我花了整个夏天测试这款货运电动自行车，看看它是…

点点
2024年9月23日
000
AI前沿

2024 年融资金额达 1 亿美元或以上的 39 家美国 AI 初创公司的完整名单

对于某些人来说，人工智能疲劳是真实存在的，但显然风险投资者还没有厌倦这一类别。第三季度，人工智能交易继续主导风险投资。根据Crunchbase 的数据，人工智能公司在第三季度筹集…

点点
2024年10月13日
000
AI前沿

人工智能寒冬：炒作、失望和复苏的循环

术语“人工智能寒冬”指的是人工智能研发资金削减的一段时期，通常是由于过度炒作的预期未能实现所致。从 OpenAI 的 GPT-4o 到谷歌的 AI 概览，最近的生成式 AI 系统…

点点
2024年9月10日
000
AI前沿

研究人员质疑人工智能的“推理”能力，因为模型在解决数学问题时出现了微小的变化

机器学习模型是如何做到的？它们真的像我们一样“思考”或“推理”吗？这既是一个哲学问题，也是一个实践问题，但周五发表的一篇新论文表明，答案至少就目前而言，是一个相当明确的“不”。苹…

王浩然
2024年10月12日
000
AI前沿

平衡成本、功耗和性能，实现生成式人工智能的民主化

如今，生成式人工智能还只是早期采用者使用的新事物，但明天，它将成为我们日常生活中不可或缺的一部分。因此，它必须可以在各种消费设备上使用，独立于基于云的处理，并且可供所有人使用，而不…

王浩然
2025年2月6日
000
AI前沿

Okta 的失败对 2025 年身份安全的未来有何启示

2025 年需要成为身份提供者全力改善软件质量和安全各个方面的一年，包括红队，同时使他们的应用程序更加透明，并获得超越标准的结果的客观性。 Anthropic、OpenAI和其他…

王浩然
2024年11月17日
000
AI前沿

OpenAI将ChatGPT变成搜索引擎，直指谷歌

OpenAI今天将其广受欢迎的ChatGPT服务改造成一款强大的搜索引擎，这是该公司与谷歌竞争以来最大胆的举措。此次升级让用户能够用简单的英语提问，并获取有关新闻、体育、股票和天气…

王浩然
2024年11月3日
000
AI前沿

未来博物馆设计新范式：对话创意总监布兰登·麦吉特里克

在迪拜的沙漠天际线上，一座银色的环形建筑如同来自科幻电影中的太空站，吸引着全球目光——这便是被誉为“2071年时间胶囊”的迪拜未来博物馆。作为该项目创意总监的布兰登·麦吉特里克，在…

王浩然
5天前
000
AI前沿

销售团队如何利用人工智能来优化转化率

如今，在现代销售中保持竞争力实际上意味着要拥抱最新的技术趋势。自 2022 年底以来（得益于 OpenAI 的 ChatGPT，生成式人工智能进入公众视野），人工智能一直走在这一…

点点
2024年9月26日
000
AI前沿

Dario Amodei 质疑 DeepSeek 600 万美元的 AI 说法：Anthropic 对中国最新 AI 举措有何看法

上周，中国人工智能初创公司DeepSeek宣布其最新语言模型 DeepSeek-R1 震惊了人工智能界。该模型似乎可以与领先的美国人工智能系统相媲美，但成本却只有后者的一小部分。这…

王浩然
2025年2月3日
000
AI前沿

借助 Apple Intelligence，iPhone 用户最终将获得更好的 Siri

Siri 最终会变得有用吗？这是苹果今天在“Glowtime”活动上做出的承诺，该公司在活动中推出了iPhone 16 系列——这是首批搭载人工智能功能的新 iPhone，这要归功…

王浩然
2024年9月10日
000
AI前沿

Level AI 首席执行官兼创始人 Ashish Nagar – 访谈系列

Ashish Nagar 是Level AI的首席执行官兼创始人，他利用自己在亚马逊 Alexa 团队的工作经验，利用人工智能来改变联络中心的运营。Ashish 拥有深厚的技术和创…

点点
2024年11月6日
000
AI前沿

新加坡初创公司 Sapient 凭借全新模型架构加入全球企业 AI 竞赛

新加坡首家基础模型 AI 初创公司Sapient Intelligence宣布成功完成种子轮融资，以 2 亿美元的估值募集 2200 万美元。在 Vertex Ventures、…

王浩然
2024年12月11日
000
AI前沿

OpenAI获得400亿美元巨额融资，企业AI竞争进入新阶段

在科技界引起轰动的一则消息中，OpenAI宣布完成了一轮高达400亿美元的融资，由软银集团领投，这一里程碑式的融资将OpenAI的估值推高至前所未有的3000亿美元，成为有史以来最…

王浩然
6天前
000
AI前沿

据报道，中国军事研究人员利用 Meta AI 开发国防聊天机器人

据报道，与中国执政党的军事部门中国人民解放军 (PLA) 有关的中国研究科学家使用 Meta 的“开放”人工智能开发了一种国防应用工具。据路透社报道，中国研究人员（包括两名隶属于…

王浩然
2024年11月2日
000
AI前沿

大地测量局：探索人工智能在地理空间技术中的作用和道德考量

随着我们即将迎来充满潜力的新年，技术领域，尤其是人工智能 (AI) 和机器学习 (ML)，即将迎来重大变革。英国国家测绘机构 Ordnance Survey (OS) 的首席技术官…

王浩然
2024年12月24日
000
AI前沿

AWS 推出计划帮助客户开始使用量子技术

AWS推出了 Quantum Embark，这是一项无术语的咨询服务计划，旨在帮助组织探索量子计算如何支持他们的业务。它由三个模块组成，旨在鼓励客户从最关键和计算密集型的用例开始…

王浩然
2024年12月3日
000
AI前沿

亚马逊推出了一款视频生成器——但仅用于广告

与其竞争对手谷歌一样，亚马逊也推出了一款人工智能视频生成器——但目前它仅面向广告商，而且功能有些有限。今天，在 Accelerate 大会上，亚马逊推出了视频生成器，经过一定程度…

王浩然
2024年9月21日
000