开源字符识别 OCR 引擎- 5.5万星星！很多项目都需要

AI评测师 • 2024年8月29日上午11:59 • 技术评测 • 124 views

Tesseract 开源 OCR 引擎（主存储库）

源代码

https://github.com/tesseract-ocr/tesseract

官方网址

tesseract-ocr.github.io/

Tesseract 是一个开源的光学字符识别（OCR）引擎，它能够从图像文件中识别和提取文字。Tesseract 由 Ray Smith 在 1985 到 1995 年间在惠普公司（Hewlett-Packard）的布里斯托尔实验室开发。在 2005 年，Tesseract 被惠普开源，并且自 2006 年以来，它一直在由 Google 进行维护和开发。

Tesseract 的主要特点包括：

1. 多语言支持：Tesseract 支持多种语言，包括但不限于英语、中文、西班牙语、法语、德语等。它通过使用预训练的语言模型来提高识别的准确性。

2. 平台兼容性：Tesseract 可以在多种操作系统上运行，包括 Windows、Linux、Mac OS X 等。

3. 命令行工具：Tesseract 主要作为一个命令行工具提供，用户可以通过命令行接口与它交互，执行 OCR 任务。

4. 易于集成：Tesseract 可以很容易地集成到其他应用程序中，它提供了多种编程语言的接口，如 C/C++、Python、Java 等。

5. 开源和免费：Tesseract 是完全开源的，并且可以免费使用。它的源代码托管在 GitHub 上，任何人都可以贡献代码或者修改代码来适应自己的需求。

6. 社区支持：Tesseract 拥有一个活跃的社区，用户和开发者可以分享经验、解决问题和改进引擎。

7. 培训和自定义：Tesseract 允许用户对自己的数据集进行训练，以创建定制的语言模型和字符识别规则。

8. 输出格式：Tesseract 支持多种输出格式，包括纯文本、HTML、PDF、TSV 等，这使得它可以根据不同的需求进行灵活的使用。

Tesseract 的最新版本是 4.x，它引入了一些新的功能和改进，包括一个基于神经网络（LSTM）的 OCR 引擎，这个新引擎专注于线条识别，并且提供了更好的字符识别性能。Tesseract 4 也与之前的版本兼容，支持旧的 OCR 引擎模式 (–oem0) 和相关的 traineddata 文件。

总的来说，Tesseract 是一个功能强大、灵活且不断进化的 OCR 引擎，它在学术、商业和开源社区中都有广泛的应用。

Tesseract 4 添加了一个新的基于神经网络 (LSTM) 的OCR 引擎，该引擎专注于线条识别，但仍然支持 Tesseract 3 的旧版 Tesseract OCR 引擎，该引擎通过识别字符模式进行工作。通过使用旧版 OCR 引擎模式 (–oem 0) 可以实现与 Tesseract 3 的兼容性。它还需要支持旧引擎的经过训练的数据文件，例如来自tessdata存储库的数据文件。

Stefan Weil 是现任首席开发人员。Ray Smith 一直是首席开发人员，直到 2018 年。维护者是 Zdenko Podobny。有关贡献者列表，请参阅作者和 GitHub 的贡献者日志。

Tesseract支持 unicode (UTF-8)，并且可以“开箱即用”识别100 多种语言。

Tesseract 支持多种图像格式，包括 PNG、JPEG 和 TIFF。

Tesseract 支持各种输出格式：纯文本、hOCR (HTML)、PDF、仅不可见文本的 PDF、TSV 和 ALTO。

您应该注意，在许多情况下，为了获得更好的 OCR 结果，您需要提高提供给 Tesseract 的图像质量。

该项目不包括 GUI 应用程序。如果您需要，请参阅3rdParty文档。

可以训练Tesseract识别其他语言。有关更多信息，请参阅Tesseract 培训。

安装

您可以通过预构建的二进制包安装 Tesseract 或从源代码构建它。

从源代码构建 Tesseract 需要具有良好 C++17 支持的 C++ 编译器。

运行

基本命令行用法：

tesseract imagename outputbase [-l lang] [--oem ocrenginemode] [--psm pagesegmode] [configfiles...]

有关各种命令行选项的更多信息，请使用tesseract --help或man tesseract。

示例可以在文档中找到。

Tesseract 开源 OCR 引擎的使用场景非常广泛，它可以应用于多种环境和场合，以下是一些常见的使用场景：

1. 文档数字化：将纸质文档转换为电子文档，以便于存储、检索和编辑。Tesseract 可以识别文档中的文字，从而实现文档的数字化。

2. 数据录入自动化：在需要手动输入大量数据的场景中，如调查问卷、表单处理等，Tesseract 可以自动识别和输入文本，提高数据录入的效率。

3. 图像和视频分析：在图像和视频分析中，Tesseract 可以用于提取场景中的文本信息，例如从新闻报道、社交媒体视频等中提取关键信息。

4. 文本挖掘和自然语言处理：Tesseract 可以用于从大量文本中提取关键信息，支持文本挖掘和自然语言处理的应用，如情感分析、关键词提取等。

5. 教育辅助：在教育领域，Tesseract 可以用于识别试卷、讲义等教育材料中的文字，帮助教师和学生快速整理和复习资料。

6. 金融和保险行业：在金融和保险行业中，Tesseract 可以用于处理各种文档，如支票、保险单、发票等，自动化处理和验证文本信息。

7. 零售和电子商务：在零售和电子商务领域，Tesseract 可以用于识别商品标签、条形码等，支持库存管理、价格比较等应用。

8. 医疗健康：在医疗健康领域，Tesseract 可以用于识别病历、检查报告等医疗文档中的文字，提高医疗信息处理的效率。

9. 交通和导航：在交通和导航领域，Tesseract 可以用于识别路标、交通标志等图像中的文本信息，帮助提高导航系统的准确性。

10. 社交媒体内容分析：在社交媒体平台中，Tesseract 可以用于识别用户生成内容中的文本，如评论、帖子等，支持内容分析和监控。

11. 艺术品和文化遗产保护：在艺术品和文化遗产保护领域，Tesseract 可以用于识别和记录历史文献、艺术品描述等中的文本信息。

12. 验证码识别：在需要自动识别验证码的场景中，如自动化测试、机器人程序等，Tesseract 可以用于识别和输入验证码中的文字。

Tesseract 的开源特性和灵活性使其能够适应各种不同的应用场景，用户可以根据自己的需求进行定制和扩展。随着技术的不断进步，Tesseract 的应用领域也在不断扩展。

Tesseract 开源 OCR 引擎（主存储库）

源代码

http://www.gitpp.com/rz/tesseract-cn

官方网址

tesseract-ocr.github.io/

原创文章，作者：AI评测师，如若转载，请注明出处：https://www.dian8dian.com/kai-yuan-zi-fu-shi-bie-ocr-yin-qing-5-5-wan-xing-xing-hen

Like (0)

AI评测师作者

0 0

OpenAI 警告加州的人工智能法案威胁美国创新

Previous 2024年8月29日上午9:00

NVIDIA 全新微服务助力主权 AI

Next 2024年8月29日下午3:00

技术评测

AI 语言对决：比较 C++、Python、Java 和 Rust 的性能

在人工智能 (AI)开发中，编程语言的选择对于确定项目的效率和成功起着至关重要的作用。C++、Python、Java 和 Rust 各自具有独特的优势和特性，可以显著影响结果。这些…

AI评测师
2024年8月30日
000
AI前沿

利用人工智能节省照片筛选时间

如果您是摄影师，没有什么比在大型活动或拍摄后整理数百张（甚至数千张）照片更耗时的事情了。您是否知道专业摄影师平均每小时拍摄一次，要花 3-4 个小时进行编辑？我最近偶然发现了Af…

AI评测师
2024年10月7日
000
技术评测

什么是“模型崩溃”？专家解释有关即将到来的人工智能末日的谣言

人工智能预言家和新闻贩子们预测生成式人工智能炒作的终结，并谈论即将发生的灾难性的“模型崩溃”。但这些预测有多现实？模型崩溃到底是什么？ “模型崩溃”这一概念在2023 年就被讨论…

AI评测师
2024年9月3日
000
技术评测

微软更安全的 Windows Recall 功能也可被用户卸载

为了回应安全问题，微软详细介绍了如何彻底改造其备受争议的人工智能 Recall 功能，该功能可以截取您在计算机上看到或执行的几乎所有操作的屏幕截图。Recall 最初应该在 6 月…

王浩然
2024年9月30日
000
AI前沿

Automattic 为员工提供了另一次辞职机会——这次的遣散费为 9 个月

Automattic 首席执行官马特·穆伦维格 (Matt Mullenweg) 向有意离职的员工提供为期六个月的遣散费，几天后， 159 人接受了这一提议。10 月 16 日晚，…

王浩然
2024年10月24日
000
技术评测

苹果可能会在 2 月 11 日发布新款 iPhone SE 和 PowerBeats Pro 2

据彭博社报道，苹果最早可能在 2 月 11 日推出新款iPhone SE和PowerBeats Pro耳机。鉴于该公司尚未发出线下或线上活动的邀请，此次发布会的规模可能较小。新款…

王浩然
2025年2月10日
000
技术评测

Nvidia 刚刚发布了一款开源 LLM，与 GPT-4 竞争

Nvidia 是人工智能行业最抢手的 GPU制造商之一，该公司宣布已发布一个开源大型语言模型，据报道其性能可与OpenAI、Anthropic、Meta和谷歌等领先的专有模型相媲美…

点点
2024年10月4日
000
技术评测

谷歌悄然在 Chrome 地址栏中推出了 Gemini AI 集成

谷歌周二对其Chrome 浏览器进行了重大更新，将其先进的Gemini AI聊天机器人直接集成到地址栏中。此举已广泛向用户开放，标志着人工智能技术民主化的关键时刻，并可能重塑数百万…

王浩然
2024年9月5日
000
技术评测

不要错过 Google Gemini 的深度研究模式：8 个信息丰富的报告示例

人工智能和商业领域的许多人都关注OpenAI 和 DeepSeek （从轶事和撰写/发布的文章和消息数量来看），尤其是 OpenAI 的由 o3 驱动的深度研究模式，这是一种新的…

王浩然
2025年2月14日
000
技术评测

Plaud NotePin 有望在其他可穿戴 AI 失败的地方取得成功

到目前为止，可穿戴 AI 的记录并不特别好。今年，我们已经看到 Humane（其备受诟病的 AI 别针背后的公司）在短短几个月内就破产了。Rabbit R1 的发布也遭遇了类似的负…

AI评测师
2024年9月2日
000
技术评测

如何使用 ChatGPT 编写 Excel 公式

并非每个人都是 Excel 电子表格专家，您可能并不总是知道如何为给定的数据集编写所需的公式。如果您无法找到适合您的数据和计算需求的正确公式，那么有一个新选项可以帮助您在几个步骤内…

王浩然
2024年9月14日
000
技术评测

开源 DeepSeek-R1 使用纯强化学习来匹敌 OpenAI o1 — 成本降低 95%

中国人工智能初创公司DeepSeek以使用开源技术挑战领先的人工智能供应商而闻名，最近它又抛出了一颗重磅炸弹：一项名为 DeepSeek-R1 的全新开放式推理法学硕士学位课程。 …

王浩然
2025年1月21日
000
技术评测

AI一键生成“类黑神话”，腾讯推出游戏视频模型GameGen-O，业内人士：游戏工作室的ChatGPT时刻

什么？大模型也许很快就能生成《黑神话·悟空》这种3A大作了？！直接看一则demo，《西游记》这就上桌：搭配BGM，是不是有内味儿了（doge）。这就是腾讯近日推出的GameG…

点点
2024年9月16日
000
技术评测

在几秒钟内生成 AI 商业计划

你知道吗，23.2% 的新企业在第一年就倒闭了？因此，制定一个清晰、结构良好的计划对于跨越这一艰难的门槛至关重要。我最近偶然发现了 Upmetrics。这是一款基于云的业务规划工…

AI评测师
2024年11月5日
000
技术评测

微软终于让 Copilot+ 笔记本电脑可用于人工智能

微软的 Copilot+ PC 计划大获成功，其中许多都跻身最佳笔记本电脑之列，但并非因为其内置的 AI 硬件。现在，微软终于将 Copilot+ PC 中的神经处理单元 (NPU…

王浩然
2024年10月4日
000
AI前沿

利用人类注意力可以改善人工智能生成的图像

来自中国的一项新研究提出了一种提高稳定扩散等潜在扩散模型（LDM）生成的图像质量的方法。该方法专注于优化图像的显著区域——最有可能吸引人类注意力的区域。新研究发现，显著性图（左…

点点
2024年10月17日
000
技术评测

Google 如何让 Medium.com 的抄袭内容超越原创内容

多年来，Google 一直向网站站长社区强调，原创、高质量的内容是获得良好搜索结果排名的关键。Google 的系统旨在奖励那些展现出EEAT（专业性、经验性、权威性和可信度）的内容…

AI评测师
2024年10月5日
000
技术评测

Perplexity AI 评论：彻底抛弃 Google 和 ChatGPT 吗？

您是否厌倦了无休止地筛选似乎不合时宜的搜索结果？或者您是否对经常无法满足您的研究需求的AI 工具感到失望？人们很容易花费无数的时间浏览搜索结果，并与似乎很少能提供您所需内容的 A…

AI评测师
2024年8月28日
000
技术评测

Nature重磅：颠覆AI计算，提升460倍能效，新型分子忆阻器有望为Transformer提速

人工智能（AI）硬件有望彻底被颠覆，在计算速度和能效方面实现前所未有的改进。日前，来自印度科学研究所、德克萨斯农工大学和利默里克大学的研究团队，在一篇发表在权威科学期刊 Natu…

点点
2024年9月25日
000
技术评测

AI这个「狗头军师」，教年轻人说「土味情话」贼油腻

AI伊能静，专治「话题终结者」。娱乐圈中，伊能静绝对是情商王者。她曾在节目现场进行恋爱教学，被网友封为「行走的教科书」。比如，聊天时不要只讲动作，要表达情绪和需求。男生问：…

AI评测师
2024年9月12日
000

发表回复

Please Login to Comment

开源字符识别 OCR 引擎- 5.5万星星！很多项目都需要

安装

运行

相关推荐

发表回复

Share To :