Топ 10: OCR программ для Linux

Обновлено: 21.09.2023
Примеры программ для распознавания текста на Linux - представлены ниже.

Пользователи, которые искали Linux OCR, потом также интересовались следующими продуктами:

См. также: Топ 10: OCR программы

2021. EasyOCR - open-source альтернатива FineReader



Конечно, EasyOCR - это не простая и удобная программа как Abbyy Finereader. Фактически это python-движок без пользовательского интерфейса, которые еще надо суметь запустить. Зато он бесплатный, кроссплатформенный и с открытым кодом. Поддерживает 80 языков, включая русский. Работает EasyOCR медленно, но при наличии графического ускорителя с поддержкой CUDA время работы должно сократиться, однако, подобные требования делают использование EasyOCR на стандартном офисном «железе» практически невозможным для большинства задач. Однако, качество распознавания символов EasyOCR может посоревноваться с FineReader. Для использования EasyOCR нужно установить torch и torchvision, установить EasyOCR, загрузить из Python модель нужного языка и использовать.


2006. Google купил у HP open-source OCR систему Tesseract



Tesseract - свободная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х. Затем ее разработка была заморожена на 10 лет. Теперь Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. Для корректной работы tesseract необходим пакет leptonica - ПО с открытым исходным кодом, необходимое для приложений, работающих и анализирующих изображения. Для tesseract имеется графический интерфейс tesseract-gui, который тоже надо собирать из исходного кода. У меня он запустился, но распознавать текст почему-то не захотел. Еще есть система OCRopus, которая может использовать движок tesseract. Собственно поэтому я ее отдельно рассматривать не стал.