Я потратил довольно много времени на поиск нормальной программы распознавания текста. В итоге найти замену Tesseract я так и не смог :mrgreen: Поэтому советую. Можно использовать просто как программу (с дополнительными интерфейсами), можно запихать на сервер и заставить рекурсивно обрабатывать огромное количество файлов. Многие сайты предоставляющие услуги распознавания текста, так и используют этот движок.
В качестве интерфейса к программе удобно использовать gImageReader. Этот фронтэнд имеет неплохое развитие и работает весьма стабильно.
Если в паре предложений:
1. Качаем программу по ссылке выбрав свою версию ОС(32 или 64 бит): https://github.com/manisandro/gImageReader/releases либо отсюда https://sourceforge.net/projects/gimagereader/
2. Ставим/Запускаем от админа и догружаем уже через программу нужные языки. Далее при работе с программой запускаем её от обычного пользователя.