Есть ли бесплатные программы для оптического распознавания текста (OCR), которые поддерживают язык якутов?

Какую бесплатную OCR-программу или веб-сервис можно использовать для распознавания якутского языка, который содержит кириллицу с пятью дополнительными буквами Ҕҕ, Ҥҥ, Өө, Һһ, Үү? У меня есть небольшая книга на якутском в формате скриншотов, которую я хочу перевести на русский, однако необходимо сначала распознать текст. Я рассматривал вариант использования похожей письменности, например, киргизской, но там другие дополнительные буквы.
  • 2 апреля 2024 г. 11:09
Ответы на вопрос 2
Одним из бесплатных программ для оптического распознавания текста (OCR), которая может поддерживать язык якутов с указанными дополнительными буквами, является Tesseract OCR. Tesseract OCR является одним из наиболее популярных инструментов для распознавания текста и он поддерживает несколько языков, включая русский и другие языки с кириллическим алфавитом.

Для использования Tesseract OCR для распознавания якутского текста, вам необходимо установить программу на свой компьютер и обучить её распознавать якутский язык. Вы также можете попробовать использовать онлайн-сервисы для распознавания текста, такие как OnlineOCR или Free OCR, которые могут поддерживать различные языки, включая якутский.

Пожалуйста, имейте в виду, что качество распознавания может зависеть от качества скриншотов и является несовершенным процессом, особенно для текста с редкими буквами. Возможно, вам придется вручную корректировать распознанный текст.
Более 10 лет назад игрался с фреймворком Гамера. https://qna.habr.com/answer?answer_id=1624737#answ... 
Можно построить систему на основе этого фреймворка, которую можно обучить на образцах символов.
https://gamera.informatik.hsnr.de/download/index.html
https://jhir.library.jhu.edu/items/1af7abec-885d-4...

Если есть готовое свободное ПО, то буду рад узнать так же.
Похожие вопросы