Какую бесплатную OCR-программу или веб-сервис можно использовать для распознавания якутского языка, который содержит кириллицу с пятью дополнительными буквами Ҕҕ, Ҥҥ, Өө, Һһ, Үү? У меня есть небольшая книга на якутском в формате скриншотов, которую я хочу перевести на русский, однако необходимо сначала распознать текст. Я рассматривал вариант использования похожей письменности, например, киргизской, но там другие дополнительные буквы.
Одним из бесплатных программ для оптического распознавания текста (OCR), которая может поддерживать язык якутов с указанными дополнительными буквами, является Tesseract OCR. Tesseract OCR является одним из наиболее популярных инструментов для распознавания текста и он поддерживает несколько языков, включая русский и другие языки с кириллическим алфавитом. Для использования Tesseract OCR для распознавания якутского текста, вам необходимо установить программу на свой компьютер и обучить её распознавать якутский язык. Вы также можете попробовать использовать онлайн-сервисы для распознавания текста, такие как OnlineOCR или Free OCR, которые могут поддерживать различные языки, включая якутский. Пожалуйста, имейте в виду, что качество распознавания может зависеть от качества скриншотов и является несовершенным процессом, особенно для текста с редкими буквами. Возможно, вам придется вручную корректировать распознанный текст.
Более 10 лет назад игрался с фреймворком Гамера. <a href="https://qna.habr.com/answer?answer_id=1624737#answers_list_answer" rel="nofollow">https://qna.habr.com/answer?answer_id=1624737#answ...</a> <br/> Можно построить систему на основе этого фреймворка, которую можно обучить на образцах символов. <br/> <a href="https://gamera.informatik.hsnr.de/download/index.html" rel="nofollow">https://gamera.informatik.hsnr.de/download/index.html</a> <br/> <a href="https://jhir.library.jhu.edu/items/1af7abec-885d-4f4c-9464-38b3f365f2d8" rel="nofollow">https://jhir.library.jhu.edu/items/1af7abec-885d-4...</a> <br/> <br/> Если есть готовое свободное ПО, то буду рад узнать так же.