Существует несколько способов извлечь текст с изображений в формате PDF:
1. Использование программы для распознавания текста (OCR). Например, программа Tesseract, которая доступна как в командной строке Linux, так и в виде онлайн-сервиса. Для работы с Tesseract в Linux можно использовать следующую команду:
```bash
tesseract input.pdf output.txt
```
2. Использование специализированных онлайн-сервисов, таких как Smallpdf или OnlineOCR. Вы можете загрузить PDF-файл на сайт и получить результат в виде текстового файла.
3. Использование программ для работы с документами в Linux, таких как Poppler или pdftotext. Например, для использования команды pdftotext в Linux:
```bash
pdftotext input.pdf output.txt
```
Независимо от выбранного метода, после обработки PDF-файла содержимое на картинках будет распознано и представлено в текстовом формате в .txt файле.