Как работает PDF в текст
PDF в текст извлекает текстовое содержимое, встроенное в PDF, и выдаёт его как обычный файл .txt. Он читает символьные потоки, хранящиеся в документе, OCR не используется, поэтому результат получается быстрым и точным для цифровых PDF, где текст уже машиночитаемый.
Если ваш PDF, это отсканированное изображение без встроенного текстового слоя, используйте вместо этого инструмент OCR. Для всего остального, договоров, отчётов, электронных книг, этот инструмент мгновенно вытаскивает текст.