Без загрузки, 100% локально, без аккаунта

PDF → извлечение текста

Извлеките весь читаемый текст из PDF. Скачайте в виде файла .txt. Всё остаётся в вашем браузере, ни один файл не отправляется на сервер.

Как работает PDF в текст

PDF в текст извлекает текстовое содержимое, встроенное в PDF, и выдаёт его как обычный файл .txt. Он читает символьные потоки, хранящиеся в документе, OCR не используется, поэтому результат получается быстрым и точным для цифровых PDF, где текст уже машиночитаемый.

Если ваш PDF, это отсканированное изображение без встроенного текстового слоя, используйте вместо этого инструмент OCR. Для всего остального, договоров, отчётов, электронных книг, этот инструмент мгновенно вытаскивает текст.

Часто задаваемые вопросы

Загружаются ли мои файлы на сервер?

Нет. Текст вашего PDF извлекается библиотекой pdf.js, движком, который Firefox использует для отображения PDF,, работающей во вкладке вашего браузера. Потоки символов каждой страницы считываются в память на вашем устройстве с помощью getTextContent, собираются там в простой текст, а результат предлагается для локального скачивания в формате .txt. Ничего не передаётся ни Sunasty, ни третьим сторонам. Вы можете проверить это сами: откройте инструменты разработчика браузера, перейдите на вкладку «Сеть» и убедитесь, ни один запрос не несёт ваш файл.

Будет ли это работать с отсканированным PDF?

Только если отсканированный документ уже имеет встроенный текстовый слой (например, добавленный предыдущим проходом OCR). Чисто графический скан не содержит машиночитаемого текста, поэтому извлечение вернёт пустой результат, в этом случае сначала используйте инструмент OCR на Sunasty, чтобы создать текстовый слой.

Сохраняет ли он разрывы страниц и форматирование?

У обычного текста нет модели разметки, поэтому богатое форматирование, колонки, таблицы, размеры шрифта, не сохраняется. Вы получаете порядок чтения текстовых символов так, как они хранятся в PDF. Разрывы абзацев аппроксимируются, но сложные макеты могут потребовать ручной доводки.

Работает ли это офлайн?

Да, после того как страница загружена. Поскольку обработка происходит на вашем устройстве, вы можете отключиться от сети, и инструмент продолжит работать. Это самое наглядное доказательство того, что ваши данные никогда не покидают вашу машину.

Это бесплатно? Нужна ли учётная запись?

Это полностью бесплатно и не требует регистрации. Нет водяных знаков, нет дневных лимитов и не нужны отслеживающие cookie, чтобы пользоваться инструментом.