Aucun upload, 100 % local, sans compte

PDF → Extraction de texte

Extrayez tout le texte lisible de votre PDF. Téléchargez en fichier .txt. Tout reste dans votre navigateur, aucun fichier n'est envoyé sur un serveur.

Comment fonctionne PDF en texte

PDF en texte extrait le contenu textuel embarqué dans un PDF et le livre sous forme de fichier .txt. Il lit les flux de caractères stockés dans le document, aucun OCR n'est impliqué : l'extraction est donc rapide et précise pour les PDF d'origine numérique, où le texte est déjà lisible par la machine.

Si votre PDF est un scan sans couche de texte embarquée, utilisez plutôt l'outil OCR. Pour tout le reste, contrats, rapports, ebooks, cet outil extrait le texte instantanément avec pdf.js. Le texte brut n'a pas de modèle de mise en page, donc colonnes, tableaux et tailles de police ne sont pas préservés ; vous obtenez l'ordre de lecture des caractères tels qu'ils sont stockés dans le PDF.

Questions fréquentes

Mes fichiers sont-ils envoyés sur un serveur ?

Non. Le texte de votre PDF est extrait par pdf.js, le moteur que Firefox utilise pour afficher les PDF, exécuté dans l'onglet de votre navigateur. Les flux de caractères de chaque page sont lus en mémoire sur votre propre appareil via getTextContent, assemblés en texte brut sur place, et le résultat est proposé en téléchargement local au format .txt. Rien n'est transmis à Sunasty ni à un tiers. Vous pouvez le vérifier vous-même : ouvrez les outils de développement de votre navigateur, allez dans l'onglet Réseau et observez, aucune requête n'emporte votre fichier.

Fonctionne-t-il sur un PDF scanné ?

Seulement si le document scanné dispose déjà d'une couche de texte embarquée (par exemple ajoutée lors d'une passe OCR antérieure). Un scan purement en image ne contient aucun texte lisible par la machine : l'extraction renverrait un résultat vide, dans ce cas, utilisez d'abord l'outil OCR de Sunasty.

La mise en page et les sauts de page sont-ils conservés ?

Le texte brut ne possède pas de modèle de mise en page : la mise en forme complexe, colonnes, tableaux, tailles de police, n'est pas préservée. Vous obtenez l'ordre de lecture des caractères tels qu'ils sont stockés dans le PDF. Les sauts de paragraphe sont approchés, mais les mises en page complexes peuvent nécessiter une retouche manuelle.

Est-ce que ça marche hors ligne ?

Oui, une fois la page chargée. Comme le traitement a lieu sur votre appareil, vous pouvez couper le réseau : l'outil continue de fonctionner. C'est la preuve la plus nette que vos données ne quittent jamais votre machine.

Est-ce gratuit ? Faut-il un compte ?

C'est entièrement gratuit et sans inscription. Aucun filigrane, aucune limite quotidienne et aucun cookie de pistage n'est nécessaire pour utiliser l'outil.