Comment fonctionne OCR · image/PDF en texte
L'OCR, Reconnaissance Optique de Caractères, extrait le texte des images numérisées et des PDF à base d'images pour vous donner un résultat cherchable et copiable. Sunasty exécute le moteur Tesseract compilé en WebAssembly et charge à la demande le modèle de langue que vous sélectionnez.
La précision dépend de la qualité de votre scan et de la langue sélectionnée. Des scans nets et contrastés de texte imprimé dans une langue prise en charge donnent généralement d'excellents résultats ; l'écriture manuscrite, les scans basse résolution, les mises en page complexes multi-colonnes ou les scripts mixtes seront moins bien reconnus. Relisez toujours le résultat, en particulier pour les noms, les chiffres et les termes techniques. Pour de meilleurs résultats, redressez le scan d'abord avec l'outil PDF Deskew.