Nessun upload, 100% locale, nessun account

OCR, estrai testo da immagini e PDF

Rilascia un'immagine o un PDF e ottieni il testo riconosciuto. L'OCR funziona interamente nel tuo browser (sul dispositivo, offline dopo il primo caricamento), niente viene caricato.

Come funziona OCR · immagine/PDF in testo

OCR, Riconoscimento Ottico dei Caratteri, estrae testo da immagini scansionate e PDF basati su immagini e fornisce un risultato ricercabile e copiabile. Sunasty esegue Tesseract direttamente nel browser tramite WebAssembly, così il motore di riconoscimento è auto-ospitato sul tuo dispositivo.

L'accuratezza dipende dalla qualità della scansione e dalla lingua selezionata. Le scansioni nitide e ad alto contrasto di testo stampato in una lingua supportata tipicamente producono risultati eccellenti; la scrittura a mano, le scansioni a bassa risoluzione, le pagine con layout complessi a più colonne o script misti saranno meno accurate. Rivedi sempre l'output, in particolare per nomi, numeri e termini tecnici. Per i migliori risultati, raddrizza la scansione prima con lo strumento PDF Deskew.

Domande frequenti

Quanto è accurato l'OCR?

L'accuratezza varia con la qualità della scansione, la risoluzione e la lingua. Il testo stampato scansionato a 300 DPI o superiore in una lingua ben supportata (inglese, francese, tedesco, spagnolo e altre) raggiunge tipicamente un'alta accuratezza. La scrittura a mano, le scansioni a basso contrasto, i font insoliti e gli script non latini produrranno più errori. Rileggi sempre l'output.

Quali lingue sono supportate?

Tesseract supporta oltre 100 lingue tramite il suo sistema di pacchetti linguistici. Sunasty carica i dati della lingua selezionata direttamente nel browser; nessun dato viene inviato a un server. Seleziona la lingua corretta prima dell'elaborazione, i modelli linguistici non corrispondenti riducono significativamente l'accuratezza.

Può estrarre testo da un PDF multipagina?

Sì. Ogni pagina viene riconosciuta in sequenza e il testo estratto viene assemblato in un unico output, pagina per pagina. Il tempo di elaborazione scala con il numero di pagine e la complessità di ciascuna.

I miei file vengono caricati su un server?

No. Il riconoscimento viene eseguito dal motore Tesseract compilato in WebAssembly, all'interno di questa scheda del browser; il modello linguistico (traineddata) viene scaricato una volta dall'origine di Sunasty e messo in cache, poi la tua scansione viene caricata nella memoria del tuo dispositivo, riconosciuta lì e il testo appare localmente. Le tue immagini non vengono mai trasmesse a Sunasty o a terzi. Apri i DevTools del browser, vai alla scheda «Network» e osserva: nessuna richiesta trasporta la tua scansione.

Funziona offline?

Sì, una volta caricata la pagina. Poiché l'elaborazione avviene sul tuo dispositivo, puoi disconnetterti dalla rete e lo strumento continua a funzionare. Questa è la prova più evidente che i tuoi dati non lasciano mai il tuo dispositivo.

È gratuito? Devo creare un account?

È completamente gratuito e non richiede registrazione. Non ci sono watermark aggiuntivi, limiti giornalieri né cookie di tracciamento necessari per usare lo strumento.