Fără încărcare, 100% local, fără cont

OCR, extrage text din imagini și PDF-uri

Plasează o imagine sau un PDF și obține textul recunoscut. OCR-ul rulează în întregime în browser (pe dispozitiv, offline după prima încărcare), nimic nu este încărcat.

Cum funcționează OCR · imagine/PDF în text

OCR, Recunoasterea Optica a Caracterelor, extrage text din imagini scanate si din PDF-uri bazate pe imagini si iti ofera un rezultat cautabil si copiabil. Sunasty ruleaza Tesseract prin WebAssembly, asa ca motorul de recunoastere este gazduit pe propriul tau dispozitiv.

Acuratetea depinde de calitatea scanarii tale si de limba selectata. Scanarile clare, cu contrast ridicat, ale textului imprimat intr-o limba acceptata produc de obicei rezultate excelente; scrisul de mana, scanarile cu rezolutie scazuta, paginile cu aspecte complexe pe mai multe coloane sau cu scrieri mixte vor fi mai putin precise. Verifica intotdeauna rezultatul, in special pentru nume, numere si termeni tehnici. Pentru cele mai bune rezultate, indreapta mai intai scanarea cu instrumentul PDF Deskew.

Întrebări frecvente

Cat de precis este OCR-ul?

Acuratetea variaza in functie de calitatea scanarii, rezolutie si limba. Textul imprimat scanat la 300 DPI sau mai mult intr-o limba bine acceptata (engleza, franceza, germana, spaniola si altele) atinge de obicei o acuratete ridicata. Scrisul de mana, scanarile cu contrast scazut, fonturile neobisnuite si scrierile non-latine vor produce mai multe erori. Corecteaza intotdeauna rezultatul.

Ce limbi sunt acceptate?

Tesseract accepta peste 100 de limbi prin sistemul sau de pachete lingvistice. Sunasty incarca datele lingvistice pe care le selectezi direct in browserul tau; niciun fel de date nu este trimis catre un server. Selecteaza limba corecta inainte de procesare, modelele lingvistice nepotrivite reduc semnificativ acuratetea.

Poate extrage text dintr-un PDF cu mai multe pagini?

Da. Fiecare pagina este recunoscuta in ordine, iar textul extras este asamblat intr-un singur rezultat, pagina cu pagina. Timpul de procesare creste in functie de numarul de pagini si de complexitatea fiecareia.

Fisierele mele sunt incarcate pe un server?

Nu. Recunoașterea rulează pe motorul Tesseract compilat în WebAssembly, în această filă de browser; modelul lingvistic (traineddata) este descărcat o singură dată de la originea proprie a Sunasty și pus în cache, apoi scanarea ta este citită în memoria dispozitivului tău, recunoscută acolo, iar textul apare local. Imaginile tale nu sunt niciodată transmise către Sunasty sau terți. Deschide DevTools din browser, mergi la fila «Network» și urmărește: nicio cerere nu îți transportă scanarea.

Functioneaza offline?

Da, odata ce pagina s-a incarcat. Deoarece procesarea are loc pe dispozitivul tau, te poti deconecta de la retea si instrumentul continua sa functioneze. Aceasta este cea mai clara dovada ca datele tale nu parasesc niciodata masina ta.

Este gratuit? Am nevoie de un cont?

Este complet gratuit si nu necesita inregistrare. Nu exista filigrane, nu exista limite zilnice si nu sunt necesare cookie-uri de urmarire pentru a folosi instrumentul.