Ingen upload, 100% lokalt, ingen konto

OCR, udtræk tekst fra billeder og PDF'er

Slip et billede eller en PDF og få den genkendte tekst. OCR-behandlingen kører helt i din browser (på enheden, offline efter første indlæsning), intet uploades.

Sådan virker OCR · billede/PDF til tekst

OCR, Optical Character Recognition, udtrækker tekst fra scannede billeder og billedbaserede PDF'er og giver dig et søgbart, kopiérbart resultat. Sunasty kører Tesseract direkte i din browser via WebAssembly, så genkendelsesmotoren er self-hosted på din enhed.

Nøjagtigheden afhænger af kvaliteten af din scanning og det valgte sprog. Skarpe, høj-kontrastscans af trykt tekst på et understøttet sprog giver typisk fremragende resultater; håndskrift, lavopløsningsscans, sider med komplekse flerkolonnelayout eller blandede skriftsystemer vil være mindre præcise. Gennemse altid outputtet, særligt for navne, tal og fagudtryk. For bedste resultater skal du deskew scanningen først med PDF Deskew-værktøjet.

Ofte stillede spørgsmål

Hvor nøjagtig er OCR?

Nøjagtigheden varierer med scankvalitet, opløsning og sprog. Trykt tekst scannet ved 300 DPI eller højere på et velunderstøttet sprog (engelsk, fransk, tysk, spansk og andre) opnår typisk høj nøjagtighed. Håndskrift, lav-kontrastscans, usædvanlige fonte og ikke-latinske skriftsystemer vil producere flere fejl. Korrekturlæs altid outputtet.

Hvilke sprog understøttes?

Tesseract understøtter over 100 sprog via sit sprogpakkesystem. Sunasty indlæser de sprogdata, du vælger, direkte i din browser; ingen data sendes til en server. Vælg det korrekte sprog inden behandling, forkert match af sprogmodeller reducerer nøjagtigheden markant.

Kan det udtrække tekst fra en flersidet PDF?

Ja. Hver side genkendes i rækkefølge, og den udtrukne tekst samles i ét output, side for side. Behandlingstiden skalerer med antallet af sider og kompleksiteten af hver enkelt.

Uploades mine filer til en server?

Nej. Genkendelsen kører på Tesseract-motoren kompileret til WebAssembly, i denne browserfane; sprogmodellen (traineddata) hentes én gang fra Sunastys eget oprindelsessted og caches, derefter læses din scanning ind i hukommelsen på din enhed, genkendes der, og teksten vises lokalt. Dine billeder overføres aldrig til Sunasty eller tredjeparter. Åbn browserens DevTools, gå til fanen «Network» og hold øje: ingen anmodning bærer din scanning.

Virker det offline?

Ja, når siden er indlæst. Fordi behandlingen foregår på din enhed, kan du afbryde forbindelsen til netværket, og værktøjet fortsætter med at fungere. Det er det tydeligste bevis på, at dine data aldrig forlader din maskine.

Er det gratis? Skal jeg oprette en konto?

Det er helt gratis og kræver ingen tilmelding. Der er ingen vandmærker, ingen daglige grænser og ingen sporingscookies nødvendige for at bruge værktøjet.