Geen upload, 100% lokaal, geen account

OCR, tekst uit afbeeldingen & PDF's halen

Sleep een afbeelding of PDF en krijg de herkende tekst. De OCR draait volledig in je browser (op het apparaat, offline na de eerste keer laden), er wordt niets geupload.

Hoe OCR · afbeelding/PDF naar tekst werkt

OCR, Optical Character Recognition, haalt tekst uit gescande afbeeldingen en beeldgebaseerde PDF's en geeft je een doorzoekbaar, kopieerbaar resultaat. Sunasty draait Tesseract via WebAssembly, dus de herkenningsengine wordt op je eigen apparaat gehost.

De nauwkeurigheid hangt af van de kwaliteit van je scan en de gekozen taal. Scherpe, contrastrijke scans van gedrukte tekst in een ondersteunde taal leveren doorgaans uitstekende resultaten; handschrift, scans met lage resolutie, pagina's met complexe meerkoloms-indelingen of gemengde schriften zijn minder nauwkeurig. Controleer altijd het resultaat, vooral bij namen, getallen en technische termen. Zet de scan voor het beste resultaat eerst recht met de tool PDF Rechtzetten.

Veelgestelde vragen

Hoe nauwkeurig is de OCR?

De nauwkeurigheid varieert met de scankwaliteit, resolutie en taal. Gedrukte tekst gescand op 300 DPI of hoger in een goed ondersteunde taal (Engels, Frans, Duits, Spaans en andere) haalt doorgaans een hoge nauwkeurigheid. Handschrift, contrastarme scans, ongebruikelijke fonts en niet-Latijnse schriften leveren meer fouten op. Lees het resultaat altijd na.

Welke talen worden ondersteund?

Tesseract ondersteunt meer dan 100 talen via zijn taalpakketsysteem. Sunasty laadt de door jou gekozen taalgegevens rechtstreeks in je browser; er worden geen gegevens naar een server verzonden. Kies de juiste taal voordat je verwerkt, niet-overeenkomende taalmodellen verminderen de nauwkeurigheid aanzienlijk.

Kan het tekst uit een PDF met meerdere pagina's halen?

Ja. Elke pagina wordt achtereenvolgens herkend en de geextraheerde tekst wordt pagina voor pagina samengevoegd tot een uitvoer. De verwerkingstijd schaalt mee met het aantal pagina's en de complexiteit van elk daarvan.

Worden mijn bestanden naar een server geupload?

Nee. De herkenning draait op de Tesseract-engine gecompileerd naar WebAssembly, in dit browsertabblad; het taalmodel (traineddata) wordt één keer opgehaald van Sunasty's eigen origin en gecachet, daarna wordt je scan in het geheugen van je apparaat ingelezen, daar herkend, en verschijnt de tekst lokaal. Je afbeeldingen worden nooit naar Sunasty of derden verzonden. Open de DevTools van je browser, ga naar het tabblad «Network» en kijk: geen enkel verzoek draagt je scan.

Werkt het offline?

Ja, zodra de pagina is geladen. Omdat de verwerking op je apparaat gebeurt, kun je de netwerkverbinding verbreken en blijft de tool werken. Dit is het duidelijkste bewijs dat je gegevens je apparaat nooit verlaten.

Is het gratis? Heb ik een account nodig?

Het is volledig gratis en vereist geen registratie. Er zijn geen watermerken, geen daglimieten en geen trackingcookies nodig om de tool te gebruiken.