Så fungerar OCR · bild/PDF till text
OCR, Optical Character Recognition, extraherar text från skannade bilder och bildbaserade PDF:er och ger dig ett sökbart, kopierbart resultat. Sunasty kör Tesseract via WebAssembly, så igenkänningsmotorn är självhostad och laddas med sidan.
Noggrannheten beror på kvaliteten på din skanning och det valda språket. Skarpa, högkontrastiga skanningar av tryckt text på ett stött språk ger vanligtvis utmärkta resultat; handskrift, lågupplösta skanningar, sidor med komplexa flerkolumnslayouter eller blandade skriftsystem blir mindre exakta. Granska alltid resultatet, särskilt för namn, siffror och tekniska termer. Bästa resultat uppnås om du deskewerar skanningen först med verktyget PDF Deskew.