So funktioniert OCR · Bild/PDF zu Text
OCR, Optische Zeichenerkennung, extrahiert Text aus gescannten Bildern und bildbasierten PDFs und liefert ein durchsuchbares, kopierbares Ergebnis. Sunasty führt Tesseract über WebAssembly aus, sodass die Erkennungs-Engine selbst auf Ihrem Gerät gehostet wird.
Die Genauigkeit hängt von der Qualität Ihres Scans und der gewählten Sprache ab. Scharfe, kontrastreiche Scans von gedrucktem Text in einer unterstützten Sprache liefern typischerweise hervorragende Ergebnisse; Handschrift, niedrig aufgelöste Scans, Seiten mit komplexen mehrspaltigen Layouts oder gemischten Schriften sind weniger genau. Überprüfen Sie immer die Ausgabe, insbesondere bei Namen, Zahlen und Fachbegriffen. Begradigen Sie den Scan für beste Ergebnisse zunächst mit dem Tool PDF-Begradigung.