Kein Upload, 100% lokal, kein Konto

OCR, Text aus Bildern & PDFs extrahieren

Bild oder PDF ablegen und den erkannten Text erhalten. Die OCR läuft vollständig in Ihrem Browser (geräteeigen, offline nach dem ersten Laden), nichts wird hochgeladen.

So funktioniert OCR · Bild/PDF zu Text

OCR, Optische Zeichenerkennung, extrahiert Text aus gescannten Bildern und bildbasierten PDFs und liefert ein durchsuchbares, kopierbares Ergebnis. Sunasty führt Tesseract über WebAssembly aus, sodass die Erkennungs-Engine selbst auf Ihrem Gerät gehostet wird.

Die Genauigkeit hängt von der Qualität Ihres Scans und der gewählten Sprache ab. Scharfe, kontrastreiche Scans von gedrucktem Text in einer unterstützten Sprache liefern typischerweise hervorragende Ergebnisse; Handschrift, niedrig aufgelöste Scans, Seiten mit komplexen mehrspaltigen Layouts oder gemischten Schriften sind weniger genau. Überprüfen Sie immer die Ausgabe, insbesondere bei Namen, Zahlen und Fachbegriffen. Begradigen Sie den Scan für beste Ergebnisse zunächst mit dem Tool PDF-Begradigung.

Häufig gestellte Fragen

Wie genau ist die OCR?

Die Genauigkeit variiert je nach Scanqualität, Auflösung und Sprache. Gedruckter Text, der mit 300 DPI oder höher in einer gut unterstützten Sprache (Englisch, Französisch, Deutsch, Spanisch und andere) gescannt wurde, erreicht typischerweise hohe Genauigkeit. Handschrift, kontrastarme Scans, ungewöhnliche Schriften und nicht-lateinische Schriften erzeugen mehr Fehler. Korrekturlesen Sie immer die Ausgabe.

Welche Sprachen werden unterstützt?

Tesseract unterstützt über 100 Sprachen über sein Sprachpaket-System. Sunasty lädt die von Ihnen gewählten Sprachdaten direkt in Ihrem Browser; es werden keine Daten an einen Server gesendet. Wählen Sie vor der Verarbeitung die richtige Sprache, nicht übereinstimmende Sprachmodelle reduzieren die Genauigkeit erheblich.

Kann es Text aus einer mehrseitigen PDF extrahieren?

Ja. Jede Seite wird der Reihe nach erkannt und der extrahierte Text wird seitenweise zu einer Ausgabe zusammengestellt. Die Verarbeitungszeit skaliert mit der Anzahl der Seiten und der Komplexität jeder einzelnen.

Werden meine Dateien auf einen Server hochgeladen?

Nein. Die Erkennung läuft mit der zu WebAssembly kompilierten Tesseract-Engine in diesem Browser-Tab; das Sprachmodell (traineddata) wird einmal von Sunastys eigenem Ursprung geladen und zwischengespeichert, dann wird Ihr Scan auf Ihrem Gerät in den Arbeitsspeicher gelesen, dort erkannt, und der Text erscheint lokal. Ihre Bilder werden nie an Sunasty oder Dritte übertragen. Öffnen Sie die DevTools des Browsers, wechseln Sie zum Tab „Network“ und beobachten Sie: keine Anfrage trägt Ihren Scan.

Funktioniert das Tool offline?

Ja, sobald die Seite geladen ist. Da die Verarbeitung auf Ihrem Gerät stattfindet, können Sie die Netzwerkverbindung trennen und das Tool funktioniert weiterhin. Das ist der deutlichste Beweis dafür, dass Ihre Daten Ihr Gerät nie verlassen.

Ist es kostenlos? Benötige ich ein Konto?

Es ist völlig kostenlos und erfordert keine Registrierung. Es gibt keine Wasserzeichen, keine Tageslimits und keine Tracking-Cookies, um das Tool zu nutzen.