Jak działa OCR · obraz/PDF do tekstu
OCR, optyczne rozpoznawanie znaków, wyodrębnia tekst ze skanowanych obrazów i PDF-ów opartych na obrazach i daje w wyniku przeszukiwalny, możliwy do skopiowania tekst. Sunasty uruchamia Tesseract bezpośrednio w Twojej przeglądarce za pośrednictwem WebAssembly, więc silnik rozpoznawania jest hostowany samodzielnie na Twoim urządzeniu.
Dokładność zależy od jakości skanu i wybranego języka. Wyraźne, wysokiej kontrastowości skany drukowanego tekstu w obsługiwanym języku zazwyczaj dają doskonałe wyniki; pismo odręczne, skany o niskiej rozdzielczości, strony ze złożonym wielokolumnowym układem lub mieszanymi pismami będą mniej dokładne. Zawsze sprawdzaj wynik, szczególnie imiona, liczby i terminy techniczne. Aby uzyskać najlepsze rezultaty, najpierw wyprostuj skan za pomocą narzędzia PDF Deskew.