Как работи OCR · изображение/PDF към текст
OCR, Оптично разпознаване на символи, извлича текст от сканирани изображения и PDF файлове на базата на изображения и ви дава търсим, копируем резултат. Sunasty изпълнява Tesseract чрез WebAssembly, така че двигателят за разпознаване е самостоятелно хостван.
Точността зависи от качеството на сканирането и избрания език. Ясните, високо-контрастни сканирания на печатен текст на поддържан език обикновено дават отлични резултати; ръкописен текст, сканирания с ниска разделителна способност, страници с комплексни многоколонни оформления или смесени писмени системи ще бъдат по-малко точни. Винаги преглеждайте изхода, особено за имена, числа и технически термини. За най-добри резултати първо изравнете сканирането с инструмента PDF Deskew.