Como o OCR · imagem/PDF para texto funciona
OCR, Reconhecimento Ótico de Caracteres, extrai texto de imagens digitalizadas e PDFs baseados em imagem e fornece um resultado pesquisável e copiável. A Sunasty executa o Tesseract via WebAssembly, de modo que o motor de reconhecimento roda no seu próprio dispositivo.
A precisão depende da qualidade da sua digitalização e do idioma selecionado. Digitalizações nítidas e de alto contraste de texto impresso em um idioma suportado tipicamente produzem excelentes resultados; escrita à mão, digitalizações de baixa resolução, páginas com layouts de múltiplas colunas complexos ou scripts mistos serão menos precisas. Sempre revise a saída, particularmente para nomes, números e termos técnicos. Para melhores resultados, faça o deskew da digitalização primeiro com a ferramenta Deskew de PDF.