Cara kerja OCR · gambar/PDF ke teks
OCR, Optical Character Recognition, mengekstrak teks dari gambar pindaian dan PDF berbasis gambar, lalu menghasilkan teks yang dapat dicari dan disalin. Sunasty menjalankan Tesseract melalui WebAssembly, dengan mesin pengenalan dan model bahasa yang di-host sendiri.
Akurasi bergantung pada kualitas pemindaian Anda dan bahasa yang dipilih. Pemindaian teks cetak yang tajam dan kontras tinggi dalam bahasa yang didukung biasanya menghasilkan hasil yang sangat baik; tulisan tangan, pemindaian resolusi rendah, halaman dengan tata letak multi-kolom kompleks, atau skrip campuran akan menghasilkan akurasi yang lebih rendah. Selalu tinjau output, terutama untuk nama, angka, dan istilah teknis. Untuk hasil terbaik, lakukan deskew pada pemindaian terlebih dahulu dengan alat PDF Deskew.