Πώς λειτουργεί το OCR · εικόνα/PDF σε κείμενο
Το OCR, Οπτική Αναγνώριση Χαρακτήρων, εξάγει κείμενο από σαρωμένες εικόνες και PDF βασισμένα σε εικόνες και σας δίνει ένα αποτέλεσμα με δυνατότητα αναζήτησης και αντιγραφής. Το Sunasty εκτελεί το Tesseract μέσω WebAssembly, οπότε η μηχανή αναγνώρισης φιλοξενείται αυτόνομα στη συσκευή σας.
Η ακρίβεια εξαρτάται από την ποιότητα της σάρωσής σας και την επιλεγμένη γλώσσα. Οι καθαρές, υψηλής αντίθεσης σαρώσεις τυπωμένου κειμένου σε υποστηριζόμενη γλώσσα συνήθως αποδίδουν εξαιρετικά αποτελέσματα· το χειρόγραφο, οι σαρώσεις χαμηλής ανάλυσης, οι σελίδες με πολύπλοκες πολυστήλες διατάξεις ή μεικτά σενάρια γραφής θα είναι λιγότερο ακριβείς. Πάντα ελέγχετε το αποτέλεσμα, ιδιαίτερα για ονόματα, αριθμούς και τεχνικούς όρους. Για καλύτερα αποτελέσματα, διορθώστε πρώτα την κλίση της σάρωσης με το εργαλείο PDF Deskew.