Χωρίς μεταφόρτωση, 100% τοπικά, χωρίς λογαριασμό

OCR, εξαγωγή κειμένου από εικόνες & PDF

Αφήστε μια εικόνα ή PDF και λάβετε το αναγνωρισμένο κείμενο. Το OCR εκτελείται εξ ολοκλήρου στο πρόγραμμα περιήγησής σας (στη συσκευή, εκτός σύνδεσης μετά την πρώτη φόρτωση), τίποτα δεν μεταφορτώνεται.

Πώς λειτουργεί το OCR · εικόνα/PDF σε κείμενο

Το OCR, Οπτική Αναγνώριση Χαρακτήρων, εξάγει κείμενο από σαρωμένες εικόνες και PDF βασισμένα σε εικόνες και σας δίνει ένα αποτέλεσμα με δυνατότητα αναζήτησης και αντιγραφής. Το Sunasty εκτελεί το Tesseract μέσω WebAssembly, οπότε η μηχανή αναγνώρισης φιλοξενείται αυτόνομα στη συσκευή σας.

Η ακρίβεια εξαρτάται από την ποιότητα της σάρωσής σας και την επιλεγμένη γλώσσα. Οι καθαρές, υψηλής αντίθεσης σαρώσεις τυπωμένου κειμένου σε υποστηριζόμενη γλώσσα συνήθως αποδίδουν εξαιρετικά αποτελέσματα· το χειρόγραφο, οι σαρώσεις χαμηλής ανάλυσης, οι σελίδες με πολύπλοκες πολυστήλες διατάξεις ή μεικτά σενάρια γραφής θα είναι λιγότερο ακριβείς. Πάντα ελέγχετε το αποτέλεσμα, ιδιαίτερα για ονόματα, αριθμούς και τεχνικούς όρους. Για καλύτερα αποτελέσματα, διορθώστε πρώτα την κλίση της σάρωσης με το εργαλείο PDF Deskew.

Συχνές ερωτήσεις

Πόσο ακριβές είναι το OCR;

Η ακρίβεια ποικίλλει ανάλογα με την ποιότητα σάρωσης, την ανάλυση και τη γλώσσα. Το τυπωμένο κείμενο σαρωμένο στα 300 DPI ή υψηλότερα σε καλά υποστηριζόμενη γλώσσα (Αγγλικά, Γαλλικά, Γερμανικά, Ισπανικά και άλλες) συνήθως επιτυγχάνει υψηλή ακρίβεια. Χειρόγραφο, σαρώσεις χαμηλής αντίθεσης, ασυνήθιστες γραμματοσειρές και μη λατινικά γράμματα θα παράγουν περισσότερα σφάλματα. Πάντα ελέγχετε το αποτέλεσμα.

Ποιες γλώσσες υποστηρίζονται;

Το Tesseract υποστηρίζει πάνω από 100 γλώσσες μέσω του συστήματος πακέτων γλωσσών. Το Sunasty φορτώνει τα γλωσσικά δεδομένα που επιλέγετε απευθείας στο πρόγραμμα περιήγησής σας· δεν αποστέλλεται κανένα δεδομένο σε διακομιστή. Επιλέξτε τη σωστή γλώσσα πριν από την επεξεργασία, τα αναντίστοιχα γλωσσικά μοντέλα μειώνουν σημαντικά την ακρίβεια.

Μπορεί να εξαγάγει κείμενο από ένα PDF πολλών σελίδων;

Ναι. Κάθε σελίδα αναγνωρίζεται διαδοχικά και το εξαγόμενο κείμενο συναρμολογείται σε μία έξοδο, σελίδα-σελίδα. Ο χρόνος επεξεργασίας κλιμακώνεται με τον αριθμό των σελίδων και την πολυπλοκότητα καθεμίας.

Τα αρχεία μου μεταφορτώνονται σε κάποιον διακομιστή;

Όχι. Η αναγνώριση εκτελείται στη μηχανή Tesseract μεταγλωττισμένη σε WebAssembly, μέσα σε αυτή την καρτέλα του προγράμματος περιήγησης· το γλωσσικό μοντέλο (traineddata) λαμβάνεται μία φορά από την ίδια την προέλευση της Sunasty και αποθηκεύεται στην cache, έπειτα η σάρωσή σας διαβάζεται στη μνήμη της συσκευής σας, αναγνωρίζεται εκεί, και το κείμενο εμφανίζεται τοπικά. Οι εικόνες σας δεν μεταδίδονται ποτέ στη Sunasty ή σε τρίτους. Ανοίξτε τα DevTools του προγράμματος περιήγησης, μεταβείτε στην καρτέλα «Network» και παρατηρήστε: κανένα αίτημα δεν μεταφέρει τη σάρωσή σας.

Λειτουργεί εκτός σύνδεσης;

Ναι, από τη στιγμή που η σελίδα έχει φορτωθεί. Επειδή η επεξεργασία γίνεται στη συσκευή σας, μπορείτε να αποσυνδεθείτε από το δίκτυο και το εργαλείο συνεχίζει να λειτουργεί. Αυτή είναι η πιο σαφής απόδειξη ότι τα δεδομένα σας δεν εγκαταλείπουν ποτέ τη συσκευή σας.

Είναι δωρεάν; Χρειάζομαι λογαριασμό;

Είναι εντελώς δωρεάν και δεν απαιτεί εγγραφή. Δεν υπάρχουν υδατογραφήματα, ημερήσια όρια ή cookies παρακολούθησης για να χρησιμοποιήσετε το εργαλείο.