OCR · छवि/PDF से टेक्स्ट कैसे काम करता है
OCR, Optical Character Recognition, स्कैन की गई इमेज और इमेज-आधारित PDFs से टेक्स्ट निकालता है और आपको एक सर्चेबल, कॉपी करने योग्य परिणाम देता है। Sunasty WebAssembly के ज़रिये Tesseract चलाता है, इसलिए पहचान इंजन आपके डिवाइस पर ही होस्ट होता है।
सटीकता आपके स्कैन की गुणवत्ता और चुनी गई भाषा पर निर्भर करती है। समर्थित भाषा में मुद्रित टेक्स्ट के स्पष्ट, उच्च-कंट्रास्ट स्कैन आमतौर पर उत्कृष्ट परिणाम देते हैं; हस्तलेखन, कम-रिज़ॉल्यूशन स्कैन, जटिल मल्टी-कॉलम लेआउट वाले पृष्ठ या मिश्रित स्क्रिप्ट कम सटीक होंगे। हमेशा आउटपुट की समीक्षा करें, विशेष रूप से नामों, संख्याओं और तकनीकी शब्दों के लिए। सर्वोत्तम परिणामों के लिए, पहले PDF Deskew टूल से स्कैन को सीधा करें।