कोई अपलोड नहीं, 100% स्थानीय, कोई खाता नहीं

OCR, छवियों और PDF से टेक्स्ट निकालें

एक छवि या PDF डालें और पहचाना गया टेक्स्ट प्राप्त करें। OCR पूरी तरह आपके ब्राउज़र में चलता है (ऑन-डिवाइस, पहले लोड के बाद ऑफ़लाइन), कुछ भी अपलोड नहीं होता।

OCR · छवि/PDF से टेक्स्ट कैसे काम करता है

OCR, Optical Character Recognition, स्कैन की गई इमेज और इमेज-आधारित PDFs से टेक्स्ट निकालता है और आपको एक सर्चेबल, कॉपी करने योग्य परिणाम देता है। Sunasty WebAssembly के ज़रिये Tesseract चलाता है, इसलिए पहचान इंजन आपके डिवाइस पर ही होस्ट होता है।

सटीकता आपके स्कैन की गुणवत्ता और चुनी गई भाषा पर निर्भर करती है। समर्थित भाषा में मुद्रित टेक्स्ट के स्पष्ट, उच्च-कंट्रास्ट स्कैन आमतौर पर उत्कृष्ट परिणाम देते हैं; हस्तलेखन, कम-रिज़ॉल्यूशन स्कैन, जटिल मल्टी-कॉलम लेआउट वाले पृष्ठ या मिश्रित स्क्रिप्ट कम सटीक होंगे। हमेशा आउटपुट की समीक्षा करें, विशेष रूप से नामों, संख्याओं और तकनीकी शब्दों के लिए। सर्वोत्तम परिणामों के लिए, पहले PDF Deskew टूल से स्कैन को सीधा करें।

अक्सर पूछे जाने वाले प्रश्न

OCR कितना सटीक है?

सटीकता स्कैन गुणवत्ता, रिज़ॉल्यूशन और भाषा के साथ भिन्न होती है। अच्छी तरह समर्थित भाषा (English, French, German, Spanish, और अन्य) में 300 DPI या उससे अधिक पर स्कैन किया गया मुद्रित टेक्स्ट आमतौर पर उच्च सटीकता प्राप्त करता है। हस्तलेखन, कम-कंट्रास्ट स्कैन, असामान्य फॉन्ट और गैर-लैटिन स्क्रिप्ट अधिक त्रुटियाँ उत्पन्न करेंगी। हमेशा आउटपुट की जाँच करें।

कौन सी भाषाएँ समर्थित हैं?

Tesseract अपनी भाषा पैक प्रणाली के ज़रिये 100 से अधिक भाषाओं का समर्थन करता है। Sunasty आपके द्वारा चुने गए भाषा डेटा को सीधे आपके ब्राउज़र में लोड करता है; कोई डेटा सर्वर पर नहीं भेजा जाता। प्रोसेसिंग से पहले सही भाषा चुनें, गलत भाषा मॉडल सटीकता को काफी कम कर देते हैं।

क्या यह मल्टी-पेज PDF से टेक्स्ट निकाल सकता है?

हाँ। प्रत्येक पृष्ठ क्रम में पहचाना जाता है और निकाला गया टेक्स्ट पृष्ठ-दर-पृष्ठ एक आउटपुट में असेंबल होता है। प्रोसेसिंग समय पृष्ठों की संख्या और प्रत्येक की जटिलता के साथ बढ़ता है।

क्या मेरी फाइलें किसी सर्वर पर अपलोड होती हैं?

नहीं। पहचान इसी ब्राउज़र टैब में WebAssembly में कंपाइल किए गए Tesseract इंजन पर चलती है; भाषा मॉडल (traineddata) Sunasty के अपने मूल से एक बार डाउनलोड होकर कैश हो जाता है, फिर आपका स्कैन आपके डिवाइस की मेमोरी में पढ़ा जाता है, वहीं पहचाना जाता है, और टेक्स्ट स्थानीय रूप से दिखता है। आपकी छवियाँ कभी Sunasty या किसी तीसरे पक्ष को नहीं भेजी जातीं। अपने ब्राउज़र के DevTools खोलें, «Network» टैब पर जाएँ और देखें: कोई भी अनुरोध आपका स्कैन नहीं ले जाता।

क्या यह ऑफलाइन काम करता है?

हाँ, एक बार पृष्ठ लोड होने के बाद। क्योंकि प्रोसेसिंग आपके डिवाइस पर होती है, आप नेटवर्क से डिस्कनेक्ट कर सकते हैं और टूल काम करता रहता है। यही सबसे स्पष्ट प्रमाण है कि आपका डेटा कभी आपकी मशीन नहीं छोड़ता।

क्या यह मुफ़्त है? क्या मुझे अकाउंट चाहिए?

यह पूरी तरह मुफ़्त है और किसी साइन-अप की आवश्यकता नहीं है। कोई वाटरमार्क नहीं, कोई दैनिक सीमा नहीं और टूल का उपयोग करने के लिए कोई ट्रैकिंग कुकीज़ नहीं चाहिए।