कोई अपलोड नहीं, 100% स्थानीय, कोई खाता नहीं

PDF → टेक्स्ट निष्कर्षण

अपने PDF से सभी पठनीय टेक्स्ट निकालें। .txt फ़ाइल के रूप में डाउनलोड करें। सब कुछ आपके ब्राउज़र में रहता है, कोई फ़ाइल सर्वर को नहीं भेजी जाती।

PDF से टेक्स्ट कैसे काम करता है

PDF to text, PDF में एम्बेडेड टेक्स्ट सामग्री निकालता है और इसे एक सादे .txt फ़ाइल के रूप में देता है। यह दस्तावेज़ में संग्रहीत वर्ण स्ट्रीम पढ़ता है, कोई OCR शामिल नहीं, इसलिए डिजिटल रूप से बनाए गए PDF के लिए आउटपुट तेज़ और सटीक है जहाँ टेक्स्ट पहले से मशीन-पठनीय है।

यदि आपकी PDF एक स्कैन की गई छवि है जिसमें कोई एम्बेडेड टेक्स्ट लेयर नहीं है, तो इसके बजाय OCR टूल का उपयोग करें। बाकी सब के लिए, अनुबंध, रिपोर्ट, ई-बुक, यह उपकरण टेक्स्ट को तुरंत निकालता है।

अक्सर पूछे जाने वाले प्रश्न

क्या मेरी फ़ाइलें किसी सर्वर पर अपलोड होती हैं?

नहीं। आपके PDF का टेक्स्ट, pdf.js द्वारा निकाला जाता है, वही इंजन जिसका उपयोग Firefox, PDF दिखाने के लिए करता है, जो आपके ब्राउज़र टैब में चलता है। हर पृष्ठ की कैरेक्टर स्ट्रीम getTextContent के ज़रिए आपके अपने डिवाइस की मेमोरी में पढ़ी जाती है, वहीं सादे टेक्स्ट में जोड़ी जाती है, और परिणाम एक स्थानीय .txt डाउनलोड के रूप में दिया जाता है। कुछ भी Sunasty या किसी तीसरे पक्ष को नहीं भेजा जाता। आप इसे स्वयं सत्यापित कर सकते हैं: अपने ब्राउज़र के DevTools खोलें, Network टैब पर जाएँ और देखें, कोई भी अनुरोध आपकी फ़ाइल को नहीं ले जाता।

क्या यह स्कैन किए गए PDF पर काम करेगा?

केवल तभी जब स्कैन किए गए दस्तावेज़ में पहले से एक एम्बेडेड टेक्स्ट लेयर हो (उदाहरण के लिए, किसी पूर्व OCR पास द्वारा जोड़ी गई)। एक शुद्ध केवल-छवि स्कैन में कोई मशीन-पठनीय टेक्स्ट नहीं होता, इसलिए निकालने पर खाली परिणाम मिलेगा, उस स्थिति में, पहले टेक्स्ट लेयर उत्पन्न करने के लिए Sunasty पर OCR टूल का उपयोग करें।

क्या यह पृष्ठ विराम और फ़ॉर्मेटिंग बनाए रखता है?

सादे टेक्स्ट में कोई लेआउट मॉडल नहीं होता, इसलिए समृद्ध फ़ॉर्मेटिंग, कॉलम, टेबल, फ़ॉन्ट आकार, संरक्षित नहीं होती। आपको टेक्स्ट वर्णों का पठन क्रम मिलता है जैसे वे PDF में संग्रहीत हैं। पैराग्राफ विराम अनुमानित होते हैं लेकिन जटिल लेआउट को मैन्युअल सुधार की आवश्यकता हो सकती है।

क्या यह ऑफ़लाइन काम करता है?

हाँ, एक बार पृष्ठ लोड होने के बाद। क्योंकि प्रोसेसिंग आपके डिवाइस पर होती है, आप नेटवर्क से डिस्कनेक्ट कर सकते हैं और उपकरण काम करता रहेगा। यह सबसे स्पष्ट प्रमाण है कि आपका डेटा कभी भी आपकी मशीन नहीं छोड़ता।

क्या यह मुफ़्त है? क्या मुझे खाता चाहिए?

यह पूरी तरह मुफ़्त है और किसी साइन-अप की आवश्यकता नहीं है। कोई वॉटरमार्क नहीं, कोई दैनिक सीमा नहीं और उपकरण का उपयोग करने के लिए कोई ट्रैकिंग कुकी की आवश्यकता नहीं है।