كيف تعمل PDF إلى نص
تستخرج أداة PDF إلى نص المحتوى النصي المضمّن في ملف PDF وتُسلّمه كملف .txt عادي. تقرأ تدفقات الأحرف المخزّنة في المستند, دون أي تعرف ضوئي على الأحرف (OCR)، لذا يكون الإخراج سريعًا ودقيقًا لملفات PDF التي أُنشئت رقميًا وأصبح نصها قابلًا للقراءة آليًا.
إذا كان ملف PDF صورة ممسوحة ضوئيًا دون طبقة نص مضمّنة، استخدم أداة OCR بدلًا من ذلك. لكل شيء آخر, العقود والتقارير والكتب الإلكترونية, تسحب هذه الأداة النص على الفور.