PDF 轉文字 的運作方式
PDF 轉文字工具提取嵌入在 PDF 中的文字內容,並以純 .txt 檔案的形式輸出。它讀取文件中儲存的字元串流,不涉及 OCR,因此對於文字已可機器讀取的數位化 PDF,輸出結果快速且精確。
如果您的 PDF 是沒有嵌入文字層的掃描圖像,請改用 OCR 工具。對於其他情況(合約、報告、電子書),此工具可即時提取文字。
從您的 PDF 擷取所有可讀取的文字。下載為 .txt 檔案。所有處理均在瀏覽器中進行, 不會傳送任何檔案至伺服器。
PDF 轉文字工具提取嵌入在 PDF 中的文字內容,並以純 .txt 檔案的形式輸出。它讀取文件中儲存的字元串流,不涉及 OCR,因此對於文字已可機器讀取的數位化 PDF,輸出結果快速且精確。
如果您的 PDF 是沒有嵌入文字層的掃描圖像,請改用 OCR 工具。對於其他情況(合約、報告、電子書),此工具可即時提取文字。
不會。您的 PDF 文字由 pdf.js(Firefox 用來顯示 PDF 的引擎)在您瀏覽器分頁中擷取。每一頁的字元串流透過 getTextContent 在您自己裝置的記憶體中讀取、就地組合成純文字,產生的結果以本地 .txt 下載的形式提供。沒有任何內容傳送到 Sunasty 或任何第三方。您可以自行驗證:開啟瀏覽器的 DevTools,前往「網路」分頁觀察, , 沒有任何請求攜帶您的檔案。
只有在掃描文件已具有嵌入文字層的情況下才能處理(例如,由先前的 OCR 處理新增的文字層)。純圖像掃描件不含任何可機器讀取的文字,因此提取結果將是空的, , 在這種情況下,請先使用 Sunasty 上的 OCR 工具來生成文字層。
純文字沒有版面模型,因此欄位、表格、字型大小等豐富的排版格式不會被保留。您得到的是文字字元在 PDF 中儲存時的閱讀順序。段落分隔會近似地保留,但複雜的版面可能需要手動整理。
可以,頁面載入完成後即可離線使用。由於處理在您的裝置上進行,您可以中斷網路連線,工具仍可繼續運作。這是您的資料從未離開您裝置的最有力證明。
完全免費,無需註冊。沒有浮水印、沒有每日使用限制,使用此工具也不需要追蹤 Cookie。