無需上傳, 100% 本機處理, 無需帳戶

OCR, 從圖片與 PDF 提取文字

放入圖片或 PDF 即可取得辨識文字。OCR 完全在您的瀏覽器中執行(裝置端,首次載入後可離線), 不會上傳任何內容。

OCR · 圖片/PDF 轉文字 的運作方式

OCR(光學字元辨識)從掃描圖片和以圖片為基礎的 PDF 中提取文字,提供可搜尋、可複製的結果。Sunasty 透過 WebAssembly 執行 Tesseract,辨識引擎自行託管。

準確率取決於掃描品質和所選語言。在受支援語言中,對清晰、高對比度的印刷文字進行掃描通常能達到出色效果;手寫、低解析度掃描、複雜多欄版面或混合文字的頁面準確率較低。請務必審閱輸出結果,尤其是人名、數字和專業術語。為獲得最佳效果,請先使用 PDF Deskew 工具對掃描件進行傾斜校正。

常見問題

OCR 的準確率如何?

準確率因掃描品質、解析度和語言而異。以 300 DPI 或更高解析度掃描的印刷文字,在受良好支援的語言(英文、法文、德文、西班牙文等)中通常能達到高準確率。手寫、低對比度掃描、不常見字型和非拉丁文字腳本會產生更多錯誤。請務必校對輸出結果。

支援哪些語言?

Tesseract 透過其語言包系統支援逾 100 種語言。Sunasty 直接在您的瀏覽器中載入您所選的語言資料;不會向伺服器傳送任何資料。請在處理前選擇正確的語言, , 語言模型不符會大幅降低準確率。

它能從多頁 PDF 中提取文字嗎?

可以。每頁依序進行辨識,提取的文字逐頁組合為一份輸出。處理時間與頁數及每頁的複雜度成正比。

我的檔案會上傳到伺服器嗎?

不會。辨識由編譯為 WebAssembly 的 Tesseract 引擎在此瀏覽器分頁中執行;語言模型(traineddata)從 Sunasty 自己的來源僅取得一次並快取,接著您的掃描件被讀入您裝置的記憶體,在本機辨識,文字在本機顯示。您的圖片絕不會傳送給 Sunasty 或任何第三方。開啟瀏覽器的 DevTools,切換到「Network」分頁觀察:沒有任何請求夾帶您的掃描件。

可以離線使用嗎?

可以,頁面載入後即可離線使用。由於處理在您的裝置上進行,您可以中斷網路連線,工具仍可正常運作。這是您的資料從未離開裝置最明確的證明。

免費嗎?需要帳號嗎?

完全免費,無需註冊。使用工具時沒有浮水印、沒有每日限制、也不需要追蹤 Cookie。