OCR · 圖片/PDF 轉文字 的運作方式
OCR(光學字元辨識)從掃描圖片和以圖片為基礎的 PDF 中提取文字,提供可搜尋、可複製的結果。Sunasty 透過 WebAssembly 執行 Tesseract,辨識引擎自行託管。
準確率取決於掃描品質和所選語言。在受支援語言中,對清晰、高對比度的印刷文字進行掃描通常能達到出色效果;手寫、低解析度掃描、複雜多欄版面或混合文字的頁面準確率較低。請務必審閱輸出結果,尤其是人名、數字和專業術語。為獲得最佳效果,請先使用 PDF Deskew 工具對掃描件進行傾斜校正。