OCR · 이미지/PDF를 텍스트로 작동 방식
OCR, 광학 문자 인식, 은 스캔된 이미지와 이미지 기반 PDF에서 텍스트를 추출하여, 검색 및 복사가 가능한 결과물을 제공합니다. Sunasty는 WebAssembly를 통해 Tesseract를 실행하므로, 인식 엔진이 사용자의 기기에 자체 호스팅됩니다.
정확도는 스캔 품질과 선택한 언어에 따라 달라집니다. 지원되는 언어로 된 인쇄 텍스트를 선명하고 명암 대비가 높게 스캔한 경우 보통 우수한 결과를 얻습니다. 손글씨, 저해상도 스캔, 복잡한 다단 레이아웃이나 혼합된 문자 체계가 있는 페이지는 정확도가 떨어집니다. 특히 이름, 숫자, 전문 용어는 결과를 항상 검토하세요. 최상의 결과를 위해서는 먼저 PDF 기울기 보정 도구로 스캔을 바로잡으세요.