OCR · รูปภาพ/PDF เป็นข้อความ ทำงานอย่างไร
OCR หรือ Optical Character Recognition ดึงข้อความจากรูปภาพที่สแกนและ PDF ที่อิงภาพและให้ผลลัพธ์ที่ค้นหาและคัดลอกได้ Sunasty รัน Tesseract ผ่าน WebAssembly ดังนั้นเครื่องยนต์การจดจำจึงเป็น self-hosted บนอุปกรณ์ของคุณ
ความแม่นยำขึ้นอยู่กับคุณภาพการสแกนและภาษาที่เลือก การสแกนที่คมชัดและมีความคมชัดสูงของข้อความพิมพ์ในภาษาที่รองรับโดยทั่วไปให้ผลลัพธ์ที่ดีเยี่ยม การเขียนด้วยลายมือ การสแกนความละเอียดต่ำ หน้าที่มีเลย์เอาต์หลายคอลัมน์ซับซ้อนหรือสคริปต์ผสมจะมีความแม่นยำน้อยกว่า ตรวจสอบผลลัพธ์เสมอ โดยเฉพาะชื่อ ตัวเลข และคำศัพท์เทคนิค เพื่อผลลัพธ์ที่ดีที่สุด ให้แก้ความเอียงการสแกนก่อนด้วยเครื่องมือ PDF Deskew