OCR, ดึงข้อความจากรูปภาพและ PDF

วางรูปภาพหรือ PDF แล้วรับข้อความที่รู้จัก OCR ทำงานทั้งหมดในเบราว์เซอร์ของคุณ (บนอุปกรณ์ ออฟไลน์หลังจากโหลดครั้งแรก), ไม่มีการอัปโหลด

OCR · รูปภาพ/PDF เป็นข้อความ ทำงานอย่างไร

OCR แปลงภาพสแกนหรือ PDF ที่ใช้รูปภาพเป็นข้อความที่คุณสามารถคัดลอก ค้นหา และแก้ไขได้ โดยใช้ tesseract.js ที่ทำงานทั้งหมดภายในเบราว์เซอร์ของคุณ คุณเลือกภาษาเอกสารจากตัวเลือก โมเดลภาษาที่เกี่ยวข้องจะดาวน์โหลดไปยังเบราว์เซอร์ของคุณครั้งเดียว และการจดจำทั้งหมดที่ตามมาทำงานออฟไลน์จากโมเดลที่แคชนั้น ไฟล์สแกนของคุณไม่เคยถูกส่งไปยังเซิร์ฟเวอร์ใดระหว่างการแปลง

ความแม่นยำในการจดจำขึ้นอยู่กับคุณภาพการสแกนอย่างมาก การสแกนที่สะอาด คอนทราสต์สูงที่ 200 DPI หรือสูงกว่า พร้อมสัญญาณรบกวนพื้นหลังต่ำและการจัดวางหน้าตรง ให้ผลลัพธ์ที่ดีที่สุด JPEG ที่เบลอ ความละเอียดต่ำ หรือถูกบีบอัดหนัก หน้าที่มีคอลัมน์หรือเค้าโครงซับซ้อน และข้อความลายมือล้วนลดความแม่นยำ เครื่องมือส่งออกบล็อกข้อความธรรมดา สำหรับผลลัพธ์ที่มีโครงสร้างเช่นตารางที่เก็บรักษาหรือเค้าโครงหลายคอลัมน์ จำเป็นต้องประมวลผลหลังการแปลง การรัน PDF Deskew บนการสแกนที่เอียงก่อน OCR มักปรับปรุงอัตราการจดจำ

เขียนโดย Bastien Sulyan

วิธีใช้ OCR · รูปภาพ/PDF เป็นข้อความ ทีละขั้นตอน

วางภาพสแกน (PNG, JPG, TIFF) หรือ PDF ที่ใช้รูปภาพลงในพื้นที่อัปโหลด
เลือกภาษาหลักของเอกสารจากรายการดรอปดาวน์ภาษา
หากนี่เป็นครั้งแรกที่ใช้ภาษานั้น รอให้โมเดลภาษาดาวน์โหลด (เกิดขึ้นครั้งเดียว)
คลิก extract text แล้วรอให้ tesseract.js ประมวลผลแต่ละหน้า
คัดลอกข้อความที่จดจำได้หรือดาวน์โหลดเป็นไฟล์ข้อความธรรมดา

กรณีการใช้งานที่พบบ่อย

ใบเสร็จสแกนต้องการดึงรายการออกมาลงสเปรดชีต รัน OCR เพื่อรับข้อความ แล้ววางลงในซอฟต์แวร์บัญชีของคุณ
คลังเก็บบทความวารสารสแกนต้องการให้ค้นหาข้อความได้ แปลงแต่ละชิ้นเป็นข้อความด้วย OCR เพื่อสร้างดัชนี
ไวท์บอร์ดที่ถ่ายรูปในการประชุมมีบันทึกที่ต้องแปลงเป็นเอกสารที่แก้ไขได้
เอกสารสแกนทางประวัติศาสตร์เป็นภาษาเยอรมันต้องการดึงข้อความสำหรับการแปล เลือกภาษาเยอรมันก่อนรัน OCR

คำถามที่พบบ่อย

ทำไมฉันจึงต้องดาวน์โหลดโมเดลภาษาก่อนที่ OCR จะทำงาน

tesseract.js ใช้ไฟล์ข้อมูล neural network ที่ฝึกซึ่งเฉพาะกับแต่ละภาษา ไฟล์เหล่านี้มีขนาดหลายเมกะไบต์ต่อภาษาและดาวน์โหลดครั้งเดียวจากเว็บไซต์นี้ (เราจัดเก็บไฟล์เหล่านี้เองโดยไม่ใช้ CDN ของบุคคลที่สาม) ในครั้งแรกที่คุณเลือกภาษานั้น หลังจากดาวน์โหลดครั้งแรก โมเดลจะถูกแคชโดยเบราว์เซอร์ของคุณ และการจดจำต่อๆ มาสำหรับภาษานั้นทำงานออฟไลน์ทั้งหมด

ปัจจัยใดบ้างที่ส่งผลต่อความแม่นยำ OCR มากที่สุด

ความละเอียดสแกน (200 DPI ขั้นต่ำ 300 DPI แนะนำ) ความคมชัดของภาพ คอนทราสต์ระหว่างข้อความและพื้นหลัง และการที่หน้าตรงล้วนส่งผลต่อความแม่นยำอย่างมาก การสแกน JPEG ที่บีบอัดหนัก ฟอนต์ขนาดเล็กมาก และหน้าที่มีทิศทางผสมหรือเค้าโครงคอลัมน์ซับซ้อนเป็นแหล่งข้อผิดพลาดการจดจำที่พบบ่อยที่สุด

OCR สามารถอ่านข้อความลายมือได้หรือไม่

tesseract.js ฝึกมาสำหรับข้อความพิมพ์เป็นหลัก ความแม่นยำการจดจำลายมือโดยทั่วไปต่ำและไม่น่าเชื่อถือ โดยเฉพาะสำหรับตัวเขียนต่อกัน สำหรับเอกสารลายมือ เครื่องมือจดจำลายมือเฉพาะให้ผลลัพธ์ที่ดีกว่า

เอกสารสแกนของฉันถูกส่งไปที่ใดระหว่างการดึงข้อความหรือไม่

ไม่ หลังจากโมเดลภาษาถูกแคช งานการจดจำทุกอย่างเกิดขึ้นทั้งหมดในเบราว์เซอร์ของคุณโดยใช้ tesseract.js เอกสารสแกนอาจมีเนื้อหาส่วนตัวหรือลับ การประมวลผลในท้องถิ่นเท่านั้นหมายความว่าเนื้อหานั้นไม่เคยถึงเซิร์ฟเวอร์

เครื่องมือเก็บรักษาเค้าโครงของการสแกนต้นฉบับหรือไม่

ผลลัพธ์เป็น text stream ธรรมดาตามลำดับการอ่าน ตาราง คอลัมน์ ส่วนหัว และองค์ประกอบเค้าโครงอื่นๆ ไม่ถูกเก็บรักษาเป็นโครงสร้าง เครื่องมือส่งออกเฉพาะเนื้อหาข้อความ สำหรับผลลัพธ์ที่เก็บเค้าโครง จำเป็นต้องใช้ pipeline OCR ขั้นสูงกว่าพร้อมการวิเคราะห์เค้าโครง

ฉันสามารถ OCR PDF ที่มีข้อความที่เลือกได้อยู่แล้วได้หรือไม่

เครื่องมือสามารถประมวลผล PDF ที่ใช้รูปภาพซึ่งแต่ละหน้าเป็นภาพ raster ที่ไม่มีข้อความที่ฝัง หาก PDF ของคุณมีชั้นข้อความอยู่แล้ว (คุณสามารถเลือกและคัดลอกข้อความในโปรแกรมดูได้) การรัน OCR ไม่จำเป็น ชั้นข้อความที่มีอยู่ให้ข้อมูลเดียวกันโดยไม่ต้องผ่านขั้นตอนการจดจำ

ฉันสามารถรัน OCR กับภาพที่ถ่ายด้วยมือถือได้ไหม?

ได้ และ tesseract.js ทำงานได้บนเบราว์เซอร์มือถือ ดังนั้นคุณสามารถเปิดหน้านี้บนมือถือเครื่องเดียวกับที่ถ่ายภาพนั้นได้เลย ภาพที่ถ่ายในมุมเอียงหรือแสงไม่สม่ำเสมอจะถูกจดจำได้แย่กว่าการสแกนแบบ flatbed การจัดภาพให้ตรงและครอปพื้นหลังออกก่อนจะช่วยได้

ฉันต้องสร้างบัญชีหรือจ่ายเงินเพื่อใช้ OCR หรือไม่?

ไม่ต้อง ไม่มีการสมัครสมาชิกและไม่มีค่าใช้จ่าย การดาวน์โหลดเพียงอย่างเดียวที่เกี่ยวข้องคือโมเดลภาษาที่ tesseract.js ต้องการ ซึ่งเป็นการดาวน์โหลด engine ครั้งเดียว ไม่ใช่การสมัครสมาชิกหรือ paywall

เครื่องมือที่เกี่ยวข้อง

เก็บทุกอย่างไว้ในเครื่อง, สำรวจเครื่องมือเสริม

เครื่องมือ PDF ทั้งหมด