Žádné nahrávání, 100% lokálně, bez účtu

OCR, extrahovat text z obrázků a PDF

Přetáhněte obrázek nebo PDF a získejte rozpoznaný text. OCR běží zcela v prohlížeči (v zařízení, offline po prvním načtení), nic se nenahrává.

Jak OCR · obrázek/PDF na text funguje

OCR - opticke rozpoznavani znaku - extrahuje text z naskenovanych obrazku a PDF zalozenych na obrazcich a poskytne vam vyhledatelny, kopirovatelny vysledek. Sunasty spousti Tesseract pomoci WebAssembly, takze rozpoznavaci engine je hostovany na vasem zarizeni.

Presnost zavisi na kvalite vaseho skenu a vybranem jazyce. Ostre, vysoce kontrastni skeny tistehoteho textu v podporovanem jazyce typicky davaji vynikajici vysledky; rukopis, skeny v nizkem rozliseni, stranky se slozitym vicesloupcovym rozvrzenim nebo smesenymi pismy budou mene presne. Vystup vzdy zkontrolujte, zejmena u jmen, cisel a technickych terminu. Pro nejlepsi vysledky sken nejprve narovnejte nastrojem PDF Deskew.

Často kladené otázky

Jak presne je OCR?

Presnost se lisi podle kvality skenu, rozliseni a jazyka. Tisteny text naskenovany pri 300 DPI nebo vyssim v dobre podporovanem jazyce (anglictina, francouzstina, nemcina, spanelstina a dalsi) typicky dosahuje vysoke presnosti. Rukopis, nizkokontrastni skeny, neobvykla pisma a nelatinska pisma budou produkovat vice chyb. Vystup vzdy zkorigujte.

Ktere jazyky jsou podporovany?

Tesseract podporuje pres 100 jazyku pomoci systemu jazykovych baliku. Sunasty nacte data jazyka, ktery vyberete, primo ve vasem prohlizeci; na server se neodesilaji zadna data. Pred zpracovanim vyberte spravny jazyk - neodpovidajici jazykove modely vyrazne snizuji presnost.

Muze extrahovat text z vicestrankoveho PDF?

Ano. Kazda stranka se rozpoznava postupne a extrahovany text se sestavuje do jednoho vystupu, stranku po strance. Doba zpracovani roste s poctem stranek a slozitosti kazde z nich.

Nahravaji se me soubory na server?

Ne. Rozpoznávání běží na enginu Tesseract zkompilovaném do WebAssembly, na této kartě prohlížeče; jazykový model (traineddata) se jednou stáhne z vlastního původu Sunasty a uloží do mezipaměti, poté se váš sken načte do paměti vašeho zařízení, tam se rozpozná a text se zobrazí místně. Vaše obrázky se nikdy nepřenášejí do Sunasty ani třetím stranám. Otevřete DevTools prohlížeče, přejděte na kartu „Network“ a sledujte: žádný požadavek nenese váš sken.

Funguje to offline?

Ano, jakmile se stranka nacte. Protoze zpracovani probiha na vasem zarizeni, muzete se odpojit od site a nastroj bude dal fungovat. To je nejjasnejsi dukaz, ze vasa data nikdy neopousti vas stroj.

Je to zdarma? Potrebuji ucet?

Je to zcela zdarma a nevyzaduje zadnou registraci. Zadne vodoznaky, zadne denni limity a zadne sledovaci cookies nejsou k pouziti nastroje potreba.