Ingen uppladdning, 100% lokalt, inget konto

OCR, extrahera text från bilder och PDF:er

Släpp en bild eller PDF och få den igenkända texten. OCR körs helt i din webbläsare (på enheten, offline efter första laddningen), ingenting laddas upp.

Så fungerar OCR · bild/PDF till text

OCR, Optical Character Recognition, extraherar text från skannade bilder och bildbaserade PDF:er och ger dig ett sökbart, kopierbart resultat. Sunasty kör Tesseract via WebAssembly, så igenkänningsmotorn är självhostad och laddas med sidan.

Noggrannheten beror på kvaliteten på din skanning och det valda språket. Skarpa, högkontrastiga skanningar av tryckt text på ett stött språk ger vanligtvis utmärkta resultat; handskrift, lågupplösta skanningar, sidor med komplexa flerkolumnslayouter eller blandade skriftsystem blir mindre exakta. Granska alltid resultatet, särskilt för namn, siffror och tekniska termer. Bästa resultat uppnås om du deskewerar skanningen först med verktyget PDF Deskew.

Vanliga frågor

Hur noggrann är OCR?

Noggrannheten varierar med skanningskvalitet, upplösning och språk. Tryckt text skannad i 300 DPI eller högre på ett välstött språk (engelska, franska, tyska, spanska med flera) uppnår vanligtvis hög noggrannhet. Handskrift, lågkontrastiga skanningar, ovanliga typsnitt och icke-latinska skriftsystem ger fler fel. Korrekturläs alltid resultatet.

Vilka språk stöds?

Tesseract stöder över 100 språk via sitt språkpaketsystem. Sunasty laddar språkdata du väljer direkt i din webbläsare; ingen data skickas till en server. Välj rätt språk innan bearbetning, felaktiga språkmodeller minskar noggrannheten avsevärt.

Kan den extrahera text från en PDF med flera sidor?

Ja. Varje sida känns igen i sekvens och den extraherade texten sammanställs till en utdata, sida för sida. Bearbetningstiden ökar med antalet sidor och komplexiteten hos var och en.

Laddas mina filer upp till en server?

Nej. Igenkänningen körs på Tesseract-motorn kompilerad till WebAssembly, i den här webbläsarfliken; språkmodellen (traineddata) hämtas en gång från Sunastys eget ursprung och cachas, sedan läses din skanning in i minnet på din enhet, känns igen där, och texten visas lokalt. Dina bilder överförs aldrig till Sunasty eller tredje part. Öppna webbläsarens DevTools, gå till fliken «Network» och titta: ingen begäran bär din skanning.

Fungerar det offline?

Ja, när sidan väl har laddats. Eftersom bearbetningen sker på din enhet kan du koppla från nätverket och verktyget fortsätter att fungera. Det är det tydligaste beviset på att din data aldrig lämnar din maskin.

Är det gratis? Behöver jag ett konto?

Det är helt gratis och kräver ingen registrering. Det finns inga vattenstämplar, inga dagliga begränsningar och inga spårningscookies som behövs för att använda verktyget.