Sem upload, 100% local, sem conta

OCR, extrair texto de imagens e PDFs

Solte uma imagem ou PDF e obtenha o texto reconhecido. O OCR roda inteiramente no seu navegador (no dispositivo, offline após o primeiro carregamento), nada é enviado.

Como o OCR · imagem/PDF para texto funciona

OCR, Reconhecimento Ótico de Caracteres, extrai texto de imagens digitalizadas e PDFs baseados em imagem e fornece um resultado pesquisável e copiável. A Sunasty executa o Tesseract via WebAssembly, de modo que o motor de reconhecimento roda no seu próprio dispositivo.

A precisão depende da qualidade da sua digitalização e do idioma selecionado. Digitalizações nítidas e de alto contraste de texto impresso em um idioma suportado tipicamente produzem excelentes resultados; escrita à mão, digitalizações de baixa resolução, páginas com layouts de múltiplas colunas complexos ou scripts mistos serão menos precisas. Sempre revise a saída, particularmente para nomes, números e termos técnicos. Para melhores resultados, faça o deskew da digitalização primeiro com a ferramenta Deskew de PDF.

Perguntas frequentes

Qual é a precisão do OCR?

A precisão varia com a qualidade da digitalização, resolução e idioma. Texto impresso digitalizado a 300 DPI ou superior em um idioma bem suportado (inglês, francês, alemão, espanhol e outros) tipicamente alcança alta precisão. Escrita à mão, digitalizações de baixo contraste, fontes incomuns e scripts não latinos produzirão mais erros. Sempre revise a saída.

Quais idiomas são suportados?

O Tesseract suporta mais de 100 idiomas via seu sistema de pacote de idioma. A Sunasty carrega os dados de idioma que você seleciona diretamente no seu navegador; nenhum dado é enviado a um servidor. Selecione o idioma correto antes do processamento, modelos de idioma incompatíveis reduzem significativamente a precisão.

Ele pode extrair texto de um PDF de várias páginas?

Sim. Cada página é reconhecida em sequência e o texto extraído é montado em uma saída, página por página. O tempo de processamento escala com o número de páginas e a complexidade de cada uma.

Meus arquivos são enviados para um servidor?

Não. O reconhecimento é executado pelo motor Tesseract compilado para WebAssembly, dentro desta aba do navegador; o modelo de idioma (traineddata) é baixado uma vez da própria origem da Sunasty e armazenado em cache, depois seu escaneamento é carregado na memória do seu dispositivo, reconhecido ali e o texto aparece localmente. Suas imagens nunca são transmitidas para a Sunasty nem para terceiros. Abra o DevTools do navegador, vá até a aba «Network» e observe: nenhuma requisição transporta seu escaneamento.

Funciona offline?

Sim, após a página ter carregado. Como o processamento acontece no seu dispositivo, você pode desconectar da rede e a ferramenta continua funcionando. Essa é a prova mais clara de que seus dados nunca saem do seu computador.

É gratuito? Preciso criar uma conta?

É completamente gratuito e não requer cadastro. Não há marcas d'água, limites diários ou cookies de rastreamento necessários para usar a ferramenta.