Papyrio
Pricing
← Tutti i convertitori

OCR PDF

Estrai testo da PDF scansionati o basati su immagini.

Trascina il tuo file qui, o sfoglia

PDF scansionato — max 50 MB · richiede 10–30 s

I file vengono eliminati immediatamente dopo la conversione · Mai archiviati né condivisi

Come funziona

  1. 1

    Carica il tuo PDF scansionato o basato su immagini

  2. 2

    Tesseract OCR legge ogni pagina a 300 DPI

  3. 3

    Scarica un file .txt con tutto il testo estratto

Caratteristiche

  • Powered by Tesseract — motore OCR standard del settore
  • Rendering a 300 DPI per massima precisione
  • Funziona su documenti scansionati e PDF basati su immagini
  • Senza registrazione
  • File eliminati subito dopo la conversione

Domande frequenti

Cos'è l'OCR?

L'OCR (Riconoscimento Ottico dei Caratteri) legge il testo dalle immagini. Se il tuo PDF è una scansione, l'OCR ne estrae il testo.

Che lingua è supportata?

Al momento solo l'inglese. Il supporto multilingue è in programma.

Quanto è accurato?

Dipende dalla qualità della scansione. Scansioni pulite ad alto contrasto a 300 DPI producono ottimi risultati.

Quanto ci vuole?

Circa 2–3 secondi per pagina. Un documento di 10 pagine richiede 20–30 secondi.