Annuncio pubblicitario

Se desideri convertire qualsiasi testo stampato in testo digitale che puoi copiare, incollare, modificare e cercare, dovrai utilizzare gli scanner di riconoscimento ottico dei caratteri (OCR).

Quando scegli di scansionare o scattare una foto di un documento, questo verrà salvato in un formato come JPEG o PDF. Software OCR può quindi riconoscere le lettere e i numeri all'interno di questi documenti e convertirli in a PDF ricercabile 4 metodi per creare e modificare file PDF gratuitamenteTra tutti i tipi di file comuni presenti nel nostro mondo informatico, il PDF è probabilmente uno dei più restrittivi, mentre allo stesso tempo è disponibile per tutti (principalmente per leggere) ... Leggi di più o in un file che puoi modificare in programmi come Microsoft Word.

Il problema è che alcuni scanner OCR funzionano molto meglio di altri, con il meglio che è piuttosto pesante sul portafoglio.

Omnipage18, ad esempio, costa $ 150, ma è particolarmente bravo a riconoscere lingue diverse.

instagram viewer
Adobe Acrobat Pro DC costa $ 400 da far venire l'acquolina in bocca ma ha una precisione incredibile. ABBYY FineReader costa $ 150, ma è fantastico nel convertire documenti come riviste e opuscoli in testo ricercabile. Testeremo l'offerta online di ABBYY più avanti in questo articolo.

Tuttavia, se cerchi alternative gratuite che puoi Scarica e utilizzalo su Windows o OS X, dovresti prova questi strumenti OCR I 5 migliori strumenti OCR per l'estrazione di testo dalle immaginiQuando hai risme di carta, come puoi convertire tutto quel testo stampato in qualcosa che un programma digitale sarà in grado di riconoscere e indicizzare? Tieni vicino un buon software OCR. Leggi di più . Ma se preferisci usare un servizio gratuito, in linea Strumento OCR, continua a leggere, poiché abbiamo provato i primi, con i risultati seguenti.

Il test

Sembra che la maggior parte delle persone ora usi il proprio smartphone per fare la scansione per loro Scansiona e gestisci le tue ricevute, risparmia spazio, carta e tempoLe ricevute cartacee si perdono facilmente e sono difficili da trovare quando ne hai più bisogno. Per fortuna, passare al digitale risolve entrambi questi problemi. Leggi di più , Ho deciso di utilizzare L'app scansionabile di Evernote (Gratuito su iOS e Android). Ho scannerizzato la prima pagina di Richard Dawkin Supporto rampicante improbabile, per vedere quali risultati potremmo ottenere con una formattazione molto semplice. Ho anche scannerizzato una pagina di Tim Ferriss " Lo chef di 4 ore per provare gli scanner con una formattazione leggermente più complicata. Ho salvato ciascuno di questi file come PDF.

Test di OCR online

Questi documenti sono stati poi esaminati attraverso alcuni dei presunti migliori strumenti OCR online per vedere quanto andavano bene.

OCR online gratuito [Non più disponibile]

Fortunatamente, non è richiesta la registrazione per utilizzare l'OCR online gratuito. E sono stato doppiamente impressionato quando ho visto la loro richiesta di mantenere la formattazione e il layout del mio documento.

OCR online gratuito

Il sito afferma di essere in grado di supportare PDF, GIF, BMP, JPEG, TIFF e PNG come input. Gli output possono essere DOC, un documento di testo PDF, RTF e TXT. Sfortunatamente, non sono riuscito a scoprire se avevano un limite di dimensioni del file.

Documento di base in PDF
Convertito assolutamente perfettamente. Non c'è molto altro da dire! Andiamo a a molto buon inizio.

Documento di base a DOC
Le parole reali sembrano essersi convertite in modo impeccabile, a parte la "ount" di "Mount Rushmore" che in qualche modo diventa AWOL. La formattazione è una storia diversa, però. Molte virgole sono state sostituite da caratteri di sottolineatura e spazi casuali sono stati inseriti in punti in tutto il documento. Quando in seguito vedrai come si è comportato il software premium in questo test, questo non è un brutto sforzo affatto.

Documento complesso in PDF
La conversione del documento ha richiesto ben 120 secondi! Una volta completato, tutto il testo era stato convertito con un'accuratezza di circa il 95%, sebbene il testo nella casella separata in alto a destra della pagina fosse irrintracciabile. Anche alcuni altri caratteri nel PDF erano errati.

Documento complesso a DOC
Questa volta, la conversione ha richiesto solo 10 secondi, con il testo nuovamente convertito con una precisione del 95% circa. Ci sono stati alcuni strani problemi di spaziatura e il software ha avuto difficoltà a convertire il carattere in alto a destra nel documento e ha perso alcuni caratteri qua e là.

Verdetto
Se vuoi convertire documenti semplicemente formattati in PDF, questo è uno strumento fantastico. In termini di conversione in DOC, i risultati non erano nulla di cui scrivere.

i2OCR fa alcune affermazioni impressionanti. Lo strumento riconosce oltre 60 lingue, può gestire layout multi-colonna (rimuovendo la formattazione), non ha limiti di dimensione del file, può convertire i file caricati e dagli URL. E non è necessario registrarsi per utilizzare questo strumento.

Il servizio funziona semplicemente estraendo il testo dall'immagine, quindi emettendo testo non formattato. È possibile correggere rapidamente eventuali errori nella vista affiancata, prima di copiare il testo in altri programmi o scaricarlo come DOC, PDF o HTML.

Nota: quando ho provato a caricare i miei documenti PDF, questi sono stati rifiutati da i2OCR, quindi ho dovuto convertirli in JPEG (prendendo uno screenshot di loro, quindi caricando i file).

Documento di base in testo normaleScreen Shot 2016-11-11 alle 12.30.28
A causa del modo in cui funziona questo strumento, tutta la formattazione viene persa, sebbene la conversione da immagine a testo sia stata quasi perfetta. Ci sono stati alcuni piccoli errori come la spaziatura dei paragrafi e alcune virgole sono state sostituite da punti, ma questi sono piccoli ostacoli.

Documento complesso in testo sempliceScreen Shot 11/02/2016 alle 12.39.48
La maggior parte del testo è stata convertita senza troppi errori, a parte il titolo e la ricetta in alto a destra, che era illeggibile per questo strumento. Il modo in cui le colonne sono state convertite in testo semplice era tutt'altro che ideale. Se vuoi rendere praticabile questa conversione, sarebbe necessario molto tempo per riorganizzare le linee in frasi coerenti.

Verdetto
Per i documenti di base, i2OCR funziona alla grande. Anche la possibilità di modificare il testo prima del download è un bel tocco. Per documenti più complessi, tuttavia, la conversione è ancora abbastanza accurata, ma il modo in cui il testo viene emesso non renderà la tua vita molto più semplice.

L'OCR online attualmente supporta 46 lingue diverse e può convertire PDF, JPG, BMP, TIFF e GIF in formato Word, Excel o Testo semplice. Il sito afferma che "i documenti convertiti assomigliano esattamente all'originale: tabelle, colonne e grafici".

La versione che è possibile utilizzare senza registrarsi consente di convertire fino a 15 immagini all'ora (limite di 5 MB). Se ti registri per un account, puoi acquistare più pagine oltre questo limite, e allo stesso tempo essere in grado di convertire documenti multipagina e archivi ZIP.

Risultati OCR online

Documento di base a DOC
Il documento di base è stato convertito in modo impeccabile a parte il numero romano io non essere raccolto. Come promesso dal sito, la formattazione era esattamente come nel libro. Complimenti per questo strumento.

Documento complesso a DOC
Dopo essere stato deluso dai precedenti strumenti OCR nella conversione del documento complesso, sono stato fortemente impressionato dall'OCR online. Il layout era quasi perfetto, come puoi vedere sopra. Ancora una volta, però, la ricetta non è stata presa troppo bene, ma altri errori minori sono stati trascurabili.

Verdetto

Risultati assolutamente fantastici dall'OCR online. L'unico aspetto negativo che vedo è che non c'è modo di scaricare i documenti convertiti come PDF poiché i formati di output menzionati includono solo DOCX, XLSX e TXT.

Come accennato in precedenza, ABBYY è uno dei leader di mercato nel software OCR, che costa circa $ 150 per il loro programma completo e scaricabile. Offrono a Versione di prova gratuita di 10 pagine per il loro strumento online, tuttavia (è richiesta la registrazione). Per un abbonamento di $ 5, il loro strumento online ti permetterà di convertire 200 pagine ogni mese.

ABBYY FineReader online

I file accettati possono essere fino a 100 MB, in uno di questi formati: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP e PNG. ABBYY riconosce anche quasi 200 lingue. Le uscite sono particolarmente impressionanti, con una scelta tra DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 ed EPUB.

Puoi anche provare un paio di funzionalità BETA durante la prova. La prima è l'opzione per tradurre il tuo documento in un'altra lingua. L'altro è esportare il documento convertito nel tuo account di archiviazione cloud, che sia Dropbox, Google Drive, Evernote, Microsoft OneDrive o Box.

Documento di base su DOCX
I risultati complessivi sono stati buoni, ma non sorprendenti considerando che si tratta di un prodotto premium. Molteplici virgole e punti sono stati scambiati, diverse virgolette sono state sostituite da un asterisco, mancavano un paio di lettere maiuscole e una parola (letteralista) è stata digitata in modo errato.

Documento complesso a DOCX
Una volta convertiti, c'erano pochi difetti nel testo all'interno del documento (a parte l'OCR alle prese con il carattere di quella ricetta!), Ma la formattazione lasciava molto a desiderare.

Risultato ABBYY

Le tre colonne occupavano in qualche modo due pagine, con la colonna centrale solo appare sulla seconda pagina. Se lo volessi davvero fare qualsiasi cosa con questo documento convertito, finiresti per strapparti i capelli.

Documento di base in PDF
Durante la revisione del PDF convertito, non sono riuscito a trovare alcun errore. Forse abbiamo scoperto dove eccelle ABBYY. Risultati fantastici.

Documento complesso in PDF
Ancora una volta, non sono riuscito a trovare errori in questo file convertito. ABBYY ovviamente sa come convertire in PDF eccezionalmente bene.

Verdetto
Se sei felice di pagare qualche dollaro, la conversione in PDF sembra funzionare in modo fenomenale con questo servizio ed essere in grado di sincronizzare i file convertiti nel tuo archivio cloud è particolarmente utile se stai eseguendo la scansione di un grande volume di documenti. Come per le altre opzioni, ABBYY non ha ancora capito come convertire i documenti in DOC in modo impeccabile per una facile modifica.

Il risultato finale

Se, come la maggior parte delle persone, stai solo cercando di scansionare alcuni articoli di riviste e alcune bollette domestiche, non dovrai modificare questi documenti. Pertanto, la conversione diretta in PDF sarà adatta a te, perché sarai ancora in grado di cercare quei documenti. Per questo, l'OCR online gratuito è stato sicuramente il miglior strumento gratuito che abbiamo testato. Detto questo, se sei disposto a pagare $ 5 al mese per la perfezione, ABBYY FineReader online era leggermente più preciso.

Quando si tratta di convertire documenti in DOC, non siamo riusciti a trovare una soluzione perfetta, ma di gran lunga i risultati migliori sono arrivati OCR online. La conversione non è stata perfetta, ma l'integrità della formattazione è stata in gran parte mantenuta intatta e gli errori erano trascurabili. Quando confrontiamo questi risultati con l'offerta "premium" di ABBYY, non puoi fare a meno di essere impressionato in modo massiccio.

Non abbiamo incluso Funzionalità OCR di Google Drive in questo post; un po 'per l'onnipresenza di Google, ma più per il fatto che volevamo testare alcuni altri servizi OCR online gratuiti là fuori.

A te: quali altri strumenti OCR online consiglieresti ai nostri lettori? E quale hai provato a non usare mai più?

Rob Nightingale ha conseguito una laurea in filosofia presso l'Università di York, nel Regno Unito. Ha lavorato come manager e consulente di social media per oltre cinque anni, tenendo seminari in diversi paesi. Negli ultimi due anni, Rob è stato anche uno scrittore di tecnologia, ed è il responsabile dei social media di MakeUseOf ed editore di newsletter. Di solito lo troverai in viaggio per...