giovedì 27 dicembre 2012

Riconoscimento testo (OCR) direttamente da smartphone? Niente di più semplice!

Non sarà una cosa che vi capita tutti i giorni, ma dite la verità, sarà già accaduto vi occorresse uno scanner a portata di mano per scansionare un documento ed estrarne il testo per poterlo riusare. Eppure il miglior strumento a disposizione lo avete già: ovviamente è il vostro smartphone.

Il cosiddetto Optical Character Recognition (OCR) - ovvero riconoscimento ottico dei caratteri - è una tecnica grazie alla quale è possibile estrarre il testo da documenti cartacei o anche già digitalizzati, in formato immagine o PDF, mediante specifici software. Su desktop esistono decine e decine di soluzioni sia free che commerciali, io personalmente uso su Windows FreeOCR, un software freeware leggero e molto efficace.

Ma qui voglio parlarvi di un paio di metodi per fare OCR direttamente da smartphone, tra l'altro in pochissimi minuti, molto meno di quanto ci metteremmo con uno scanner e un computer. Quello che serve è essenzialmente una delle decine di applicazioni che consentono di scansionare testi e documenti sfruttando la fotocamera dello smartphone.

Per testi brevi: Google Goggles

Se avete necessità di riconoscere un testo molto breve - al limite di 4-5 righe - la soluzione chiavi in mano è costituita da Goggles, la formidabile app di Google che consente di fare ricerche basandosi su foto scattate direttamente con il nostro smartphone. Una delle feature di Goggles è quella di riconoscere il testo in una foto e nel caso tradurlo nella nostra lingua, analogamente a quanto in grado di fare Google Translate.

Sarà sufficiente scattare una foto al testo e Goggles lo riconoscerà automaticamente, dopodiché potremo inviarlo alla clipboard o a qualunque altra applicazione desiderata, come email o Drive. Purtroppo Goggles ha il grande limite di riconoscere solo piccole porzioni di testo, come ad esempio etichette, segnali e brevi iscrizioni, risulta pertanto totalmente inadatto a scansionare intere pagine di documenti.

Goggles riconosce brevi porzioni di testo

Per testi più lunghi: Mobile Doc Scanner e Google Drive

Di applicazioni per scansionare documenti ne ho provate diverse, e quella che mi ha dato i risultati migliori - in termini di risoluzione e qualità dell'output - è Mobile Doc Scanner nella versione Lite. Con essa potete catturare intere pagine di testi - fino a 4 in modalità batch nella versione free - e convertirli in documenti PDF che potrete salvare sullo smartphone o inviare per email o su servizi cloud.

Il funzionamento è molto semplice, per ogni scatto di pagina è possibile definire l'area di testo da includere nel file finale e la modalità di elaborazione, che per il nostro scopo sarà "Documento nero su bianco".


Una volta terminata la scansione delle pagine che ci interessano, sarà necessario esportare il file finale PDF su Google Drive.


Sfrutteremo infatti la capacità di Google Drive di riconoscere automaticamente il testo in un file PDF, caricandolo e semplicemente visualizzandolo online, come nell'esempio qui sotto. Se il riconoscimento avviene correttamente, sarà possibile selezionare con il mouse il testo che ci interessa - che apparirà colorato di azzurro - copiarlo nella clipboard con un colpo ben assestato di ctrl+c e successivamente incollarlo nella nostra applicazione di scrittura testi preferita, o anche nella finestra di composizione email, con un altro ben assestato colpo di ctrl+v.

La selezione del testo in Google Drive

Una alternativa può essere quella di caricare il file PDF su Google Drive e convertirlo automaticamente in documento di testo selezionando l'apposita opzione in fase di upload (vedi immagine sotto).

Caricare un documento PDF e convertirlo in documento di testo con Google Drive

Se poi non avete un account Google Drive o non volete aprirne uno, esistono innumerevoli servizi online OCR disponibili, scegliete quello che fa per voi.

OCR diretto con Mobile OCR Free

Esiste infine una soluzione "all in one" per fare OCR da smartphone, si tratta dell'app android Mobile OCR Free, che consente appunto di estrarre il testo direttamente da una foto scattata a una pagina di un documento. Il risultato è abbastanza buono, ed è in grado di riconoscere testo in italiano anche se nella versione free è possibile scegliere come lingua solo l'inglese e poche altre. L'app ha un limite: consente solamente di copiare il testo nella clipboard e non di esportarlo in altre applicazioni... ma a quel prezzo ;)

Buon riconoscimento!