Pasa a Word el texto de cualquier foto o PDF con estos programas OCR

Pasa a Word el texto de cualquier foto o PDF con estos programas OCR

David Onieva

Seguro que en más de una ocasión os habéis encontrado ante el problema de necesitar digitalizar notas o textos escritos a mano para editarlos en el PC. Lo mismo sucede cuando nos encontramos con determinados textos que queremos editar, pero están en formato de imagen. En estos casos, lo que tendremos que hacer es echar mano de software de reconocimiento óptico de caracteres, también conocidos como programas OCR.

Estos son programas se encargan de analizar el texto que tenemos escrito a mano, en un documento escaneado o que se encuentra dentro de las imágenes o PDF, y lo convierten en texto editable.

Las hay más sencillas y más complejas, todo dependerá de las funciones adicionales que integren. Hay que tener en cuenta que muchas veces no son 100% efectivas, por lo que comenten algunos errores de interpretación. Es por ello que podemos encontrar algunas de estas propuestas que incluso ponen a nuestra disposición un corrector ortográfico. Es por todo ello que a continuación os vamos a mostrar algunas de estas soluciones que seguro os serán de gran ayuda.

Programas OCR gratis para el reconocimiento óptico de caracteres

Aunque en el pasado el reconocimiento óptico de caracteres era una tecnología avanzada, y bastante cara, a día de hoy podemos hacer uso de ella de forma totalmente gratuita gracias a una gran cantidad de programas públicos como los que vamos a ver aquí.

SimpleOCR, la forma más simple de pasar una foto a Word

Este es el caso de SimpleOCR, una propuesta de este tipo gratuita que podréis usar en vuestro equipo de sobremesa. Es una de las soluciones de este tipo más conocidas y que lleva una buena cantidad de años entre nosotros. El programa utiliza una función propia que intenta hacer el mejor reconocimiento de caracteres, incluso si la escritura es un tanto defectuosa.

SimpleOCR

Decir que el programa reconoce unas 120.000 palabras, cifra que podremos ir aumentando nosotros mismos añadiendo otras nuevas. Además se caracteriza por ser una herramienta rápida en el proceso y puede tratar incluso con documentos por lotes, lo que nos ahorrará tiempo.

SodaPDF, un programa con interfaz Ribbon

Siguiendo en la línea de las aplicaciones de este tipo, también nos encontramos con SodaPDF. Este es un software OCR que se encarga de extraer el texto de cualquier archivo en formato PDF y convertirlo en editable. Para ello, todo lo que debemos hacer es arrastrar el correspondiente fichero a la interfaz del programa para que comience el proceso de conversión, algo en lo que emplea solo unos segundos.

OCR aplicaciones

Si no queremos descargar software en nuestro PC, también podemos recurrir a la versión online, la cual podemos usar desde el navegador.

FreeOCR, la opción ligera y rápida para pasar fotos a texto

Otra de las propuestas gratuitas de las que os vamos a hablar en estas líneas, es FreeOCR, un software para Windows que apenas consume recursos. Se ha diseñado para que podamos identificar los textos contenidos en imágenes y archivos en formato PDF, y se caracteriza por lo rápido que lleva a cabo el proceso.

FreeOCR

Eso sí, la tecnología interna que usa presenta muchos errores a la hora de reconocer la escritura a mano, por lo que reconoce mejor los caracteres de una máquina. Sin embargo esta representa una buena propuesta si necesitamos un programa a coste cero para reconocer los textos de cualquier foto o PDF y convertirlo en editable.

Tesseract, una librería OCR escrita en JavaScript

Tesseract empezó a funcionar en 1995 como un proyecto libre. Sin embargo, desde entonces, conseguido crecer hasta convertirse en una de las mejores herramientas de reconocimiento óptico digital de caracteres. Este software es totalmente gratuito y de código abierto, por lo que es común verlo incluido dentro de muchos de los programas gratis, y de las webs OCR.

De normal, esta aplicación puede resultar un poco complicada de utilizar. Carece de interfaz, por lo que debemos usarla desde terminal, o desde una ventana de CMD. Sin embargo, sus resultados precisos hacen que merezca la pena invertir tiempo en familiarizarnos con esta interfaz.

tesseract

Podemos encontrar una guía de instalación y uso, así como su descarga, desde su página principal de GitHub. Esta aplicación está disponible para Windows, Linux y macOS.

GImageReader, un frontend para Tesseract

Hemos dicho que el principal problema de Tesseract es que se debe utilizar desde un terminal. Aquí es donde entra en juego GImageReader. Este es un frontend, o interfaz, que utiliza esta librería y nos permite aprovecharnos de sus virtudes de forma mucho más sencilla e intuitiva, es decir, desde una ventana. Todas sus opciones de configuración y ajuste las vamos a tener al alcance de nuestro ratón.

OCR GImageReader

GImageReader está disponible para Windows y Linux, y podemos descargar el software desde el siguiente enlace.

Free OCR to Word, una alternativa más gratuita

Aunque dejamos un poco de lado los programas de código abierto, otra opción que también debemos tener en cuenta es Free OCR to Word. Este software nos permite reconocer caracteres de distintos formatos de archivos, como JPG, JPEG, PSD, PNG, GIF, TIFF y BMP, entre otros. También nos permitirá importarlos a un documento Word de manera que, al hacerlo, podamos tenerlos ya totalmente editables y evitar la tarea de tener que reescribir los documentos.

Free OCR to Word

Podemos descargar esta aplicación gratuita desde su página web principal.

Programas profesionales de OCR

Si las opciones anteriores nos dan problemas y tienen muchos errores, entonces es mejor optar por alguna de estas alternativas profesionales, ya que son mucho más precisas a la hora de reconocer texto.

ABBYY FineReader, uno de los programas OCR más completos

ABBYY FineReader es una aplicación OCR que nos va a permitir reconocer automáticamente todos los caracteres de una imagen o de un documento PDF. Al hacerlo, nos permitirá extraerlos y copiarlos para trabajar con ellos como si fueran texto plano. Esta es una de las herramientas más veteranas y efectivas dentro de este tipo de software, ofreciendo una tasa de acierto muy elevada y compatibilidad con más de 190 idiomas de texto.

FineReader

Además de tener su propia ventana, se integra con Microsoft Word de manera que, si escaneamos un documento, automáticamente podamos tenerlo en forma de texto en el procesador de textos de Microsoft.

Aunque es, probablemente, el mejor programa OCR que podemos encontrar, estamos ante un software de pago, y no precisamente barato, ya que su licencia más básica ronda los 200 euros. Por lo tanto, si estamos buscando un programa que nos permite convertir nuestros escaneos a texto, y podemos asumir cierto rango de errores, podemos probar cualquiera de las otras alternativas gratuitas.

Readiris 17, otro software OCR profesional para Windows

Readiris es más bien un software para editar y maquetar todo tipo de documentos, sobre todo en formato PDF. Sin embargo, este programa incluye, entre sus muchas funciones, una tecnología OCR que nos va a permitir reconocer múltiples caracteres y pasarlos a formato de texto editable. El motor de reconocimiento óptico de este programa es muy potente y cuenta con unos niveles de precisión muy elevados.

Readiris 17

Eso sí, debemos tener en cuenta que estamos ante un software de pago. Podemos descargar una versión de prueba de este software aquí.

Pasar de imagen a texto usando servicios web

Y si no queremos recurrir a los programas que hemos visto en el punto anterior, de esta forma vamos a poder hacer esto mismo, de forma gratuita, desde nuestro navegador web.

Google Drive, la alternativa a Word en la nube

Hay algunas de las grandes firmas actuales dedicadas al software que también nos quieren ayudar en estos temas. Sirva como ejemplo de todo ello, Google, que dispone de algunas herramientas que pueden convertir la escritura a mano en texto. Para ello podemos echar mano de Google Drive usando un método muy sencillo a la vez que eficaz.

Para ello no tendremos más que subir a Google Drive el archivo que queremos convertir. Puede ser una imagen o un PDF. El único límite es que no ocupe más de 2 MB. Cuando ya tengamos el archivo en la nube, hacemos clic sobre él con el botón derecho y elegiremos la opción de Abrir con > Documentos de Google. Al momento se abrirá dicha imagen dentro de un nuevo documento. Y, además de la imagen, en la parte inferior podremos ver todo el texto que incluía dicha imagen, o dicho archivo PDF.

Documentos de Google - OCR

OneNote, el software de notas de Microsoft

Otra de las firmas más importantes, como es Microsoft, igualmente nos propone su propia solución para el reconocimiento de caracteres. En concreto esto es algo que podremos llevar a cabo desde su plataforma para la toma de notas, OneNote. Esta es una herramienta de la firma que cuenta con su propia función OCR, además de uso muy sencillo, como vamos a comprobar ahora. Como sabréis, esta es una herramienta que se centra en la creación de notas personales en las que podemos integrar todo tipo elementos.

Pues bien, para hacer uso de la función de OCR, lo que tenemos que hacer en este caso es agregar la imagen con la que deseamos tratar a una de estas notas. Esto lo hacemos desde el menú “Insertar” del programa para añadir la fotografía en cuestión. Así, una vez ya la tengamos subida a la plataforma, no tenemos más que pinchar con el botón derecho del ratón sobre la misma y seleccionar la opción de “Copiar texto de la imagen”.

OCR aplicaciones

Entonces el propio programa ya se encargará de extraer ese texto de la imagen y dejarlo en el portapapeles para que lo podamos editar. Recordamos que OneNote forma parte de la suite de Office, por lo que vendrá instalada junto con el resto de programas de la suite ofimática.

Online OCR, una solución rápida y sencilla

Algo similar encontramos con Online OCR, aunque en este caso se trata de una aplicación web que usamos desde el navegador. Aquí, lo primero que hacemos tras subir el PDF o la imagen con el texto, es elegir el idioma con el que vamos a trabajar. Son muchos los soportados por este programa, por lo que ahí no habrá problema. Además el proceso se lleva a cabo en pocos segundos con un índice de acierto en los caracteres muy bueno. También debemos saber que esta aplicación web la podremos usar sin registrarnos y sin pagar nada, aunque también es verdad que tenemos a nuestra disposición otras soluciones más eficaces en este sentido.

Online OCR

Convertio, otra alternativa basada en web en español

También nos podemos decantar por la opción que nos propone Convertio, otra plataforma OCR para el reconocimiento óptico de caracteres. Aquí no tendremos más que seleccionar los ficheros a tratar desde el disco duro o algún servicio de almacenamiento en la nube. Una vez lo hayamos añadido, ya podremos seleccionar el idioma del texto, por defecto ya viene en español, o las páginas a tratar.

Convertio

De igual modo podremos seleccionar el formato de salida de entre los muchos que soporta esta aplicación en concreto. Además, cuenta con una extensión para Chrome para poder tener esta función siempre a mano.

Free OCR API, un sistema de OCR online

Este es otro de los programas web gratis que nos van a permitir pasar de foto a Word. Una alternativa más, que además también es de código abierto. Esta opción cuenta también con una precisión muy alta y, además, puede ejecutarse directamente desde el navegador sin necesidad de instalar ningún software adicional.

Free OCR API

Podemos utilizar esta herramienta desde nuestro navegador en la siguiente página web. Y, si lo preferimos, podemos descargar un cliente gratuito desde la Microsoft Store (para Windows 10) y una extensión para Google Chrome.