Sigueme en Facebook Sigueme en Twitter Sigueme en Instagram Sigueme en Youtube
JC Mouse Bolivia
Index / Linux / Tesseract OCR: Reconocimiento de caracteres

Tesseract OCR: Reconocimiento de caracteres

Autor jc mouse lunes, agosto 19, 2019

OCR (Optical Character Recognition) en español, Reconociminto Optico de Caracteres, es el proceso por el cual  se extrae texto de imágenes. En este post veremos un ejemplo sencillo  de como instalar y utilizar una herramienta OCR de código abierto en el Sistema Operativo Linux Ubuntu.

Tesseract es uno de los motores OCR de código abierto más potentes disponibles en la actualidad. Es compatible con muchos lenguajes, más de 100 (incluido el español) ademas tiene un código establecido para que también se pueda entrenar fácilmente en otros idiomas.  El software se ejecuta a través de la línea de comando, es decir, no cuenta una GUI (Interfaz Gráfica de usuario), pero hay varios paquetes de software para Tesseract que proporcionar una interfaz GUI para este OCR.

INSTALACIÓN

Simplemente debemos ejecutar el siguiente comando:

$ sudo apt-get install tesseract-ocr

Para comprobar la correcta instalación, escribimos «tesseract -v» esto nos mostrara la versión del OCR junto con una lista de librerías de imagen con las que tesseract es compatible.

OCR en Ubuntu

INSTALACIÓN DE LENGUAJES

Tesseract por defecto utiliza el ingles y es el idioma que se instala cuando instalas la herramienta, para ver un listado de los idiomas disponibles, ejecuta el comando:

$ tesseract --list-langs

Para instalar un lenguaje determinado se usa «apt-get install tesseract-ocr-LANG» donde LANG son las iniciales del lenguaje que se desea instalar, es decir, para instalar español utilizamos:

$ sudo apt-get install tesseract-ocr-spa

para instalar todos los lenguajes utilizamos:

$ sudo apt-get install tesseract-ocr-all

RECONOCIMIENTO DE CARACTERES

Antes de usar imágenes que contengan texto con Tesseract, las mismas deben ser procesadas, es decir, las imágenes deben estar libres de ruido, sin bordes o gráficos las cuales puedan ser confundidos erróneamente como caracteres, el texto de la imagen no debe estar inclinado, a más inclinación más perdida de precisión, se recomienda también utilizar imágenes en escala de grises o blanco y negro para mejorar la precisión del OCR, para procesar imágenes, se utilizan otras herramientas aparte de Tesseract, por ejemplo Imagemagick, pero esto queda fuera de los objetivos de este post por lo que para la creación de imágenes que contengan texto, podemos usar algún software gráfico o alguna herramienta online como «https://text2image.com/en/«.

Pues bien, utilizando alguna de las herramientas arriba mencionadas, creamos una imagen con un poco de texto.

texto 2 image

Nos ubicamos en el directorio donde esta nuestra imagen y escribimos «tesseract NOMBRE_ARCHIVO OPCIONES», es decir:

$ tesseract textojcmouse.png stdout

tesseract en linux

Si queremos guardar el resultado en un archivo de texto, utilizamos:

$ tesseract textojcmouse.png textosalida

Si nuestra imagen contiene números, añadimos la opción «digits«, es decir:

$ tesseract textocondigitos.png stdout digits

enjoy!

Tags

Si te ha gustado podrías compartirlo o dejar un comentario. ¡Muchas gracias!
Autor: JC Mouse

Yo soy yo :) JC Mouse, Soy orgullosamente boliviano soy fundador y CEO de la web jc-Mouse.net uno de las pocas web en emprendimiento y tecnología en Bolivia.

Toda la información que encuentres en este sitio es y sera completamente gratis siempre, puedes copiar, descargar y re-publicar si así lo deseas en otros blogs o sitios web, solo te pido a cambio que dejes una referencia a esta web. Esto nos ayuda a crecer y seguir aportando. Bye

Enjoy! :)

También Te Podría Interesar

Bolivia Segura: La página web oficial del gobierno para informar sobre el Coronavirus

Bolivia Segura: La página web oficial del gobierno para informar sobre el Coronavirus

El gobierno constitucional de Bolivia a la cabeza de la presidente Yaninne Añez y ante la confirmación de dos casos posi...

Aprende CSS Flexbox jugando

Aprende CSS Flexbox jugando

CSS Flexible Box Layout, comúnmente conocido como Flexbox, es un modelo de diseño web CSS que permite que los elementos...

GraphADT: Clases para trabajar con grafos en java

GraphADT: Clases para trabajar con grafos en java

GraphADT es una proyecto alojado en github escrito en java que te permite trabajar con grafos, a la fecha de escribir es...

¿Quieres llorar? conoce que es y como protegerse de WannaCry

¿Quieres llorar? conoce que es y como protegerse de WannaCry

Este 12 de Mayo de 2017 se produjo un ataque masivo mundial del ransomware WannaCry  el  que afecto a más de 200000 comp...

Gráfico de lineas con jfreechart

Gráfico de lineas con jfreechart

Los gráficos de líneas muestran una serie como un conjunto de puntos conectados mediante una línea. Los valores se repre...

Incrementar limite máximo de importación en PhpMyAdmin

Incrementar limite máximo de importación en PhpMyAdmin

En ocasiones el limite máximo de importación de base de datos que ofrece PhpMyAdmin (2MB) no es suficiente para lo que q...

Comparte lo que sabes

Categorias

Últimas entradas

Muchas veces necesitamos de fotos para adornar nuestros perfiles en RRSS pero no queremos subir nuestras propias fotos p...

En esta ocasión aprenderemos a conectaros con una base de datos Oracle desde Laravel. Es un tutorial sencillo y cortito,...

En este tutorial conoceremos una forma de conectar una aplicación en Laravel con tres bases de datos diferentes, 2 en My...

Existen muchas plataformas CMS de código abierto excelentes, como Joomla y WordPress, así como algunas plataformas emerg...

Herramientas

Generador de Enlaces a Whatsapp