Aprende Java Aprende Php Aprende C++ Aprende HTML 5 Aprende JavaScript Aprende JSON Aprende MySQL Aprende SQLServer Aprende Visual Basic 6 Aprende PostgreSQL Aprende SQLite Aprende Redis Aprende Kotlin Aprende XML Aprende Linux VSC Aprende Wordpress Aprende Laravel Aprende VueJS Aprende JQuery Aprende Bootstrap Aprende Netbeans Aprende Android
Sigueme en Facebook Sigueme en Twitter Sigueme en Instagram Sigueme en Youtube Sigueme en TikTok Sigueme en Whatsapp
Home / Desarrollo Web / Extraer texto de imágenes

Extraer texto de imágenes

Por jc mouse jueves, agosto 8, 2019

imgclip es una pequeña herramienta de línea de comandos el cual se ejecuta desde la terminal para Mac, Windows y Linux. Imgclip usa la biblioteca Tesseract.js (esta biblioteca admite más de 100 idiomas, orientación automática de texto y detección de guiones, una interfaz simple para leer cuadros delimitadores de párrafos, palabras y caracteres) para automatizar el procesamiento de imágenes y extraer texto a través de OCR (Reconocimiento Óptico de Caracteres). Tesseract es una de las bibliotecas de OCR más potentes hasta la fecha, y es de código abierto como imgclip.

INSTALACIÓN

Se puede instalar desde npm de la siguiente forma:

npm install -g imgclip

Importante: Solo es compatible con Node v6.8.0 +

USO

Usage: imgclip PATH [options]

Options:

-h, --help             output usage information
-V, --version          output the version number
-l, --lang [language]  language of the text in the image.
-c, --clean-up         removes the generated language data file (.traineddata) after the image recognition job has finished
-p, --print            prints out the text in the image.

Simplemente toma un argumento para el archivo de imagen junto con el idioma (opcional), luego devuelve el texto copiado en el portapapeles.

Por ejemplo, utilizamos una imagen en formato JPG con un texto sencillo, «JC MOUSE», utilizamos imgclip desde linea de comandos junto al parámetro «-p» para imprimir en pantalla el resultado. Obtenemos:

imagen a texto javascript

El texto extraído es el correcto, ademas notemos que se crea un archivo «eng»con extensión *.traineddata el cual corresponde al lenguaje utilizado para el reconocimiento de caracteres, por defecto el ingles. Puedes ver la lista completa de idiomas en Tesseract Languages.

Otro ejemplo:

Compliquemos algo más las cosas y utilicemos una imagen con mucho más texto y una imagen de fondo, es decir:

reconocimiento de texto

Utilizamos ahora el comando «-l spa» para utilizar el lenguaje español, también los comandos «-pc» para imprimir el resultado en pantalla y eliminar el archivo *.traineddata una vez termine el proceso.

Tenemos más de un 90% de efectividad lo que es algo bueno tomando en cuenta el tamaño y simplicidad de esta herramienta.

enjoy!

Tags

Artículos similares

Melody ML: Separa fácilmente pistas de audio usando IA

Melody.ml  es un aplicación online que usa la I.A (Inteligencia Artificial) para procesar archivos MP3 y separar en pist[...]

BuilderAI la startup que simulaba ser una Inteligencia Artificial

Builder.ai era una startup tecnológica que fundada por Sachin Dev Duggal, este se promocionaba como una plataforma de de[...]

Curso gratuito de programación Python de Microsoft

Microsoft el gigante de la tecnología está tratando de hacer que Python sea más fácil de comprender para aquellos intere[...]

Controla tu dispositivo Android desde el escritorio de tu pc

En este post te enseñamos a utilizar SCRCPY, esta es un aplicación de duplicación de pantalla gratuita y de código abier[...]

JavaScript: Script y Web para generar banderas ondeando

Online Flag Waver es una páginas web con la que podemos generar banderas ondeando con la textura que elijamos ya sea des[...]

El Viaje Astral del Tata Quispe

El Viaje Astral del Tata Quispe, así titula un nuevo juego boliviano desarrollado por la empresa VReality el cual esta i[...]