imgclip es una pequeña herramienta de línea de comandos el cual se ejecuta desde la terminal para Mac, Windows y Linux. Imgclip usa la biblioteca Tesseract.js (esta biblioteca admite más de 100 idiomas, orientación automática de texto y detección de guiones, una interfaz simple para leer cuadros delimitadores de párrafos, palabras y caracteres) para automatizar el procesamiento de imágenes y extraer texto a través de OCR (Reconocimiento Óptico de Caracteres). Tesseract es una de las bibliotecas de OCR más potentes hasta la fecha, y es de código abierto como imgclip.
INSTALACIÓN
Se puede instalar desde npm de la siguiente forma:
npm install -g imgclip
Importante: Solo es compatible con Node v6.8.0 +
USO
Usage: imgclip PATH [options] Options: -h, --help output usage information -V, --version output the version number -l, --lang [language] language of the text in the image. -c, --clean-up removes the generated language data file (.traineddata) after the image recognition job has finished -p, --print prints out the text in the image.
Simplemente toma un argumento para el archivo de imagen junto con el idioma (opcional), luego devuelve el texto copiado en el portapapeles.
Por ejemplo, utilizamos una imagen en formato JPG con un texto sencillo, «JC MOUSE», utilizamos imgclip desde linea de comandos junto al parámetro «-p» para imprimir en pantalla el resultado. Obtenemos:
El texto extraído es el correcto, ademas notemos que se crea un archivo «eng»con extensión *.traineddata el cual corresponde al lenguaje utilizado para el reconocimiento de caracteres, por defecto el ingles. Puedes ver la lista completa de idiomas en Tesseract Languages.
Otro ejemplo:
Compliquemos algo más las cosas y utilicemos una imagen con mucho más texto y una imagen de fondo, es decir:
Utilizamos ahora el comando «-l spa» para utilizar el lenguaje español, también los comandos «-pc» para imprimir el resultado en pantalla y eliminar el archivo *.traineddata una vez termine el proceso.
Tenemos más de un 90% de efectividad lo que es algo bueno tomando en cuenta el tamaño y simplicidad de esta herramienta.
enjoy!
Yo soy yo :) JC Mouse, Soy orgullosamente boliviano soy fundador y CEO de la web jc-Mouse.net uno de las pocas web en emprendimiento y tecnología en Bolivia.
Toda la información que encuentres en este sitio es y sera completamente gratis siempre, puedes copiar, descargar y re-publicar si así lo deseas en otros blogs o sitios web, solo te pido a cambio que dejes una referencia a esta web. Esto nos ayuda a crecer y seguir aportando. Bye
Enjoy! :)
Cada día aparecen cientos sino es que miles de nuevos sitios web en el mundo, pero son muy pocos las webs verdaderamente...
El índice TIOBE (TIOBE, The Importance of Being Earnest – «La importancia de ser honesto» – referencia a la...
En esta oportunidad dejo a considerancion un codigo realizado en Java/Netbeans para recortar una imagen visualmente Vide...
Continuando el post de «Introducción a Retrofit» donde realizamos una breve preparación a lo que es el uso de la librerí...
MAUS es una aplicación para dispositivos móviles con el Sistema Operativo Android que te permite realizar exámenes desde...
Nivel: Intermedio-Avanzado IDE: Netbeans 6.9 o Sup. Tiempo: 30 minutos En este tutorial crearemos una aplicación que nos...
El gigante tecnologico Google a puesto un bonito Doodle en su buscador que esta fascinando a sus millones de usuarios qu...
WhatsApp anuncio a través de su blog que ya se encuentra disponible la función de envío de fotos y videos TEMPORALES, es...
Muchas de las innovaciones computacionales de la NASA se desarrollaron para ayudar a explorar el espacio, pero ahora la...
TikTok es una plataforma de microvideos muy popular entre los jóvenes el cual cuenta ya con millones de videos cortps de...