OCR, reconocimiento de texto en las imágenes

Otro acrónimo que se ha convertido ya en el pan nuestro de cada día es el OCR (Optical Character Recognition).

En este caso, nos referimos a un software que extrae de una imagen los caracteres que componen un texto, de manera que puede almacenarlos, catalogarlos y es capaz de interactuar con cualquier programa de edición de texto. Además, al convertir las unidades
de información habituales de una imagen, los píxeles, a texto, también reduce significativamente el espacio que ocupa ese documento en nuestra memoria de almacenaje.

La utilización de este sistema permite, por ejemplo, almacenar los datos presentes en un cheque escaneado, almacenar todas las facturas, automatizar la gestión de formularios, recopilar información de documentos gráficos, entre otros. Empresas como Readsoft han desarrollado software, en este caso se llama Invoice, basados en OCR y aplicados a aspectos concretos de una empresa. Indra, la Dirección General de Tráfico (DGT) o Red Eléctrica son algunos de los clientes de Readsoft que conocen las ventajas funcionales de este sistema de reconocimiento de imágenes. Otras variaciones del OCR son el ICR (Intelligent Character Recognition) y el OMR (Optical Mark Recognition). En el primer caso, se trata de un OCR algo más preciso y, en el segundo, en vez de reconocer texto, son marcas. Esta última evolución es especialmente útil en el procesamiento de formularios.

Publicidad - Sigue leyendo debajo
Más de Tecnología