Scanner de Documentos

La teoria que le suministramos es una guia para que usted pueda decidir que scanner se adecua a sus necesidades. No dude en contactarnos para conocer mas sobre tecnologia.
1Ventajas del LED Vs Lámparas
Ventajas del LED:

- Bajo consumo: Una lámpara LED se alimenta a baja tensión, consumiendo así poca potencia.

Ejemplo: Una lámpara halógena de 50W de potencia ilumina 25 lumens/W consiguiendo un total de 1250 lumens. Para conseguir la misma iluminación con una lámpara de LEDs vamos a necesitar 179 LEDs (utilizando LEDs de alta luminosidad que iluminan 7 lumens/unidad), de esta forma tendremos la misma iluminación con ambas lámparas pero sin embargo nuestro consumo con la lámpara de LEDs va ser 4 veces menor, ya que sólo consumirá 13W. (*Datos aproximados).

- Baja temperatura: El LED se alimenta a baja tensión, consumiendo así poca energía y por lo tanto emitiendo poco calor. Esto es debido a que el LED es un dispositivo que opera a baja temperatura en relación con la luminosidad que proporciona. Los demás sistemas de iluminación en igualdad de condiciones de luminosidad que el LED emiten mucho más calor.

- Pequeña anchura espectral: Los LEDs tiene una anchura espectral pequeña, convirtiéndolos de esta forma en el sistema perfecto de iluminación para visión artificial, ya que de esta manera la cámara capta con mucho más detalle el objeto, pudiendo apreciar mejor los detalles.

- Amplia banda espectral: El LED es un dispositivo de longitud de onda fija pero que puede trabajar en una amplia banda del espectro. Para cubrir todo este ancho de banda existen en el mercado una gran gama de LEDs que nos permitirán iluminar con una longitud de onda especifica, o lo que es lo mismo en un determinado color (rojo, verde, ámbar, blanco e incluso ultra violeta).

- Mayor rapidez de respuesta: El LED tiene una respuesta de funcionamiento mucho más rápida que el halógeno y el fluorescente, del orden de algunos microsegundos.

- Luz más brillante: En las mismas condiciones de luminosidad que sus rivales, la luz que emite el LED es mucho más nítida y brillante.

- Sin fallos de iluminación: Absorbe las posibles vibraciones a las que pueda estar sometido el equipo sin producir fallos ni variaciones de iluminación. Esto es debido a que el LED carece de filamento luminiscente evitando de esta manera las variaciones de luminosidad del mismo y su posible rotura.

- Mayor duración y fiabilidad: La vida de un LED es muy larga en comparación con los demás sistemas de iluminación.
2Ques es un driver ISIS?
ISIS (Image and Scanner Interface Specification) es una interfaz estándar de la industria para tecnologías de escaneo de imágenes, desarrollado por Pixel Translations en 1990 (hoy:EMCcaptiva).

ISIS es un estándar abierto para el control de escáneres y un entorno de trabajo completo para procesamiento de imágenes. Está soportado por un amplio número de aplicaciones y vendedores de escáneres, llegando a convertirse rápidamente en un estándar industrial de facto. ISIS permite a los desarrolladores de aplicaciones crear complicados sistemas de captura de imágenes de forma rápida y eficaz usando cualquier controlador certificado por ISIS.

ISIS es modular: permite a las aplicaciones controlar un escáner directamente, o utilizar las rutinas proporcionadas para manejar la mayoría de las situaciones de forma automática.

ISIS es flexible: usando una interfaz basada en mensajes con etiquetas, puede crecer sin perder compatibilidad. Esto significa que las características, operaciones y formatos no existentes en la actualidad pueden añadirse sin esperar a una nueva versión de la especificación.

ISIS es una especificación completa: trata todos los temas que una aplicación que usa un escáner debe tratar. Esto incluye tareas como seleccionar, instalar y configurar un escáner nuevo, establecer parámetros específicos del escáner, escanear, leer y escribir archivos, escalado de imágenes, rotación, visualización e impresión. Los controladores ISIS también han sido escritos para preprocesar datos realizando operaciones tales como conversión a escala de grises de forma dinámica.

ISIS sobresale por la velocidad de procesado. Lo hace enlazando controladores entre sí en una arquitectura en pipeline para que los datos fluyan desde el controlador del escáner al controlador de compresión, al controlador de empaquetado, al archivo, al visualizador o impresora en una trama continua, normalmente sin necesidad de procesar más que una pequeña porción de la imagen completa. Debido a que los controladores ISIS se disponen en una pipeline cuando son utilizados, cada controlador se especializa en realizar una sola función. Los controladores normalmente son pequeños y modulares, lo que significa que ISIS permite nuevas funcionalidades en una aplicación con modificaciones muy pequeñas.
3Que es un driver TWAIN?
TWAIN s un estándar destinado a la adquisición de imágenes de un escáner de imagen : una API de captura de imágenes para los sistemas operativos Microsoft Windows y Apple Macintosh. La palabra TWAIN no es oficialmente un acrónimo;sin embargo, es ampliamente conocido como un retroacrónimo para Technology Without An Interesting Name” (Tecnología Sin Un Nombre Interesante).

El estándar fue liberado por primera vez en 1992. Actualmente está ratificado en la versión 2.1 el 28 de octubre de 2009 y es mantenido por el Grupo de Trabajo TWAIN. TWAIN se utiliza normalmente como una interfaz entre la aplicación de procesado de imágenes y un escáner o cámara digital.

La desventaja de TWAIN como implementación para una aplicación típica (p.e. aplicación de escaneo) es que no siempre separa la interfaz de usuario del controlador de dispositivo (al contrario que SANE). Esto hace difícil proveer servicios TWAIN a programas ajenos al fabricante del dispositivo. Cada vez que una aplicación carga un controlador TWAIN, no se puede separar de la GUI (Interfaz gráfica de usuario). Para ser preciso, no es un defecto de la especificación TWAIN sino de los controladores del dispositivo, porque no son totalmente compatibles con la especificación TWAIN.
Kevin Bier, director del Grupo de Trabajo TWAIN y el co-autor/editor original de TWAIN 1.0, observa que algunos creen que la unión de la interfaz de usuario con el “controlador” TWAIN (realmente una porción de código de la aplicación y no un controlador en absoluto) está fallando. Él responde que era una meta explícita del diseño del grupo para poner la responsabilidad de presentar la funcionalidad del dispositivo en manos del fabricante del dispositivo.

“Era nuestra premisa que ninguno otro podría saber todas las características del dispositivo o la forma más apropiada de presentar la funcionalidad al usuario,” Bier dice. “Sin importar mi opinión sobre la calidad relativa de esa premisa, era una fundación esencial del éxito de especificación. según ha demostrado la adopción de la misma.”

Tomado de Wikipedia
4Que es un scanner y que hace
Un scanner es un periférico o dispositivo de entrada en el ordenador, que convierte imágenes impresas en papel u otras superficies, en imágenes digitales, para ser almacenadas en el ordenador. El scanner es uno de los elementos más utilizados en computación debido a la ventaja de poder obtener las imágenes digitalizadas y poder modificarlas, corregirlas o almacenarlas. Existen varios tipos de scanner, de distintos precios y funcionamientos. Hoy, se adquieren más comúnmente como un integrante de las llamadas multifuncionales, que también sirven como impresora y fotocopiadora.

El funcionamiento de un scanner es casi el mismo en cuanto a la captación y transformación de imágenes. Primero se ilumina la imagen mediante una fuente de luz. Mientras más clara sea la imagen, mayor luz se refleja. La luz se conduce al reflejarse en un sistema de espejos que la llevan a un dispositivo llamado CCD, que la transforma en señales eléctricas. Luego, un convertidor analógico digital (DAC) transforma las señales en formato digital y el resultado se transmite al ordenador mediante un caudal de bits. En un scanner blanco y negro, cada pixel se digitaliza en 1 bit. En la escala de grises, los pixeles se digitalizan 8 bits, logrando 256 tipos de grises. En los de colores, cada pixel se digitaliza en 24 bits, obteniendo 16 millones de colores.

De todos los elementos de un scanner, los considerados más importantes para resultados de calidad son el CCD y el DAC. El CCD es un dispositivo eléctrico que responde ante la luz que recibe. Transmite mayor o menor electricidad dependiendo de la intensidad y el color de la luz. De este aparato depende que la imagen sea captada lo más fiel posible de la original, independiente del trabajo del resto de los componentes. En cuando al DAC, es el que transforma las señales del CCD y las convierte en bits, que finalmente son el resultado que vemos en la pantalla del ordenador. El DAC también es muy importante, porque debe obtener toda la información proveniente del CCD. Es muy importante asegurarse que el scanner cuente con estos dispositivos de una muy buena calidad. Así, es seguro obtener el resultado deseado.

En cuanto a la calidad de la imagen, también es importante hablar de la resolución, que es la que indica la cantidad de pixeles que el scanner puede explorar en cada pulgada de una imagen. Se mide en ppp que significa “pixeles por pulgada”. Es importante saber que los fabricantes informan de la resolución interpolada, que puede llegar a números muy altos. Sin embargo, la resolución real de un scanner es la resolución óptica, que indica los pixeles que toma el dispositivo en cada línea horizontal. En el año 2004, un buen scanner tenía una resolución de 1600 a 3200 ppp.

Los tipos de scanner más comunes son tres: el scanner de mano, que se utiliza desplazándolo manualmente por el papel. Como tiene sólo 10cm de ancho, se debe pasar dos veces por la página y luego juntar las dos imágenes mediante un programa. Aunque es una máquina muy económica, presenta muchos problemas de calidad, ya que puede crear imágenes distorsionadas. En la actualidad, está prácticamente obsoleto. El scanner plano, que es una buena opción, ya que captura la imagen de una sola pasada. Funciona poniendo el papel en el scanner para que la luz pase automáticamente para producir la imagen digital. La imagen resultante puede ser casi perfecta, a menos que la página se ubique torcida. Finalmente, el scanner de rodillo, que es un aparato pequeño muy manejable. Funciona poniendo el papel en una ranura, que luego es desplazada automáticamente por el scanner. En este caso, la luz no se desplaza, lo hace la hoja. Aunque no puede haber error humano en el resultado, tiene la desventaja de no poder escanear libros o materiales encuadernados. Actualmente, se está utilizando ampliamente el scanner plano integrado a la multifuncional.
5Que es un driver y cuando actualizarlo
Que es un DRIVER o CONTROLADOR. Un driver técnicamente es un software o programa que sirve de intermediario entre un dispositivo de hardware y el sistema operativo.

Dada la existencia de una infinidad de dispositivos hardware con su consecuente innovación, el driver se crea además para que funcione con un sistema operativo especifico – para decirlo en palabras simples: los controladores se instalan según el Windows que utiliza tu PC -. Esto significa que si cambias de Sistema operativo en tu computadora, tendrás que verificar si necesitas también actualizar los drivers para evitar que alguna area del PC deje de funcionar (por ejemplo el sonido). Por otra parte, el driver apunta a un modelo especifico del dispositivo. Por ejemplo: no se puede utilizar el mismo driver para controlar una impresora HP 3320 y una HP 840C.

Como y cuando cambiar los DRIVERS. Es importante determinar que drivers necesita nuestro PC pues una instalación inadecuada de ellos puede dejar inoperable un dispositivo. He aquí una guía:

a). Necesitamos instalar drivers cuando cambiamos de hardware. O sea cuando por ejemplo cambiamos la placa principal o motherboard, la impresora, la placa de video, etc. En estos casos el vendedor debe entregar los drivers.

c). Cuando, bien informado (a) te enteras que el fabricante ha creado nuevos drivers compatibles con tu modelo de dispositivo y con tu sistema operativo, para mejorar el rendimiento. Entonces el driver se baja del sitio Web del fabricante. Esto se llama actualización o mejora del controlador.

Donde y como conseguir los DRIVERS. Inicialmente, los drivers se obtienen de las casas fabricantes de hardware. Lo primero que hay que hacer es identificar la MARCA y MODELO del dispositivo (o placa) para el que se busca el driver. Cuando a través del ‘Administrador de dispositivos’ de Windows no es posible copiar estos datos la única opción posible es abrir la máquina para ver la identificación del dispositivo.

La siguiente fase es la de obtener el controlador cuando no lo tienes en un CD o tu disco duro. La primera opción debería ser buscar en el sitio web de los fabricantes. La segunda, en los sitios que ofrecen controladores gratuitos, la tercera en los foros públicos gratuitos y la cuarta en un servicio pago de suministro de controladores.

Conclusiones. Los CONTROLADORES no se deben ‘actualizar’ por que sí. Igual que como sucede con el software de aplicación, no toda versión actualizada de un driver funcionara con el dispositivo en cuestión. Hay que tener en cuenta que el código de un Driver, se crea en concordancia con la electrónica de los circuitos y una mala correspondencia puede ‘enloquecer’ al PC.

Software para manejo de imágenes

Cuales tecnologìas debe considerar al momento de seleccionar un software de captura?
1Que es OCR?
El Reconocimiento Óptico de Caracteres (OCR),así como el reconocimiento de texto, en general son aplicaciones dirigidas a la digitalización de textos. Identifican automáticamente símbolos o caracteres que pertenecen a un determinado alfabeto, a partir de una imagen para almacenarla en forma de datos con los que podremos interactuar mediante un programa de edición de texto o similar.En los últimos años la digitalización de la información (textos, imágenes, sonido, etc ) ha devenido un punto de interés para la sociedad. En el caso concreto de los textos, existen y se generan continuamente grandes cantidades de información escrita, tipográfica o manuscrita en todo tipo de soportes. En este contexto, poder automatizar la introducción de caracteres evitando la entrada por teclado, implica un importante ahorro de recursos humanos y un aumento de la productividad, al mismo tiempo que se mantiene, o hasta se mejora, la calidad de muchos servicios.

Problemas con el Reconocimiento Óptico de Caracteres

El proceso básico que se lleva a cabo en el Reconocimiento Óptico de Caracteres es convertir el texto que aparece en una imagen en un archivo de texto que podrá ser editado y utilizado como tal por cualquier otro programa o aplicación que lo necesite.
Partiendo de una imagen perfecta, es decir, una imagen con sólo dos niveles de gris, el reconocimiento de estos caracteres se realizará básicamente comparándolos con unos patrones o plantillas que contienen todos los posibles caracteres. Ahora bien, las imágenes reales no son perfectas, por lo tanto el Reconocimiento Óptico de Caracteres se encuentra con varios problemas:
- El dispositivo que obtiene la imagen puede introducir niveles de grises al fondo que no pertenecen a la imagen original.
- La resolución de estos dispositivos puede introducir ruido en la imagen, afectando los píxeles que han de ser procesados.
- La distancia que separa a unos caracteres de otros, al no ser siempre la misma, puede producir errores de reconocimiento.
- La conexión de dos o más caracteres por píxeles comunes también puede producir errores.

Aplicaciones

Desde la aparición de los algoritmos de Reconocimiento Óptico de Caracteres han sido muchos los servicios que han introducido estos procesos para aumentar su rendimiento y otros que se basan completamente en estas tecnologías. A continuación se muestran algunas de las más destacables aplicaciones que utilizan el OCR.

Reconocimiento de texto manuscrito

Las dificultades que podemos encontrar a la hora de reconocer un texto tipografiado, no se pueden comparar con las que aparecen cuando queremos reconocer un texto manuscrito.
El reconocimiento de un texto manuscrito continúa siendo un desafío. Aunque el texto se compone básicamente de caracteres individuales, la mayoría de algoritmos OCR no consiguen buenos resultados, ya que la segmentación de texto continuo es un procedimiento complejo.
En el caso de reconocimiento de escritura manuscrita a la hora de corrección de exámenes, existe la posibilidad, añadiendo un listado de lexico (nombres y apellidos) de acercarse al 100% de acierto. A través de las casillas de respuesta ICR se pueden reconocer palabras, como nombres de países, nombres de regiones, marcas comerciales, en resumen, todo aquello que pueda ser integrado en una lista de palabras –Lexico- este puede ir aumentándose según necesidades.
Por otro lado, se puede llegar a comprender una frase cuando la hemos terminado de leer. Esto implica una operación de niveles morfológicos, léxico y sintáctico que se consigue mediante el reconocimiento del habla continua. Para llevar a cabo esa metodología, se utilizan algoritmos robustos que utilizan una segmentación previa, debido a que se obtiene automáticamente con la descodificación.

Reconocimiento de matrículas

Una de las aplicradares. Estos deben ser capaces de localizar una matrícula de un vehículo con condiciones de iluminación, perspectiva y entorno variables.
En la etapa de segmentación, se buscan texturas similares a la de una matrícula y se aísla el área rectangular que forma la matrícula.
Finalmente, se aplica un proceso de clasificación múltiple sobre el conjunto de píxeles pertenecientes a la matrícula, proporcionando una cadena de caracteres que se tienen que ajustar a un modelo conocido: el formato de una matrícula. Si aparece algún error, es corregido.

Indexación en bases de datos

Con el gran aumento de información publicada que ha tenido lugar en los últimos años, cada vez son más los métodos que se utilizan para organizar todo este material almacenado en bases de datos. Uno de estos contenidos son las imágenes. Una de las formas más corrientes de buscar imágenes es a partir de metadato introducidos manualmente por los usuarios. Actualmente han aparecido buscadores que proporcionan la posibilidad de buscar imágenes mediante el texto que aparecen en ellas, como el buscador DIRS(Document Image Retrieval System) que, mediante un algoritmo de Reconocimiento Óptico de Caracteres, extrae el texto que aparece en la imagen y lo utiliza como metadato que podrá ser utilizado en las búsquedas. Esta tecnología proporciona una posibilidad en la búsqueda de imágenes y demuestra que el OCR aún puede dar mucho de sí.

Reconocimiento de datos estructurados con OCR Zonal

Se usa para digitalizar de forma masiva grandes cantidades de documentos estructurados o semiestructurados (facturas, nóminas, albaranes, pólizas, justificantes bancarios, etc.), catalogando automáticamente los documentos con los metadatos obtenidos y archivándolos en formato digital de forma indexada para facilitar su posterior búsqueda. Tiene el inconveniente de que es necesario diseñar previamente las plantillas, pero con una buena configuración se ahorra mucho tiempo en el proceso de digitalización.
2Que es un indice?
Una vez se ha digitalizado las imagenes, se captura la informaciòn relevante de ellos para poder a futuro lograr la recuperacion exacta de cada una de las imàgenes.

A manera de ejemplo si estamos digitalizando historias clinicas , nos interesaran en un futuro recuperar la historia clìnica de un paciente por algun criterio como nombre del paciente, cedula de ciudadania, numero de paciente interno, etc.

Gracias al software de captura Kodak “Kodak Capture Pro” se pueden capturar hasta 999 campos de indexaciòn ,gracias a la lectura de codigos de barra, de captura por OCR Zonal, de captura por datos del sistema para efectos de auditoria como hora de digitalizacion, usuario, estaciòn de digitalizacion. Tambien se puede capturar campos de indexacion manualmente incrementando el costo de los procesos.

Estos datos capturados pueden ser exportados en archivos de tipo texto para ser utilizados por motores de bases de datos diversos.