IMPLEMENTACIÓN DE LA MEDIOTECA DE LA FACULTAD DE INGENIERÍA DE LA UNIVERSIDAD SAN BUENAVENTURA
JENNY CAROLINA AVILAN NOVA GERHART THERRY LÓPEZ RUÍZ LINA MARGARITA LORA MATÍZ LUIS ALFONSO RHENALS MARTÍNEZ
UNIVERSIDAD DE SAN BUENAVENTURA FACULTAD DE INGENIERÍA PROGRAMA INGENIERÍA DE SISTEMAS BOGOTÁ DC 2006 IMPLEMENTACIÓN DE LA MEDIOTECA DE LA FACULTAD DE INGENIERÍA DE LA UNIVERSIDAD SAN BUENAVENTURA
JENNY CAROLINA AVILAN NOVA GERHART THERRY LÓPEZ RUÍZ LINA MARGARITA LORA MATÍZ LUIS ALFONSO RHENALS MARTÍNEZ
PROYECTO DE GRADO
ASESOR JAVIER HERNÁNDEZ INGENIERO DE SISTEMAS
UNIVERSIDAD DE SAN BUENAVENTURA FACULTAD DE INGENIERÍA PROGRAMA INGENIERÍA DE SISTEMAS BOGOTÁ DC 2006
2 NOTA DE ACEPTACIÓN ______
______
FIRMA DEL PRESIDENTE DEL JURADO
______
FIRMA DEL JURADO
______
FIRMA DEL JURADO
3 DEDICATORIA
A Dios por la fortaleza y ánimo que nos ha dado, a nuestros padres y abuelos que nos han enseñado a luchar hasta alcanzar nuestros propios objetivos y metas por muy difíciles que estas pareciesen, a nuestros amigos por escucharnos y brindarnos su ayuda en el momento que lo necesitábamos.
A nuestros seres queridos que ahora descansan en la paz del señor, quienes nos motivaron a comenzar esta carrera y hacer de nosotros unos excelentes profesionales.
4 AGRADECIMIENTOS
Ante todo damos gracias a Dios quien nos dio vida, salud y licencia para realizar y llevar a un término exitoso esta carrera.
Agradecemos también a nuestras familias, por brindarnos un apoyo incondicional, quienes aceptaron ausencias prolongadas, perdiendo así tiempos de unión familiar.
A las personas quienes ayudaron en nuestra formación intelectual y como personas racionales, por estar a nuestro lado y brindarnos ayuda durante el tiempo de nuestros estudios.
Igualmente agradecemos a la UNIVERSIDAD DE SAN BUENAVENTURA por darnos un espacio para innovar nuestros conocimientos y así desarrollar un pensamiento crítico y competitivo frente a la sociedad.
A JAVIER FERNANDO HERNÁNDEZ por disponer de su tiempo, por el aporte de sus conocimientos y experiencias.
A PATRICIA CARREÑO por la dedicación y orientación metodológica en el desarrollo de nuestro proyecto.
A la FACULTAD DE INGENIERÍA de la UNIVERSIDAD DE SAN BUENAVENTURA quien hizo posible que nuestra propuesta se llevara a cabo.
5 TABLA DE CONTENIDO
INTRODUCCIÓN PÁGINA
1 DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA ...... 10 1.1 ANTECEDENTES ...... 10 1.2 DESCRIPCIÓN DEL PROBLEMA ...... 11 1.3 FORMULACIÓN DEL PROBLEMA ...... 12 2 JUSTIFICACIÓN ...... 13 3 ALCANCES ...... 14 4 LIMITACIONES ...... 15 5 OBJETIVOS ...... 16 5.1 OBJETIVO GENERAL ...... 16 5.2 OBJETIVOS ESPECÍFICOS ...... 16 6 MARCO REFERENCIAL ...... 17 6.1 MARCO CONCEPTUAL ...... 17 6.2 MARCO TEÓRICO ...... 20 6.2.1 TERMINOLOGÍA BÁSICA...... 22 6.2.2 CONVERSIÓN...... 32 6.2.3 CONTROL DE CALIDAD...... 51 6.2.4 METADATOS ...... 59 6.2.5 INFRAESTRUCTURA TÉCNICA...... 62 6.2.6 PRESENTACIÓN...... 72 6.2.7 PRESERVACIÓN DIGITAL...... 81 6.2.8 GESTIÓN...... 87 6.2.9 FORMATOS DE VIDEO ...... 92 6.2.10 FORMATOS ...... 99 6.2.11 METADATOS “DUBLÍN CORE”...... 126 6.2.12 PHP ...... 136 6.2.13 PHP5 ...... 137 6.2.14 ¿POR QUÉ ELEGIR PHP 5?...... 138 6.2.15 ASP y ASP.NET...... 142 6.2.16 JSP...... 143 6.2.17 CSS...... 144 6.3 MARCO LEGAL ...... 146 6.4 ENFOQUE DE LA INVESTIGACIÓN...... 147 7 DESARROLLO INGENIERIL ...... 148 7.1 PLAN DE ITERACIÓN ...... 156 7.2 PREGUNTAS DE FORMULACIÓN ...... 157 7.3 METAS INFORMATIVAS ...... 158 7.4 METAS APLICABLES ...... 158 7.5 RECOPILACIÓN DE REQUISITOS PARA LA MEDIOTECA ...... 159
6 7.6 MEDICIÓN PARA INGENIERÍA WEB Y WEBAPPS ...... 161 7.6.1 MEDICIONES PARA ESFUERZO DE INGENIERÍA WEB ...... 161 7.6.2 JERARQUÍA DE USUARIOS...... 163 7.7 MODELAMIENTO UML ...... 163 7.7.1 DIAGRAMA CASOS DE USO...... 163 7.7.2 ESTEREOTIPOS DE BORDE...... 169 7.7.3 ESTEREOTIPOS DE ENTIDAD...... 170 7.7.4 ESTEREOTIPOS DE CONTROL...... 171 7.7.5 DIAGRAMAS DE SECUENCIA ...... 172 7.7.6 MODELO ARQUITECTÓNICO...... 176 7.7.7 DIAGRAMA ENTIDAD RELACIÓN...... 177 7.7.8 MAPA DE NAVEGACIÓN...... 188 7.7.9 DIAGRAMA FLUJO DE DOCUMENTOS...... 189 8 PRESENTACIÓN DE RESULTADOS...... 195 9 PROYECCIONES ...... 206 10 CONCLUSIONES ...... 208 11 RECOMENDACIONES...... 210 12 BIBLIOGRAFÍA ...... 214
7 LISTA DE ANEXOS
PÁGINA
ANEXO A ENCUESTA .……………………………….…………………….. 211
8 INTRODUCCIÓN
La creación de una Medioteca ayuda al estudiante y al docente de la Universidad San Buenaventura al desarrollo práctico de búsquedas avanzadas y de fácil acceso; al aprendizaje y a un mejor desempeño analítico y experimental. Teniendo en cuenta los factores que conllevan al análisis, diseño y construcción del sistema es importante resaltar los aspectos para entenderlo; el cómo y para qué funciona una Medioteca empezando por los conceptos básicos entre los cuales se tiene Video, Audio, Texto, Imágenes, Diapositivas, las diferentes características como los tipos de codificación, extensiones del archivo, calidad de compresión y tamaño; estas son de gran importancia y una base fundamental para la fase de desarrollo del proyecto.
La difusión de información de carácter académico es importante para desarrollar muchas habilidades, apoyadas por compendios elaborados por los educadores que brindan al alumno un vistazo más detallado de cada asignatura por medio de la aplicación Web, una colección de documentos al servicio de la comunidad educativa, que tendrá la capacidad de acercarse más a un aprendizaje netamente virtual, que será puesto a disposición dentro de la intranet de la universidad de San Buenaventura.
El estudiante y el docente tienen la opción de visualizar el Catálogo de material de apoyo pedagógico y didáctico, teniendo en cuenta los filtros de búsqueda dependiendo del semestre, materia, y el amismo tiempo los podrá descargar de Internet.
Como proyecto de grado lo más importante es la generación de ideas que muestren nuevos rumbos y soluciones al manejo de la información de carácter académico; Es un trabajo realizado por Estudiantes para una comunidad educativa que día a día requiere de innovación y constante cambio.
9 1 DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA
1.1 ANTECEDENTES
Desde hace unos años, en las colecciones de las bibliotecas se han incorporado, como componentes importantes de sus fondos, las grabaciones sonoras, las videograbaciones, los archivos de computador, los sistemas multimedia o incluso diversos recursos de Internet.
Las novedades, como era de esperar, son más bien escasas en estos sitios pero pueden encontrarse con facilidad los grandes clásicos y todo tipo de material fuera del catalogo, además de infinidad de literatura especializada, tesis doctorales, etc. Y todo en español. Por supuesto, existe oferta en otros idiomas, pero los Colombianos pueden disfrutar de los volúmenes de innumerables mediotecas.
Hasta ahora, el perfil del consumidor era el de un hombre con una edad comprendida entre los 25 y 40 años, y de nivel socio cultural medio alto. Sin embargo, es posible que las facilidades que da Internet ayuden a democratizar el consumo de literatura, al menos en los países latinoamericanos en donde la inmensa mayoría de la población tiene acceso a la red.
Entre proyecto de mediotecas exitosas se tiene: Policía Nacional donde se puede tomar tipos de archivos como son audio, video y documentos acerca de esta, la Universidad de Oviedo de España donde se puede encontrar catálogos del material disponible en la Biblioteca de la Universidad, estos catálogos tiene tipos de archivo como videos, memorias de conferencias, documentos y presentaciones a los cuales puede acceder tanto el docente como el estudiante de dicha Universidad, otro proyecto de medioteca exitosa es la de Colombia
10 Aprende en ella los estudiantes y docentes del país pueden tener acceso al material de apoyo pedagógico de ciertas materias dentro del nivel educativo.
Actualmente en la UNIVERSIDAD DE SAN BUENAVENTURA para acceder al material de apoyo pedagógico y didáctico sus estudiantes y docentes se acercan al área encargada solicitándolo en medio físico.
1.2 DESCRIPCIÓN DEL PROBLEMA
Día a día tanto la educación como la tecnología han ido evolucionando a pasos agigantados, las clases ya no son magistrales, el docente tiene que hacer una clase dinámica e interactiva, en la cual el estudiante se sienta a gusto y trabaje a su propio ritmo, incrementando sus conocimientos reconociendo sus capacidades de comprensión individual, basándose siempre en el material pedagógico y didáctico que las instituciones educativas ponen a su alcance el cual ya no se limitan únicamente a los textos, sino también a colecciones de imágenes, videos, presentaciones y demás medios audiovisuales que podrían contribuir a su aprendizaje.
En la actualidad la Facultad de Ingeniería de la Universidad de San Buenaventura tiene gran cantidad de apoyos pedagógicos, didácticos, medios audiovisuales que muchas veces no son aprovechados por todos los estudiantes de la facultad, debido a que no hay tantas copias como el número de estudiantes, docentes y administrativos que quieren acceder al material, para tener acceso a los recursos de multimedia se solicitan en la oficina de multimedios, para acceder a archivos tipo texto, se debe ir a la biblioteca o a la fotocopiadora, y si es de otro tipo como presentaciones o repertorios se debe recurrir al docente, es allí donde se les entrega en medio físico, por lo tanto si varias personas desean tener acceso a determinado material al mismo tiempo, no pueden acceder más estudiantes que el número de copias físicas que existan de este, teniendo en cuenta que no hay una cantidad ilimitada de
11 copias del mismo medio, esto hace que los usuarios pierdan la oportunidad de consultarlo a su debido tiempo, vean limitada su capacidad de aprendizaje y desistan del servicio.
1.3 FORMULACIÓN DEL PROBLEMA
¿Cómo permitir el acceso simultáneo de un gran número de usuarios al material pedagógico y didáctico que proporciona la Facultad de Ingeniería de la Universidad de San Buenaventura?
12 2 JUSTIFICACIÓN
La utilización masiva de los nuevos medios tecnológicos conlleva una nueva visión del mundo y una configuración de la sociedad, y fundamentalmente se tiene la comunicación como base y cualidad del ser humano la cual ha servido de vehículo en el progreso social, personal y académico por esta razón el mundo está evolucionando, basado en nuevas formas de actuar y de pensar.
Pensando en desarrollar una aplicación que presta un servicio para estudiantes, docentes y administrativos se debe tener en cuenta el problema que se va a resolver, tomar como referencia lo que existe actualmente y como mejorarlo o cambiarlo por un nuevos sistema, para dar una solución funcional, práctica y satisfactoria tanto para los usuarios como para los encargados de la aplicación.
Por lo tanto se pretende con la aplicación implementar en este, elementos prácticos e interactivos que contengan el material de apoyo pedagógico y didáctico entre los cuales existen conferencias, archivos de audio, documentos pdf, memorias de conferencias, eventos institucionales, películas técnicas, fotografías; ya que su finalidad es apoyar al usuario logrando el acceso a los distintos tipos de medios sin importar la disponibilidad de copias físicas de ellos y crear una solución rápida y eficiente contraria a la actual implementada.
13 3 ALCANCES
El proyecto de grado concluirá con la implementación de aplicación de la Medioteca para la Facultad de Ingeniería de la Universidad de San Buenaventura, después de haberle hecho un esquema de pruebas donde permita verificar la funcionalidad del mismo.
La Aplicación tendrá determinados ejemplos del material de apoyo pedagógico y didáctico que existen en la Facultad, para esto se hará la digitalización de algunos archivos de estas colecciones (conferencias, memorias de conferencias, documentos en formato pdf, entre otros), para dar a conocer con ejemplos la funcionalidad de una Medioteca.
La aplicación tendrá un documento que refleja los estándares (gestión documental) para el manejo de documentos a incluir en la medioteca.
La gestión documental para la Medioteca se realizará para la facultad de Ingeniería.
El sistema de información tendrá un documento de soporte (manual de usuario en línea) que permitirá al administrador del sistema tener conocimiento acerca del funcionamiento de este.
La aplicación será una forma rápida e interactiva, donde el usuario sin importar la hora, disponibilidad podrá tener en línea varios de los recursos que se encuentren ocupados, que no tengan acceso momentáneo, y requieran tiempo de consulta.
14 4 LIMITACIONES
La implementación de la medioteca de la Facultad de Ingeniería de la Universidad de San Buenaventura va a estar sujeta a los recursos (físicos, tecnológicos, económicos) con los que cuenta la Universidad.
Al implementar la aplicación de la medioteca, la labor de digitalización de los medios audiovisuales será realizada por el área encargada en la Universidad de San Buenaventura siguiendo los estándares establecidos para el manejo de la documentación.
Las técnicas de digitalización de los archivos, estará sujeta al soporte de la gestión documental propia de la Medioteca, teniendo en cuenta todas las características físicas de los medios que pertenecerán a la colección de la Medioteca.
15 5 OBJETIVOS
5.1 OBJETIVO GENERAL
• Implementar la Medioteca de la Facultad de Ingeniería de la Universidad San Buenaventura; para recursos pedagógicos y didácticos.
5.2 OBJETIVOS ESPECÍFICOS
• Determinar los diferentes tipos de formatos de archivos (video, audio, texto, imagen) a utilizar para tener un mejor desempeño de la medioteca. • Crear un estándar para la gestión del material a publicar en la medioteca teniendo en cuenta los principios de escalabilidad. • Diseñar el modelado de análisis para la medioteca. • Desarrollar el diseño propuesto de la medioteca. • Realizar pruebas al desarrollo de la medioteca. • Implementar la medioteca. • Realizar pruebas a la medioteca implementada.
16 6 MARCO REFERENCIAL
6.1 MARCO CONCEPTUAL
MEDIOTECA:
• Es una colección virtual a cuyos volúmenes se puede acceder desde cualquier parte del planeta. Las Mediotecas llevan funcionando ya varias décadas, desde que en la década de los 70 apareciera Project Gutemberg, pero es en los últimos años cuando su variedad y diversificación las ha convertido en instrumentos útiles que ofertan calidad. • Se pueden encontrar videos educativos, archivos de sonido, fotos, programas populares, desde donde se pueden disponer de estos recursos.
TECNOLOGÍAS
Formato de archivos: Estructura de un archivo que define la forma en que se guarda y representa la información que contiene en la pantalla.
Para poder realizar una captura de película, es necesario guardar el grupo de imágenes y sonido en algún formato de video. Estos formatos, al igual que ocurre con los archivos de imágenes, están estrechamente ligados al software que está realizando la operación de captura. Por lo general los formatos de videos suelen estar compuestos por una cabecera en la que se almacena información sobre las características del archivo. Algunas de estas características son:
17 • El número de fotogramas o cuadros que contiene por segundo. • El tiempo de separación que hay entre los fotogramas. • El tiempo de exposición. • Resolución y nivel de compresión. • Datos del sonido, en caso de contener audio el video.
Todos estos parámetros se suelen definir al momento de realizar la digitalización.
Algunos de los formatos de video en el entorno PC que han dado mejores resultados, son:
AVI : El formato AVI (Audio Video Interleave) , cuya traducción podría entenderse como intercalación de video y audio, fue diseñado por Microsoft como un formato estándar de video que requiere disponer de tarjeta para realizar la captura y la compresión, pero no requiere de ningún tipo de hardware especial para la descompresión y la reproducción, por lo que rápidamente se ha convertido en un verdadero elemento estándar dentro de los aficionados a esta práctica en el ambiente informático.
MOV: El formato MOV proviene de Movie es un formato específico de algunos software dedicados a la digitalización de videos, vienen acompañando a algunas tarjetas digitalizadoras. Una ventaja importante es su compatibilidad con los archivos AVI. El software Adobe Premiere en sus últimas versiones lo ha incorporado y esto lo está convirtiendo en un formato popular. Con respecto a la calidad y resolución podemos decir que no ocupa el primer lugar pero se mantiene entre los primeros.
18 Entre los formatos de compresión que aportan especificaciones importantes tenemos:
JPEG: (Joint Photographics Experts Group) , utilizado para la compresión de imágenes de video estáticas, es decir para la compresión de un solo cuadro por vez. La calidad, resolución y fidelidad de la imagen es muy buena y el tamaño del archivo si bien no es muy grande tampoco se podría calificar de pequeño.
MPEG: (Motion Picture Expert Group) , utilizado para la compresión de imágenes en movimiento. Este método se apoya en algoritmos matemáticos complejos los cuales vienen incluidos en el chip DSP que poseen las tarjetas digitalizadoras. Este método aún tiene mucho que perfeccionar pero los resultados que se obtienen actualmente no son despreciables si se cuenta con capacidad de almacenamiento externa.
SWF: El formato de Flash Player es el formato de archivo principal para distribuir el contenido de Flash y el único formato que admite toda la funcionalidad interactiva de Flash. Las películas de Flash Player pueden reproducirse de varias formas: En navegadores Internet como Netscape e Internet Explorer que estén equipados con Flash Player.
GESTIÓN DOCUMENTAL: Los sistemas de información de este tipo como lo es la medioteca, necesitan completas soluciones que permitan gestionar la información disponible para hacerla accesible, y que cada usuario que vaya a acceder al sistema tenga en cuenta los estándares de documentación que se incluirán en esta medioteca.
Por otro lado, este material requiere mayores esfuerzos desde el punto de vista de la gestión documental debido a la naturaleza audiovisual de la información y en otros casos los documentos como tales, las funciones tradicionales que se atribuyen al servicio de documentación audiovisual son las de selección,
19 registro, análisis documental y de contenido, búsqueda de la información, gestión de la publicación y conservación del patrimonio audiovisual de la Universidad.
MYSQL: (Database Management System, DBMS), MySQL es el servidor de bases de datos relacionales libre, desarrollado y proporcionado por MySQL AB. MySQL AB es una empresa cuyo negocio consiste en proporcionar servicios en torno al servidor de bases de datos MySQL. Una de las razones para el rápido crecimiento de popularidad de MySQL, es que se trata de un producto Open Source, y por lo tanto, va de la mano con este movimiento.
PHP: (acrónimo de PHP: Hypertext Preprocessor), es un lenguaje interpretado de alto nivel embebido en páginas HTML y ejecutado en el servidor.
6.2 MARCO TEÓRICO
Avances recientes en las telecomunicaciones y la computación han abierto la posibilidad de transmitir información en formato digital, a bajo costo y estructurada conforme a nuevos esquemas de escritura, edición, almacenamiento, publicación y recuperación, aumentando su valor al ofrecerla en forma inmediata.
El creciente aumento en la publicación y circulación de documentos digitales con texto, sonido, videos e imágenes ha dado lugar a la creación de una categoría denominada Biblioteca Digital “MEDIOTECA” para aludir a la idea de la creación y manejo de acervos en formatos digitales.
El término biblioteca digital “MEDIOTECA” es tomado con un significado diferente dependiendo del tipo de usuario que se trate. Para algunos simplemente sugiere la digitalización de las bibliotecas tradicionales, para otros, quienes han estudiado la ciencia de las bibliotecas, se llama a la ejecución de las funciones de la biblioteca tradicional en una nueva forma, la cual contiene nuevos tipos de recursos de información, nuevas formas de
20 adquisición, nuevos métodos de almacenamiento y preservación, más confianza en sistemas electrónicos y redes, y un cambio dramático en las prácticas económicas, organizacionales e intelectuales.
Las bibliotecas escolares, universitarias, públicas juegan un papel central en la educación y el aprendizaje, lo que se aplica igualmente para las mediotecas.
Uno de los principales elementos tecnológicos y de investigación de las bibliotecas digitales “MEDIOTECA”, es el que se refiere al indexado y recuperación de la información contenida en éstas. Si bien se han propuesto varios algoritmos y estrategias para el indexado de información digital, principalmente para texto y más recientemente en videos e imágenes, apenas se empieza a explorar el efecto sinérgico de integrar técnicas de indexado y recuperación de distintos medios que frecuentemente ofrecen información redundante y complementaria en bases de datos mixtas.
Las Mediotecas llevan funcionando ya varias décadas –desde que en la década de los 70 apareciera Project Gutemberg (Biblioteca Electronica) 1, pero es en los últimos años cuando su variedad y diversificación las ha convertido en instrumentos útiles que ofertan calidad.
Las novedades, como era de esperar, son más bien escasas en estos sitios pero pueden encontrarse con facilidad los grandes clásicos y todo tipo de material fuera de catálogo, además de infinidad de literatura especializada, tesis doctorales, etc. Y todo en español. Por supuesto, existe oferta en otros idiomas, pero los colombianos pueden disfrutar de los volúmenes de innumerables Mediotecas.
Hasta ahora, el perfil del consumidor era el de un hombre con una edad comprendida entre los 25 y 40 años, y de nivel socio cultural medio alto. Sin
1 http://gutemberg.org/wiky/Main_Page
21 embargo, es posible que las facilidades que da Internet ayuden a democratizar el consumo de literatura, al menos en los países latinoamericanos donde la inmensa mayoría de la población tiene acceso a la red. En la página de la Universidad de San Buenaventura se facilitará en forma gratuita, con el respaldo de un listado, el material de multimedia con que cuenta en sus archivos (imágenes, videos digitalizados, conferencias, memorias de conferencias, archivos de audio, documentos en formato pdf), para la difusión pública, a través de la Medioteca de la Facultad de Ingeniería de la Universidad de San Buenaventura.
6.2.1 TERMINOLOGÍA BÁSICA
• Las IMÁGENES DIGITALES son fotos electrónicas tomadas de una escena o escaneadas de documentos -fotografías, manuscritos, textos impresos e ilustraciones. Se realiza una muestra de la imagen digital y se confecciona un mapa de ella en forma de cuadrícula de puntos o elementos de la figura (píxeles). A cada píxel se le asigna un valor tonal (negro, blanco, matices de gris o color), el cual está representado en un código binario (ceros y unos). Los dígitos binarios ("bits") para cada píxel son almacenados por una computadora en una secuencia, y con frecuencia se los reduce a una representación matemática (comprimida). Luego la computadora interpreta y lee los bits para producir una versión analógica para su visualización o impresión. 2
2 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006 8:00 Am
22 Imagen 1. Valor de Píxel
Valores De Píxel : Como se exhibe en esta imagen bitonal, a cada píxel se le asigna un valor tonal, en este ejemplo 0 para el negro y 1 para el blanco. 3
La RESOLUCIÓN es la capacidad de distinguir los detalles espaciales finos. Por lo general, la frecuencia espacial a la cual se realiza la muestra de una imagen digital (la frecuencia de muestreo) es un buen indicador de la resolución. Este es el motivo por el cual dots-per-inch (puntos por pulgada) (dpi) o pixels-per-inch (píxeles por pulgada) (ppi) son términos comunes y sinónimos utilizados para expresar la resolución de imágenes digitales. Generalmente, pero dentro de ciertos límites, el aumento de la frecuencia de muestreo también ayuda a aumentar la resolución.
3 Imagen tomada de http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006
23 Imagen 2. Píxeles
Píxeles: Pueden verse los píxeles en forma individual al aumentar una imagen por medio del zoom. 4
• Las DIMENSIONES DE PÍXEL son las medidas horizontales y verticales de una imagen, expresadas en píxeles. Las dimensiones de píxel se pueden determinar multiplicando tanto el ancho como la altura por el dpi. Una cámara digital también tendrá dimensiones de píxel, expresadas como la cantidad de píxeles en forma horizontal y en forma vertical que definen su resolución (por ejemplo: 2.048 por 3.072). Calcule el dpi logrado dividiendo las dimensiones de un documento por la dimensión de píxel correspondiente respecto de la cual se encuentra alineado.
Imagen 3. Dimensión de Píxel
Dimensión De Píxel: Un documento de 8 x 10 pulgadas que se escanea a 300 dpi posee dimensiones de píxel de 2400 píxeles (8 pulgadas x 300 dpi) por 3000 píxeles (10 pulgadas x 300 dpi). 3
4 Ibit preservation/tutorial-spanish/preface.html
24 • La PROFUNDIDAD DE BITS es determinada por la cantidad de bits utilizados para definir cada píxel. Cuanto mayor sea la profundidad de bits, tanto mayor será la cantidad de tonos (escala de grises o color) que puedan ser representados. Las imágenes digitales se pueden producir en blanco y negro (en forma bitonal), a escala de grises o a color. o Una imagen bitonal está representada por píxeles que constan de 1 bit cada uno, que pueden representar dos tonos (típicamente negro y blanco), utilizando los valores 0 para el negro y 1 para el blanco o viceversa. o Una imagen a escala de grises está compuesta por píxeles representados por múltiples bits de información, que típicamente varían entre 2 a 8 bits o más. Ejemplo: En una imagen de 2 bits, existen cuatro combinaciones posibles: 00, 01, 10 y 11. Si "00" representa el negro, y "11" representa el blanco, entonces "01" es igual a gris oscuro y "10" es igual a gris claro. La profundidad de bits es dos, pero la cantidad de tonos que pueden representarse es 2 2 ó 4. A 8 bits, pueden asignarse 256 (2 8 ) tonos diferentes a cada píxel. o Una imagen a color está típicamente representada por una profundidad de bits entre 8 y 24 o superior a ésta. En una imagen de 24 bits, los bits por lo general están divididos en tres grupos: 8 para el rojo, 8 para el verde, y 8 para el azul. Para representar otros colores se utilizan combinaciones de esos bits. Una imagen de 24 bits ofrece 16,7 millones (2 24 ) de valores de color. Cada vez más, los escáneres están capturando 10 bits o más por canal de color y por lo general imprimen a 8 bits para compensar el "ruido" del escáner y para presentar una imagen que se acerque en el mayor grado posible a la percepción humana.
25 Imagen 4. Profundidad de Bits
Profundidad De Bits : De izquierda a derecha - imagen bitonal de 1 bit, a escala de grises de 8 bits, y a color de 24 bits. 5
Cálculos binarios para la cantidad de tonos representados por profundidades de bits comunes:
1 bit (2 1) = 2 tonos 2 bits (2 2) = 4 tonos 3 bits (2 3) = 8 tonos 4 bits (2 4) = 16 tonos 8 bits (2 8) = 256 tonos 16 bits (2 16) = 65.536 tonos 24 bits (2 24) = 16,7 millones de tonos
5 Ibit preservation/tutorial-spanish/preface.html
26 • RANGO DINÁMICO es el rango de diferencia tonal entre la parte más clara y la más oscura de una imagen. Cuanto más alto sea el rango dinámico, se pueden potencialmente representar más matices, a pesar de que el rango dinámico no se correlaciona en forma automática con la cantidad de tonos reproducidos. Por ejemplo, el microfilm de alto contraste exhibe un rango dinámico amplio, pero presenta pocos tonos. El rango dinámico también describe la capacidad de un sistema digital de reproducir información tonal. Esta capacidad es más importante en los documentos de tono continuo que exhiben tonos que varían ligeramente, y en el caso de las fotografías puede ser el aspecto más importante de la calidad de imagen.
Imagen 5. Rango Dinámico
Rango Dinámico : La imagen superior posee un rango dinámico más amplio, pero una cantidad limitada de tonos representados. La imagen inferior posee un rango dinámico más estrecho, pero una mayor cantidad de tonos representados. Observe la falta de detalle en las sombras y los toques de luz en el marco superior. Cortesía de Don Brown. 6
6 Ibit preservation/tutorial-spanish/preface.html
27 • El TAMAÑO DEL ARCHIVO se calcula multiplicando el área de superficie (altura x ancho) de un documento a ser escaneado, por la profundidad de bits y el dpi. Debido a que el archivo de imagen se representa en bytes, que están formados por 8 bits, divida esta cifra por 8.
Fórmula 1 para el tamaño de archivo Tamaño de archivo = (altura x ancho x profundidad de bits x dpi 2) / 8
• Si se proporcionan las dimensiones de píxel, multiplíquelas entre sí y por la profundidad de bit para determinar la cantidad de bits presentes en un archivo de imagen. Por ejemplo, si se captura una imagen de 24 bits con una cámara digital con dimensiones de píxel de 2.048 x 3.072, entonces el tamaño de archivo es igual a (2048 x 3072 x 24) / 8, o 50.331.648 bytes.
Fórmula 2 para el tamaño de archivo Tamaño de archivo = (dimensiones de píxel x profundidad de bits) / 8
Sistema convencional para dar nombres a los archivos según el tamaño de los mismos : Debido a que las imágenes digitales tienen como resultado archivos muy grandes, la cantidad de bytes con frecuencia se representa en incrementos de 2 10 (1.024) o más:
1 Kilobyte (KB) = 1.024 bytes 1 Megabyte (MB) = 1.024 KB 1 Gigabyte (GB) = 1.024 MB 1 Terabyte (TB) = 1.024 GB
28 • La COMPRESIÓN se utiliza para reducir el tamaño del archivo de imagen para su almacenamiento, procesamiento y transmisión. El tamaño del archivo para las imágenes digitales puede ser muy grande, complicando las capacidades informáticas y de redes de muchos sistemas. Todas las técnicas de compresión abrevian la cadena de código binario en una imagen sin comprimir, a una forma de abreviatura matemática, basada en complejos algoritmos. Existen técnicas de compresión estándar y otras patentadas. En general es mejor utilizar una técnica de compresión estándar y ampliamente compatible, antes que una patentada, que puede ofrecer compresión más eficiente y/o mejor calidad, pero que puede no prestarse a un uso o a estrategias de preservación digital a largo plazo. En la comunidad de las bibliotecas y los archivos hay un importante debate acerca del uso de la compresión en archivos maestros de imágenes.
Los sistemas de compresión también pueden caracterizarse como sin pérdida o con pérdida. Los sistemas sin pérdida, como ITU-T.6, abrevian el código binario sin desechar información, por lo que, cuando se "descomprime" la imagen, ésta es idéntica bit por bit al original. Los sistemas con pérdida, como JPEG, utilizan una manera de compensar o desechar la información menos importante, basada en un entendimiento de la percepción visual. Sin embargo, puede ser extremadamente difícil detectar los efectos de la compresión con pérdida, y la imagen puede considerarse "sin pérdida visual". La compresión sin pérdida se utiliza con mayor frecuencia en el escaneado bitonal de material de texto. La compresión con pérdida típicamente se utiliza con imágenes tonales, y en particular imágenes de tono continuo en donde la simple abreviatura de información no tendrá como resultado un ahorro de archivo apreciable.
29 Imagen 6. Compresión con pérdida.
Compresión Con Pérdida : Observe los efectos de la compresión JPEG con pérdida sobre la imagen ampliada por medio del zoom (izquierda). En la imagen inferior, se ven artefactos en forma de cuadrados de píxel de 8 x 8, y los detalles finos, como por ejemplo las pestañas, han desaparecido. 7
Los sistemas de compresión emergentes ofrecen la capacidad de proveer imágenes de resolución múltiple desde un solo archivo, proporcionando flexibilidad en la entrega y la presentación de las imágenes a los usuarios finales.
• Los FORMATOS DE ARCHIVO consisten tanto en los bits que comprende la imagen como en la información del encabezamiento acerca de cómo leer e interpretar el archivo. Los formatos de archivo varían en términos de resolución, profundidad de bits, capacidades de color, y soporte para compresión y metadatos.
7 Ibit preservation/tutorial-spanish/preface.html
30 Tabla 1. Formatos de Archivo
Nombre y TIFF 6.0 GIF 89a JPEG (Joint Flashpix 1.0.2 ImagePac, PNG 1.2 PDF 1.3 versión (Tagged Image (Graphics Photographic Photo CD (Portable (Portable actual File Format) Interchange Expert Network Document Format) Group)/JFIF Graphics) Format) (JPEG File Interchange Format)
Extensión .tif, .tiff .gif .jpeg, jpg, .jif, .fpx .pcd .png .pdf (Extensiones) .jfif
Profundidad Bitonal a 1 bit; Bitonal, escala Escala de Escala de grises a Color a 24 1-48 bits; color Escala de grises (es) de bits escala de grises de grises o grises a 8 bits; 8 bits; color a 24 bits a 8 bits, escala a 4 bits; color a 8 o color de paleta color entre 1 y 8 color a 24 bits bits de grises a 16 bits; soporta de 4 u 8 bits; bits bits, color a 48 hasta 64 bits para hasta color de 64 bits color bits[1]
Compresión Descomprimido Sin pérdida: Con pérdida: Descomprimido Con pérdida: Sin pérdida: Descomprimido sin pérdida: ITU- LZW[2] JPEG Formato Deflate, Sin pérdida: ITU-
T.6, LZW, etc. Con pérdida: patentado derivado de T.6, LZW Sin pérdida:[3] JPEG Kodak "sin LZ77 Con pérdida: pérdida Con pérdida: JPEG visual"[4] JPEG
Estándar / Estándar de Estándar de JPEG: ISO Especificación Patentado ISO 15948 Estándar de patentado facto facto 10918-1/2 disponible para el (anticipado)[6] facto[7] público
JFIF: estándar de facto[5]
Gestión de RGB, Paleta, Paleta YC bCr PhotoYCC y NIF PhotoYCC Paleta, sRGB, RGB, YC bCr, color YC bCr,[8] CMYK, RGB,[9] ICC ICC CMYK CIE L*a*b* (opcional)
Soporte de Conexión o Originario Originario Conexión Aplicación Originario desde Conexión o Web aplicación desde desde Java™ o Microsoft® aplicación externa Microsoft® Microsoft® aplicación Internet externa Internet Internet externa [10] Explorer 4, Explorer 3, Explorer 2, Netscape® Netscape Netscape Navigator 4.04, Navigator® 2 Navigator® 2 (pero aún incompleto)
Soporte de Conjunto básico Campo de texto Campo de texto Gran conjunto de A través de Conjunto básico Conjunto básico metadatos de rótulos libre para libre para rótulos bases de de rótulos de rótulos etiquetados comentarios comentarios etiquetados datos etiquetados más etiquetados externas; no rótulos definidos posee por el usuario. metadatos inherentes
Comentarios Acepta imágenes Se puede JPEG Proporciona Proporciona 5 Puede Preferido para y archivos reemplazar por progresivo múltiples ó 6 reemplazar a imprimir y ver múltiples[11] PNG; ampliamente resoluciones de resoluciones GIF documentos de soportado por cada imagen; diferentes de páginas
Soporte de los amplio soporte de cada imagen; múltiples; uso entrelazado y navegadores la industria, pero futuro incierto intensivo por transparencia a Web[12] aplicaciones parte del través de la actuales limitadas gobierno mayoría de los navegadores Web
Página inicial Página inicial no Especificación Página inicial Página inicial Página inicial Página inicial Página inicial oficial de TIFF GIF JPEG FlashPix PhotoCD PNG PDF
31 6.2.2 CONVERSIÓN
La captura de imágenes digitales debe tomar en cuenta los procesos técnicos comprendidos al convertir una representación analógica en digital, así como también los atributos de los documentos fuente en sí mismos: dimensiones físicas y presentación, nivel de detalles, rango tonal, y presencia de color. Los documentos también se pueden caracterizar por el proceso de producción utilizado para crearlos, incluyendo medios manuales, mecánicos, fotográficos, y, últimamente, electrónicos. Además, todos los documentos con formato de papel y película estarán comprendidos en una de las siguientes cinco categorías, que afectarán su grabación digital.
TIPOS DE DOCUMENTOS :
• Texto impreso / Dibujos de líneas simples — representación en base a bordes definidos, sin variación de tono, como un libro que contiene texto y gráficos de líneas simples.
• Manuscritos — representaciones en base a bordes suaves que se producen a mano o a máquina, pero no exhiben los bordes definidos típicos de los procesos a máquina, como el dibujo de una letra o una línea. • Media Tinta — reproducción de materiales gráficos o fotográficos representados por una cuadrícula con un esquema de puntos o líneas de diferente tamaño y espaciadas regularmente que, habitualmente se encuentran en un ángulo. También incluye algunos tipos de arte gráfica, como por ejemplo, los grabados.
• Tono Continuo — elementos tales como fotografías, acuarelas y algunos dibujos de líneas finamente grabadas que exhiben tonos que varían suave o sutilmente.
32 • Combinado — documentos que contienen dos o más de las categorías mencionadas anteriormente, como por ejemplo, los libros ilustrados.
Imagen 7. Tipos de Documentos.
Tipos De Documentos: De izquierda a derecha - texto impreso, manuscrito, media tinta, tono continuo y combinado. 8
FACTORES DEL ESCANEADO QUE AFECTAN LA CALIDAD DE LA IMAGEN:
RESOLUCIÓN / UMBRAL: El aumento de la resolución permite capturar detalles más precisos. Sin embargo, en algún punto, una mayor resolución no tendrá como resultado una ganancia evidente en la calidad de la imagen, sino un mayor tamaño de archivo. La clave es determinar la resolución necesaria para capturar todos los detalles importantes que están presentes en el documento fuente.
8 Ibit preservation/tutorial-spanish/preface.html
33 Imagen 8. Efectos de la resolución sobre la calidad de la imagen
Efectos De La Resolución Sobre La Calidad De La Imagen : A medida que aumenta la resolución, la ganancia de calidad de imagen se nivela. 9
La configuración del umbral en el escaneado bitonal define el punto en una escala, que varía entre 0 (negro) y 255 (blanco), en el cual los valores grises capturados se convertirán en píxeles negros o blancos. Observe el efecto de variar el umbral en los textos escritos a máquina escaneados con la misma resolución en el mismo escáner.
Imagen 9. Efectos del umbral sobre la resolución
Efectos Del Umbral Sobre La Resolución: La muestra A posee un umbral inferior (60) al de la muestra B (100). 8
9 Ibit preservation/tutorial-spanish/preface.html
34 PROFUNDIDAD DE BITS: El aumento de la profundidad de bits, o la cantidad de bits utilizados para representar cada píxel, permite capturar más matices de gris, o tonos de color. Rango dinámico es el término utilizado para expresar el total de variaciones tonales, desde el más claro de los claros hasta el más oscuro de los negros. La capacidad de un escáner para capturar el rango dinámico está regulada por la profundidad de bits que utilice y genere, así como también por el rendimiento del sistema. El aumentar la profundidad de bits afectará los requisitos de resolución, tamaño de archivo y método de compresión utilizado. 10
Imagen 10. Profundidad de bits.
Profundidad De Bits: Cuando una imagen en formato JPEG de 24 bits (izquierda) se reduce a una imagen GIF de 8 bits (derecha), la reducción de color puede tener como resultado la cuantificación de artefactos, evidentes en la aparición de intervalos de tonos visibles en el ángulo superior izquierdo de la imagen en formato GIF. 11
MEJORAS : Los procesos de mejora aumentan la calidad del escaneado pero su utilización genera inquietudes acerca de la fidelidad y autenticidad. Muchas instituciones rechazan las mejoras efectuadas en imágenes originales, limitándolas a archivos de acceso solamente. Las características típicas de mejoras en el software de los escáneres o de las herramientas de edición de
10 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006 11 Ibit preservation/tutorial-spanish/preface.html
35 imágenes incluyen eliminación de muaré (descreening), eliminación de puntos (despeckling), eliminación de oblicuidad (deskewing), aumento de nitidez (sharpening), utilización de filtros personalizados, y ajuste de profundidad de bits. A continuación se describen varios ejemplos de procesos de mejora de imagen.
Imagen 11. Mejora de Imagen
Mejora De Imagen : Letras escaneadas con la misma resolución y configuración de umbral, pero a la imagen de la derecha se le aplicó un filtro de nitidez. 12
Imagen 12. Mejora de Imagen
Mejora de imagen: La imagen de la izquierda fue alterada (derecha) en el nivel de píxeles, utilizando un programa de edición de imagen. 11
COLOR : La captura y transmisión de la apariencia del color es posiblemente el aspecto más difícil de la digitalización de imágenes. La reproducción correcta
12 Ibit preservation/tutorial-spanish/preface.html
36 del color depende de una serie de variables, como el nivel de iluminación al momento de la captura, la profundidad de bits capturada y generada, las capacidades del sistema de escaneado, y la representación matemática de la información del color a medida que la imagen pasa por la cadena de digitalización y de un espacio de color a otro.
Imagen 13. Cambio de Color.
Cambio De Color : Imagen con un tono rojizo total (izquierda) y colores originales (derecha). 13
RENDIMIENTO DEL SISTEMA: Con el tiempo, el equipo utilizado y su rendimiento afectarán la calidad de la imagen. Diferentes sistemas con las mismas características declaradas (por ejemplo: dpi, profundidad de bits y rango dinámico) pueden producir resultados radicalmente diferentes. El rendimiento del sistema se determina por medio de pruebas que verifican la resolución, reproducción de tonos, calidad de colores, ruido y artefactos.
13 Ibit preservation/tutorial-spanish/preface.html
37 Imagen 14. Rendimiento del sistema.
Rendimiento Del Sistema : Observe la diferencia en la calidad de la imagen de los caracteres alfanuméricos escaneados en tres sistemas diferentes con la misma resolución y profundidad de bits. 14
FORMATO DE ARCHIVO: El formato de archivo para las imágenes originales deberá aceptar la resolución, profundidad de bits, información de color y metadatos que usted necesite. Por ejemplo, tiene poco sentido crear una imagen a todo color sólo para guardarla en un formato que no acepta más de 8 bits (por ejemplo: GIF). El formato también deberá aceptar el ser guardado estando en forma descomprimida o comprimida, utilizando técnicas con pérdida o sin ella. Debería ser abierto y bien documentado, ampliamente soportado y compatible en todas las plataformas. A pesar de que hay interés en otros formatos, como por ejemplo PNG, SPIFF, y Flashpix, la mayoría de las instituciones culturales confían en el formato TIFF para guardar sus imágenes originales. Para acceder a los gráficos se pueden crear imágenes derivadas en otros formatos.
14 Ibit preservation/tutorial-spanish/preface.html
38 COMPRESIÓN: La compresión con pérdida puede tener un marcado impacto sobre la calidad de la imagen, especialmente si el nivel de compresión es alto. En general, cuanto más enriquecido sea el archivo, tanto más eficiente y sustentable es la compresión. Por ejemplo, el escaneado bitonal de una página a 600 dpi es 4 veces más grande que una versión de 300 dpi, pero con frecuencia sólo dos veces más grande cuando se lo comprime. Cuanto más compleja sea la imagen, tanto menor será el nivel de compresión que se puede alcanzar en un estado sin pérdida o sin pérdida visual. En el caso de las fotografías, la compresión sin pérdida por lo general proporciona un índice de tamaño de archivo de alrededor de 2:1; y en el caso de compresión con pérdida superior a 10 o 20:1, el efecto puede ser evidente.
Imagen 15. Efectos de la compresión con pérdida sobre un texto.
Efectos De La Compresión Con Pérdida Sobre Un Texto: Comparación de una sección tomada de un mapa, guardada en formato GIF sin pérdida (izquierda) y JPEG con pérdida (derecha). 15
CRITERIO Y CUIDADO DEL OPERADOR: La habilidad y el cuidado de un operador de escaneado pueden afectar la calidad de la imagen tanto como las capacidades inherentes del sistema. Hemos observado el efecto del umbral en el escaneado bitonal; el criterio del operador puede minimizar la falta o el relleno de líneas. Cuando se utilizan cámaras digitales, la iluminación es una preocupación, y
15 Ibit preservation/tutorial-spanish/preface.html
39 entrarán en juego las habilidades del operador de la cámara. Se debe establecer un programa de control de calidad para verificar la consistencia de la producción.
RAZONES PARA CREAR UN ORIGINAL DIGITAL ENRIQUECIDO: Existen imperiosos motivos de preservación, acceso y económicos para crear un archivo maestro de imagen digital enriquecido (algunas veces denominado imagen para archivo) en el cual se representa toda la información importante que contiene el documento fuente.
PRESERVACIÓN: La creación de un original digital enriquecido contribuye de tres maneras diferentes, como mínimo, a la preservación:
1. Protección de originales vulnerables . El sustituto digital debe estar lo suficientemente enriquecido como para reducir o eliminar la necesidad del usuario de consultar el original. 2. Reemplazo de originales . En ciertas circunstancias, las imágenes digitales se pueden crear para reemplazar los originales o producir copias en papel o Microfilm Generado por Computadora. El reemplazo digital debe satisfacer todos los requisitos de investigación, legales y fiscales. 3. Preservación de archivos digitales . Es más fácil preservar archivos digitales cuando están capturados en forma coherente y bien documentados. El costo de este proceso se justifica más si los archivos tienen valor y funcionalidad constantes.
ACCESO: Un original digital debería responder a una variedad de necesidades de los usuarios mediante la creación de derivados para impresión, visualización y procesamiento de imágenes. Cuanto más enriquecido sea el original digital, tanto mejor serán los derivados en términos de calidad y capacidad de ser procesados. Probablemente, las expectativas del usuario serán más exigentes con el correr del
40 tiempo -el original digital debería ser lo suficientemente enriquecido como para satisfacer futuras aplicaciones. Los originales enriquecidos soportarán el desarrollo de recursos del patrimonio cultural que sean comparables y puedan aplicarse a distintas disciplinas, usuarios e instituciones.
COSTO : La creación de una imagen digital de alta calidad puede costar más al comienzo, pero será menos costosa que crear una imagen digital de baja calidad que no satisfaga requisitos a largo plazo y, como consecuencia, se necesite volver a escanear. Los costos de mano de obra asociados con la identificación, preparación, inspección, indexación y gestión de la información digital exceden ampliamente los costos del escaneado mismo.
La clave para obtener calidad de imagen no es capturar a la mayor resolución o profundidad de bits posible, sino ajustar el proceso de conversión al contenido de información del original, y escanear en ese nivel --ni más ni menos. Al hacer esto, se crea un archivo maestro que puede utilizarse en el futuro. El valor a largo plazo se debe definir por el contenido y la utilidad intelectual del archivo de imagen, sin estar limitado por decisiones técnicas tomadas en el momento de la conversión.
Imagen 16. Ni más ni menos.
Ni Más Ni Menos : A medida que aumenta la resolución se nivela la calidad de la imagen. 16
16 Ibit preservation/tutorial-spanish/preface.html
41 PATRÓN DE REFERENCIA PARA LA CAPTURA DIGITAL: Cornell aboga por una metodología para determinar los requisitos de conversión, que se basa en lo siguiente:
Evaluación de los atributos del documento (detalle, tono, color).
• Definición de las necesidades de los usuarios actuales y futuros.
• Caracterización objetiva de las variables relevantes (por ejemplo: tamaño del detalle, calidad deseada, poder de resolución del sistema).
• Correlación entre variables por medio de fórmulas.
• Confirmación de resultados por pruebas y evaluaciones.
REQUISITOS DE RESOLUCIÓN DE REFERENCIA PARA TEXTOS IMPRESOS: Cornell adoptó y perfeccionó una fórmula de Índice de Calidad (QI) para textos impresos que fue desarrollada por el Comité de normas C10 de AIIM. En esta fórmula se trasladó al mundo digital el método de índice de calidad desarrollado para las normas de preservación de microfilmación. La fórmula QI para escanear textos relaciona la calidad (QI) con el tamaño de carácter (h) en mm y la resolución (dpi). Al igual que en la norma de preservación de microfilmación, la fórmula QI digital prevé niveles de calidad de imagen: apenas legible (3,0), mínima (3,6), buena (5,0), y excelente (8,0).
Tabla 2: Conversión de valores métricos a ingleses
1 mm = 0,039 pulgadas 1 pulgada = 25,4 mm
42 La fórmula para el escaneado bitonal proporciona una generosa muestra en exceso para compensar errores de registro y reducción de calidad debido a que limita el umbral de la información a píxeles blancos y negros. 17
Fórmula QI bitonal para textos impresos QI = (dpi x 0,039h)/3 h = 3QI/0,039dpi dpi = 3QI/0,039h
Nota: si el valor de h está expresado en pulgadas, omita 0,039.
Imagen 17. Requisitos de resolución para textos impresos.
Requisitos De Resolución Para Textos Impresos: Comparación entre letras escaneadas con diferentes resoluciones. 18
Algunos textos escritos requerirán escaneado en escala de grises o a color por los siguientes motivos:
17 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006 18 Ibit preservation/tutorial-spanish/preface.html
43 • Las páginas están muy manchadas
• El papel se ha oscurecido al punto de que es difícil limitar la información a píxeles puramente blancos y negros
• Las páginas contienen gráficos complejos o información contextual importante (por ejemplo: grabados en relieve, anotaciones)
• Las páginas contienen información de color (por ejemplo: tintas de diferentes colores).
Imagen 18. Comparación de escaneo bitonal y escaneo con escala.
Compare el escaneado bitonal (izquierda) y el escaneado con escala de grises (derecha) de una página de texto manchada. 19
Debido a que las imágenes de tonos sutilmente "llevan a gris" los píxeles que están sólo parcialmente en un trazo, se creó una fórmula distinta para el escaneado de texto impreso a escala de grises o color.
19 Ibit preservation/tutorial-spanish/preface.html
44 Fórmula QI de escala de grises o color para textos impresos: QI = (dpi x 0,039h)/2
h = 2QI/0,039dpi
dpi = 2QI/0,039h
Nota: si el valor de h está expresado en pulgadas, omita 0,039.
REQUISITOS DE RESOLUCIÓN DE REFERENCIA BASADOS EN EL ANCHO DEL TRAZO: El método QI fue diseñado para texto impreso en el cual la altura de la letra representa la medida del detalle. Los manuscritos y otro tipo de materiales que no son de texto, y que representan gráficos basados en bordes definidos, como por ejemplo mapas, bosquejos y grabados, no ofrecen una métrica fija equivalente. Para tales documentos, una mejor representación del detalle sería el ancho de la línea, el trazo o la marca más fina que deba ser capturada en el sustituto digital. Para representar totalmente ese tipo de detalle, por lo menos deberían cubrirlo dos píxeles. Por ejemplo, un original con un trazo que mida 1/100 pulgadas debe ser escaneado con una resolución de por lo menos 200 dpi para resolver completamente su característica más fina. Para el escaneado bitonal, este requisito sería mayor (digamos, por ejemplo, 3 píxeles por característica) debido a la posibilidad de errores de las muestras y la limitación del umbral a píxeles blancos y negros. Con frecuencia, se puede detectar una característica en resoluciones inferiores, alrededor de 1 píxel por característica, pero entran en juego los criterios respecto de la calidad.
45 Imagen 19. Trazo.
Trazo: Contorno de la nube representada en forma adecuada (izquierda) y línea de borde representada de manera inadecuada (derecha). 20
Cornell desarrolló la siguiente correlación entre la calidad de la imagen percibida y la cobertura de píxeles:
Tabla 3. Índice de calidad para representación del trazo
QI Evaluación de calidad 2 Excelente 1,5 Buena 1 cuestionable, confirme la calidad en la pantalla <1 entre mala e inaceptable
20 Ibit preservation/tutorial-spanish/preface.html
46 Fórmula QI de escala de grises/ color para el trazo
dpi = QI/0,039w
Esta fórmula establece una correlación entre QI, dpi y el ancho de trazo (w) determinado en mm. En este caso, QI se basa en la evaluación de calidad anterior, que se correlaciona con la cantidad de píxeles que cubren el trazo (por ejemplo: 2 = excelente). Nota: si el valor de w está expresado en pulgadas, omita el 0,039.
Para el escaneado bitonal, la fórmula se ajusta para compensar la pérdida de características en el proceso de umbral:
Fórmula QI bitonal para el trazo dpi=1,5QI/0,039w
Muchos elementos comprendidos en esta categoría exhiben características que van más allá de una simple representación con base de bordes, y la resolución no será el único factor determinante de la calidad de la imagen. Por ejemplo, una cantidad de instituciones han recomendado escanear todos los manuscritos con escala de grises o a color.
REQUISITOS DE RESOLUCIÓN DE REFERENCIA PARA DOCUMENTOS DE TONO CONTINUO : Los requisitos de resolución para fotografías y otros documentos de tono continuo son difíciles de determinar ya que no hay una métrica fija evidente para medir el detalle. Los detalles se pueden definir como partes de escala relativamente pequeña en un documento, pero esta valoración también puede ser muy subjetiva. Podríamos estar de acuerdo en que los letreros de la calle, visibles al ser ampliado un paisaje urbano, deberían aparecer claramente, pero ¿qué decidir sobre los cabellos o poros individuales en un
47 retrato? En el nivel granular, el medio fotográfico se caracteriza por grupos aleatorios de tamaño y forma irregular, que pueden prácticamente no tener sentido o ser difíciles de distinguir del ruido del fondo. Muchas instituciones han evitado el problema de determinar detalles basando sus requisitos de resolución en la calidad que se puede obtener en impresiones generadas en determinado tamaño (por ejemplo: 8 x 10 pulgadas) en cierto formato de película (por ejemplo: 35 mm, 4 x 5 pulgadas). Lo importante para recordar acerca de los documentos de tono continuo es que la reproducción del tono y del color es tan importante como la resolución, si no más, al determinar la calidad de la imagen. 21
Imagen 20. Efecto de la resolución en documentos de tono continuo.
Efecto De La Resolución En Documentos De Tono Continuo : El nombre de la embarcación (Grace) se puede leer en la imagen de la izquierda, que fue escaneada a una resolución superior. 22
21 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006 22 Ibit preservation/tutorial-spanish/preface.html
48 REQUISITOS DE RESOLUCIÓN DE REFERENCIA PARA MEDIAS TINTAS: Las medias tintas son particularmente difíciles de capturar en forma digital, ya que la plantilla de la media tinta y la cuadrícula de la imagen digital con frecuencia entran en conflicto, lo que genera imágenes distorsionadas con diseños de muaré (por ejemplo: diseños ondulados). A pesar de que muchos escáneres han desarrollado características de media tinta especiales, una de las maneras más sistemáticas de escanear es en escala de grises con una resolución cuatro veces la norma de la cuadrícula de la media tinta. Para materiales de alta calidad, como reproducciones de obras de arte, este requisito tendrá como resultado altas resoluciones (del orden de los 700-800 dpi). Para la mayoría de las medias tintas, una captura de 400 dpi y 8 bits posiblemente sea suficiente. Cornell no percibió ningún efecto muaré evidente al escanear una cantidad de medias tintas del siglo 19 y principios del siglo 20 con esa resolución. Las resoluciones inferiores pueden utilizarse cuando se emplea un escaneado con tratamiento especial. La Biblioteca del Congreso (Library of Congress) ha identificado cuatro métodos distintos para digitalizar imágenes de documentos a media tinta. Acerca de las imágenes de las ilustraciones de libros donde encontrará un análisis sobre tratamientos de media tinta.
49 Imagen 21. Efecto de la resolución en documentos a media tinta.
Efecto De La Resolución En Documentos A Media Tinta: La imagen superior fue escaneada a 150 dpi, una resolución que se opone a la norma de la plantilla de media tinta de 85 lpi. La imagen inferior se escaneó a 400 dpi y se la escaló para su comparación. 23
METODOLOGÍA PROPUESTA PARA DETERMINAR LOS REQUISITOS DE CONVERSIÓN: En Moving Theory into Practice: Digital Imaging for Libraries and Archives (Llevando la Teoría a la Práctica: Digitalización de Imágenes para Bibliotecas y Archivos), se propone una metodología para determinar los requisitos de conversión para una variedad de recursos del patrimonio cultural, incluidos textos impresos, manuscritos, obras de arte en papel y fotografías. Esta metodología se basa en los siguientes pasos:
23 Ibit preservation/tutorial-spanish/preface.html
50 • evaluación del documento y caracterización del objetivo;
• conversión a equivalencias digitales;
• asignación de valores de tolerancia para aprobación / falla;
• calibración del sistema y prueba de rendimiento;
• evaluación de la imagen a través de control visual y análisis de software;
• registro de documentación técnica.
6.2.3 CONTROL DE CALIDAD
DEFINICIÓN: El control de calidad (QC = quality control ) es un componente esencial de un programa de digitalización de imágenes, y tiene como fin asegurar que se han cumplido las expectativas en cuanto a calidad. El mismo abarca procedimientos y técnicas para verificar la calidad, precisión y consistencia de los productos digitales. Las estrategias de control de calidad pueden ser implementadas en diferentes niveles:
Evaluación inicial: Se utiliza un subconjunto de documentos (a ser convertidos en la empresa o por un proveedor de servicios) para verificar que las decisiones técnicas tomadas durante la evaluación de referencia son las apropiadas. Esta evaluación ocurre con anterioridad a la implementación del proyecto.
Evaluación continuada: El mismo proceso de garantía de calidad utilizado para confirmar las decisiones de la evaluación de referencia puede ser ampliado y extendido a la totalidad de la colección para asegurar la calidad de todo el programa de digitalización de imágenes. 24
24 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006
51 DESARROLLO DE UN PROGRAMA DE CONTROL DE CALIDAD: Los siguientes pasos resumen los puntos principales de un programa de control de calidad. En Moving Theory into Practice: Digital Imaging for Libraries and Archives (Llevando la Teoría a la Práctica: Digitalización de Imágenes para Bibliotecas y Archivos) .
1. Identifique sus productos
El primer paso es identificar claramente los productos a ser evaluados. Los mismos pueden incluir imágenes originales y derivadas, impresiones, bases de datos de imágenes, y metadatos complementarios, incluyendo texto convertido y archivos marcados.
2. Desarrolle un enfoque sistemático
Para medir la calidad y juzgar si los productos son satisfactorios o no, defina claramente las características de base para los productos digitales "aceptables" e "inaceptables".
3. Determine un punto de referencia
¿Con qué está comparando las imágenes al juzgarlas? No siempre es sencillo responder esta pregunta. Por ejemplo, si la conversión está basada en un intermedio, la imagen digital se encuentra a dos "generaciones" de distancia respecto del original. La misma ha sido copiada a película (primera generación), la cual posteriormente es escaneada (segunda generación). ¿Cuál debería ser el punto de referencia al valorar una imagen de tales características, el documento original o la transparencia? La inspección de calidad de la imagen, ¿estará centrada en el original o en el derivado (o en ambos)?
52 4. Defina el alcance y los métodos
Determine el alcance de su revisión de calidad. ¿Inspeccionará todas las imágenes, o solamente un subconjunto de prueba (por ejemplo el 20%)?
Describa su metodología y defina el modo en que se realizarán los juicios sobre calidad. Por ejemplo, ¿evaluará las imágenes en forma visual a una ampliación del 100% (1:1) en la pantalla y las comparará con los documentos originales? ¿O su evaluación estará basada sólo en una valoración subjetiva de las imágenes en la pantalla, sin remitirse a los originales?
5. Controle el entorno del control de calidad
Por lo general se subestima el impacto que producen las condiciones de visualización de imagen sobre la percepción de la calidad. En un entorno inadecuado, incluso una imagen de alta calidad puede ser percibida como no satisfactoria. Por ejemplo, una imagen a color de 24 bits puede verse "posterizada" en exceso cuando se la ve utilizando una computadora configurada de manera incorrecta, que no puede proporcionar una paleta de colores completa. Se proporciona mayor información sobre cómo controlar el entorno en el que se visualiza la imagen en Using Kodak Photo CD Technology for Preservation and Access (Uso de la Tecnología Kodak Photo CD para la Preservación y el Acceso).
53 Imagen 22. Entorno del control de calidad.
Entorno Del Control De Calidad : Evaluación de la calidad de imagen realizada en un entorno controlado. Cortesía del William Blake Archive (Archivo William Blake). 25
FACTORES QUE AFECTAN LA CALIDAD DE LA IMAGEN EN LA PANTALLA: CONFIGURACIÓN DEL HARDWARE: Es difícil recomendar una configuración de hardware ideal. La regla general es armar un sistema que pueda satisfacer sus necesidades de velocidad, memoria, almacenamiento y calidad de presentación. ¿Qué clase de imágenes se están creando? ¿Qué cantidad? ¿Con qué fines? ¿Qué nivel de revisión en pantalla se necesita? Necesitará una computadora rápida y confiable con una amplia capacidad de procesamiento y memoria para poder recuperar y manipular los grandes archivos que está creando, especialmente al crear imágenes en color. Vea también: Technical Infrastructure: Image Creation (Infraestructura Técnica: Creación de Imágenes).
SOFTWARE DE RECUPERACIÓN DE IMÁGENES : Utilice un software de recuperación apropiado para sus imágenes. Por ejemplo, si usted está evaluando imágenes creadas y almacenadas en formato ImagePac de Kodak, recupérelas
25 Ibit preservation/tutorial-spanish/preface.html
54 utilizando uno de los programas de visualización gratuitos (freeware) y compartidos (shareware) disponibles en la Web que soportan el espacio de formato y de color. Cornell utilizó Adobe Photoshop con la conexión (plug-in) Kodak Photo CD Acquire Module (Módulo de Adquisición de Kodak Photo CD) para asegurar un correcto trazado de los colores de Photo CD. Se proporciona mayor información en Using Kodak Photo CD Technology for Preservation and Access (Uso de la Tecnología Kodak Photo CD para la Preservación y el Acceso).
CONDICIONES DE VISUALIZACIÓN: Controle su entorno de visualización. Debe comprender que el monitor y el documento fuente requieren condiciones de visualización diferentes. Se podrá visualizar mejor el original en un ambiente con mucha luz, y el monitor trabaja mejor en un medio con poca luz. Sin embargo, un entorno con poca luz no se equipara a un cuarto oscuro. Vista en la oscuridad, una imagen en pantalla parecería carecer de suficiente contraste. 26
CARACTERÍSTICAS HUMANA: La evaluación de la calidad de la imagen requiere sofisticación visual, especialmente para las evaluaciones subjetivas. Idealmente, la misma persona debe evaluar todas las imágenes, con el mismo equipo y bajo los mismos parámetros. El personal debe ser entrenado en particular en lo que se refiere a cómo transmitir en forma efectiva la información sobre la apariencia del color. Algunas deficiencias de visión del color están relacionadas con un gen recesivo defectuoso en el cromosoma X. Siendo que las mujeres tienen dos cromosomas X y los hombres uno, la probabilidad de tener visión del color defectuosa es de 1 en 250 para las mujeres, y de 1 en 12 para los hombres. Aún entre personal experto en evaluaciones visuales, no es raro que se presenten diferencias en los resultados que se deban a variaciones normales del ojo humano. Se puede utilizar una buena prueba de visión del color para evaluar la visión de un individuo.
26 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006
55 CALIBRACIÓN DEL MONITOR: Las imágenes pueden aparecer de manera diferente en los distintos monitores. La calibración es el proceso de ajuste de la configuración de la conversión de color del monitor a un nivel estándar, por esto la imagen se presenta de igual manera en diferentes monitores. El método ideal es utilizar hardware de calibración de monitor y el software adjunto. Sin embargo, si usted no tiene acceso a estos recursos, utilice las herramientas de calibración de sus programas de aplicación. Por ejemplo, Adobe Photoshop incluye una herramienta de calibración de monitor básica, que puede ser utilizada para eliminar tonalidades de color y estandarizar la presentación de las imágenes.
GESTIÓN DE COLOR: Uno de los principales desafíos en la digitalización de documentos a color es mantener la apariencia y consistencia del color en toda la cadena de digitalización, incluyendo el escaneado, la visualización, e impresión. La reproducción precisa de los colores es difícil debido a que los dispositivos de entrada y los de salida tratan a los colores de manera diferente. El objetivo del software de sistema de gestión de color (CMS) es asegurar que los colores del original coincidan con la mayor precisión posible con la reproducción digital en la pantalla o impresa.
6. Evalúe el rendimiento del sistema
Sin importar si la conversión se realiza en la empresa o si se la terceriza, debería evaluarse el rendimiento del sistema para asegurar consistencia a lo largo del proceso de conversión. Entre las características a evaluar se encuentran la resolución, linealidad, brillo, ruido del escáner, reproducción del color, y diversos artefactos. Varias publicaciones mencionadas al final de esta sección, proporcionan mayor información sobre calibración del sistema.
56 7. Codifique sus procedimientos de inspección
Los datos de control de calidad poseen un valor a largo plazo, desde el respaldo de diferentes etapas de la inspección de calidad hasta la facilitación de la manipulación y migración futuras. Para los componentes del control de calidad dentro de la empresa, recomendamos detallar los procedimientos de inspección en un manual breve (o en una serie de formularios de trabajo) a ser utilizado para entrenamiento y para facilitar el flujo de trabajo. Los temas que deben tratarse incluyen: procedimientos de control de calidad; personal involucrado y habilidades requeridas; necesidad de instrumentos, hardware y software; rechazo y reemplazo de productos inaceptables. La Biblioteca del Congreso muestra un ejemplo de este enfoque en su Internal Training Guide (Guía de Entrenamiento Interna).
VALORACIÓN DE LA CALIDAD DE LA IMAGEN: Los factores claves en la valoración de la calidad de la imagen son la resolución, el color y el tono, y la apariencia general.
RESOLUCIÓN: La resolución es el factor clave en la determinación de la calidad de imagen de materiales de texto y otras representaciones con base de bordes definidas. Para los materiales gráficos, especialmente imágenes de tono continuo, la profundidad de bits, la representación del color, y el rango dinámico, se combinan con la resolución para determinar la calidad. Los atributos de la resolución que deben ser inspeccionados son la legibilidad, integridad, oscuridad, contraste, nitidez, y uniformidad. La medición y evaluación de cada trazo y detalle son útiles para valorar la calidad de la imagen. Para valorar la resolución, siga el Método de Medición de Calidad en Desarrollo (vea las lecturas complementarias).
57 Imagen 23. Efectos de la resolución sobre la calidad de la imagen.
100 dpi 300dpi 600dpi
Efectos De La Resolución Sobre La Calidad De La Imagen : Compare la calidad de estas tres imágenes bitonales de un grabado en madera capturado en distintas resoluciones. 27
27 Ibit preservation/tutorial-spanish/preface.html
58 6.2.4 METADATOS
El término metadatos describe varios atributos de los objetos de información y les otorga significado, contexto y organización. La teoría y la práctica descriptiva de los metadatos es un área familiar para muchos, dado que sus raíces están arraigadas en la catalogación de publicaciones impresas. En el mundo digital, han aparecido categorías de metadatos adicionales para sustentar la navegación y la gestión de archivos. 28
TIPOS DE METADATOS Y SUS FUNCIONES: Con fines prácticos, los tipos y funciones de los metadatos pueden clasificarse en tres amplias categorías: descriptivos, estructurales y administrativos. Estas categorías no siempre tienen límites bien definidos y con frecuencia presentan un significativo nivel de superposición. Por ejemplo, los metadatos administrativos pueden incluir una amplia gama de información que podría ser considerada como metadatos descriptivos y estructurales.
28 http://www.library.cornell.edu/preservation/tutorial-spanish/metadata/metadata-01.html 19 Agosto 2006 3:00PM
59 Tabla 4. Tipo de Metadatos ELEMENTOS DE IMPLEMENTACIONES DE TIPO OBJETIVO MUESTRA MUESTRA Metadatos Descripción e identificadores únicos Handle; descriptivos identificación de (PURL, Handle); PURL (Persistent Uniform recursos de información Resource Locator - en el nivel (sistema) atributos físicos Localizador de Recursos local para permitir la (medios, condición de Uniforme y Continuo); búsqueda y la las dimensiones); Dublin Core; recuperación (por MARC; ejemplo, búsqueda de Meta Rótulos HTML (HTML Atributos bibliográficos una colección de Meta Tags). (título, autor/ creador, imágenes para idioma, palabras encontrar pinturas con clavess). Vocabularios controlados, ilustraciones de como por ejemplo: animales); en el nivel Tesauro sobre Arte y Web, permite a los Arquitectura; usuarios descubrir Categorías para la recursos (por ejemplo, Descripción de Obras de búsqueda en la Web Arte. para encontrar colecciones digitalizadas sobre programación). Metadatos Facilitan la navegación y Rótulos de SGML; estructurales presentación de estructuración como por XML; recursos electrónicos. ejemplo página de Encoded Archival título, tabla de Description, EAD Proporcionan contenidos, capítulos, (Descripción de Archivo información sobre la partes, fe de erratas, Codificado); estructura interna de los índice, relación con un recursos, incluyendo sub-objeto (por página, sección, ejemplo, fotografía de capítulo, numeración, un periódico). índices, y tabla de contenidos;
Describen la relación entre los materiales (por ejemplo, la fotografía B fue incluida en el manuscrito A);
Unen los archivos y los textos relacionados (por ejemplo, el ArchivoA es el formato JPEG de la imagen de archivo del ArchivoB). Metadatos Facilitan la gestión y Datos técnicos tales National Library of Australia, administrativos procesamiento de las como tipo y modelo de Preservation Metadata for colecciones digitales escáner, resolución, Digital Collections (Biblioteca tanto a corto como a profundidad de bit, Nacional de Australia, largo plazo espacio de color, Metadatos de Preservación formato de archivo, para Colecciones Digitales). Incluyen datos técnicos compresión, fuente de sobre la creación y el luz, propietario, fecha control de calidad. del registro de derecho de autor, limitaciones en cuanto al copiado y Incluyen gestión de distribución, derechos y requisitos de información sobre control de acceso y utilización. licencia, actividades de preservación (ciclos de actualización, Información sobre migración, etc.). acción de preservación.
60 CREACIÓN DE METADATOS: La creación y la implementación de metadatos son procesos intensivos en cuanto a la utilización de recursos. Para ello se debe equilibrar los costos y los beneficios de desarrollar una estrategia de metadatos, tomando en cuenta las necesidades de los usuarios y de los gerentes de colección presentes y futuros. Identifique los requisitos de los metadatos al inicio de un proyecto de digitalización de imágenes. Estos requisitos deberían estar estrechamente conectados con funciones que deben ser sustentadas (por ejemplo: gestión de derechos, descubrimiento de recursos y cuidado a largo plazo).
Considere los siguientes temas:
A pesar de que algunos elementos de los metadatos son estáticos (por ejemplo: fecha de creación, resolución del escaneado), algunos campos (por ejemplo: información sobre migración) pueden continuar evolucionando y requerir actualización y mantenimiento constantes. La creación y gestión de metadatos se logra mediante técnicas manuales y automatizadas. De manera similar, el control de calidad de los metadatos se basará en una combinación de procesos manuales y automatizados (utilización de un analizador SGML - lenguaje estándar generalizado de señalamiento - para validar los rótulos). Los metadatos pueden ser registrados en forma interna (asignación de nombre de archivo, estructuración de directorio, encabezados de archivos, reconocimiento óptico de caracteres [OCR], SGML) o en forma externa (índices y bases de datos externos). El factor claves en la toma de decisiones a este respecto, es evaluar si la ubicación soporta o no la gestión de funcionalidad y recursos. Existen varias normas en desarrollo para facilitar la interoperabilidad entre diferentes esquemas de metadatos.
61 El Resource Description Framework, RDF (Marco de Descripción de Recurso) es una aplicación con base XML para proporcionar una arquitectura flexible para la gestión de diversos metadatos en el ambiente de las redes. El objetivo de la iniciativa Metadata for Digital Images (Metadatos para Digitalización de Imágenes) del Digital Imaging Group (Grupo de Digitalización de Imágenes) es definir un conjunto estándar de metadatos que mejorará la interoperabilidad entre dispositivos, servicios y software, por ende facilitando el procesamiento, la organización, impresión e intercambio de imágenes digitales. La iniciativa del MPEG-7 ( Moving Picture Experts Group - Grupo de Expertos en Imágenes con Movimiento) apunta a la descripción de contenidos audiovisuales y pretende estandarizar un conjunto de esquemas de descripción y descriptores, un idioma para especificar esquemas de descripción, y un esquema para codificar la descripción. La interoperabilidad del proyecto Data in E- Commerce Systems.
6.2.5 INFRAESTRUCTURA TÉCNICA
La infraestructura técnica se refiere en forma general a los componentes que hacen posible la digitalización de imágenes. Con frecuencia, al proceso completo se lo denomina cadena de digitalización, sugiriendo así una serie de pasos lógicamente ordenados. En la práctica real, la cadena de digitalización puede tener ramificaciones laterales, curvas, y pasos recurrentes, pero sólo por hacer las cosas más simples, la presentamos como si fuese lineal.
LA CADENA DE DIGITALIZACIÓN: La tecnología necesaria para navegar desde un extremo de la cadena de digitalización al otro consta principalmente de: hardware, software y redes. Éstos son el centro de esta sección. Una perspectiva integral de la infraestructura técnica también incluye protocolos y normas, políticas y procedimientos (para el flujo de trabajo, mantenimiento, seguridad,
62 actualizaciones, etc.) y los niveles de habilidad y responsabilidades del trabajo del personal de una organización.
Sin embargo, ni siquiera los aspectos básicos de la infraestructura técnica se pueden evaluar en forma completamente aislada. Las acciones y consideraciones relacionadas que afectarán las decisiones respecto de la infraestructura técnica incluyen:
• Determinación de los requisitos de calidad basándose en los atributos de los documentos (Patrón de referencia).
• Valoración de las virtudes y defectos institucionales, los horarios y el presupuesto (Gestión).
• Comprensión de las necesidades del usuario (Presentación).
• Valoración de planes a largo plazo (Preservación digital).
Las decisiones en lo que respecta a la infraestructura técnica requieren una planificación cuidadosa debido a que la tecnología de la digitalización de imágenes cambia rápidamente. El mejor modo de minimizar el impacto de la depreciación y la obsolescencia es a través de la evaluación cuidadosa, y evitando las soluciones únicas y patentadas. Si los equipos elegidos son los indicados para los usos previstos y los resultados esperados, y están sincronizados con horarios realistas, el rendimiento de las inversiones se maximizará. 29
29 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006
63 Imagen 24. Cadena de digitalización
TRES COMPONENTES FUNDAMENTALES : La cadena de digitalización y la infraestructura técnica que la sostiene se dividen en tres componentes fundamentales: creación, gestión y entrega. 30
La Creación de imágenes se ocupa de la captura o conversión inicial de un documento u objeto a la forma digital, por lo general con un escáner o cámara digital. A la imagen inicial se le pueden aplicar uno o más pasos de procesamiento de archivo o de imagen, que pueden alterar, agregar o extraer datos. Las clases generales de procesamiento incluyen la edición de la imagen (escalarla, comprimirla, otorgarle nitidez, etc.) y la creación de metadatos.
La Gestión de archivos se refiere a la organización, almacenamiento y mantenimiento de imágenes y metadatos relacionados.
30 Ibit preservation/tutorial-spanish/preface.html
64 La Entrega de la imagen comprende el proceso de hacer llegar las imágenes al usuario y abarca redes, dispositivos de visualización e impresoras. Los temas relacionados con la creación de imágenes derivadas se tratan en Presentación.
INTEGRACIÓN DEL SISTEMA: CONEXIÓN DE LA CADENA:
Recomendaciones y advertencias fundamentales sobre políticas de la infraestructura técnica:
1) Considere utilizar un integrador de sistemas que pueda garantizar que todos los componentes interoperan entre sí sin dificultad. Si decide hacer toda la selección de componentes usted mismo, mantenga la cantidad de dispositivos al mínimo.
2) Elija productos que cumplan con las normas y que tengan una amplia aceptación en el mercado y un fuerte apoyo por parte del proveedor.
3) Sin importar todos sus mejores esfuerzos, algunas cosas saldrán mal, así que prepárese para los dolores de cabeza. Al contrario de lo que se afirma, el "plug and play" (enchufe y opere) no siempre funciona. Los componentes de la digitalización de imágenes algunas veces deben ser adaptados de maneras creativas para el uso por parte de bibliotecas / archivos.
4) No escatime - pagará más a la larga. Si usted piensa comprometerse seriamente con la digitalización de imágenes, compre calidad e incluya en el presupuesto, en forma periódica, dinero para actualizaciones y reemplazos. El esperar hasta quedar estancado con equipos o formatos de archivo obsoletos y no compatibles puede acarrearle problemas de pérdida de tiempo y dinero.
5) Haga participar al personal técnico en las discusiones de planeamiento desde el comienzo y con frecuencia. Por mucho que se desee creer que es
65 lineal, la cadena de digitalización es en realidad una forma compleja que se repliega sobre sí misma en muchas partes. El personal técnico puede ayudar a identificar los eslabones débiles que resultan de las interdependencias de los varios pasos del proceso.
ENTREGA: La entrega comprende los procesos de hacer llegar las imágenes digitales y los archivos auxiliares a sus usuarios. Los componentes más importantes son redes y dispositivos de visualización (principalmente monitores e impresoras). Esta es la etapa de la cadena en la cual conocer a sus usuarios se vuelve al menos tan importante como conocer sus documentos.
A menos que sus imágenes digitales sean estrictamente para uso dentro de la empresa, algunos componentes de la entrega están fuera de su control. Por ejemplo, si la mayoría de los usuarios están conectados a Internet con módems de 56Kbps, una colección de preciosas imágenes a color de 24 bits, con un tamaño promedio de 500KB y en la cual cada una de ellas tarda más de dos minutos en bajar, frustrará a los usuarios.
La entrega exitosa a una audiencia combinada de usuarios dentro de la empresa y fuera de la misma requerirá una cuidadosa planificación realizada con anterioridad. Si los recursos lo permiten, el mejor acercamiento es ofrecer múltiples versiones de imágenes, aprovechando la capacidad superior cuando exista, pero también soportando las conexiones de ancho de banda bajo con imágenes de calidad inferior. Tenga cuidado con el enfoque del "común denominador más bajo", que puede parecer igualitario, pero en última instancia priva a los usuarios con mejores equipos del valor potencial de sus imágenes.
Las decisiones acerca de los formatos de archivo, las relaciones de compresión, y la aplicación de escalas tendrán un impacto sobre la entrega. La sección Presentación trata todos estos temas. Los formatos de archivos nuevos y
66 emergentes ofrecen capacidad de resolución múltiple, proporcionando una alternativa para la creación de versiones múltiples de la misma imagen
REDES : Las redes son probablemente la parte menos visible de la infraestructura técnica. Las tarjetas de red están escondidas dentro de las computadoras; el hardware de redes se guarda en cuartos de máquinas o "gabinetes" de comunicaciones; y los cables se ocultan bajo tierra, en las paredes y / o van en forma aérea. Pero nada puede detener una iniciativa de digitalización de imágenes de manera más rápida que una red de un tamaño más pequeño de lo necesario, demasiado lenta o no confiable. Ya hemos mencionado la necesidad de redes veloces y confiables para poder transportar los archivos durante la creación y gestión de archivos. Una colección de imágenes digitales muy utilizada ejercerá una mayor exigencia sobre su red.
Las decisiones respecto de la infraestructura de redes por lo general se toman en el nivel institucional. Las grandes instituciones anticipan el crecimiento de las necesidades generales de redes y están preparadas para manipular volúmenes significativos de tráfico en la red. Las pequeñas instituciones podrían descubrir que una iniciativa de digitalización de imágenes impone exigencias a una red existente, las cuales tienen implicaciones para toda la organización. Incluso la limitación del uso de ciertas redes de gran intensidad a horarios tradicionales de poco tráfico puede interferir con otras actividades. Al comienzo de la etapa de planificación se debería discutir con los administradores de redes acerca de las demandas de las redes que se proyectan.
Una organización que ha utilizado su red principalmente para el e-mail y en parte para la navegación en la Web puede descubrir que su conexión a Internet es completamente inadecuada para ofrecer grandes volúmenes de imágenes digitales. La mayoría de las conexiones a Internet son asimétricas, permitiendo
67 que más datos pasen hacia el usuario (desde Internet) que hacia la red (hacia Internet). Una conexión de Internet que permite que grandes volúmenes de datos pasen hacia la red puede ser muy costosa. Nuevamente, necesita consultar a los administradores de redes y a su proveedor de Internet si usted anticipa una demanda significativa en el tráfico en la red.
REDES: INQUIETUDES CLAVES:
La Compatibilidad todavía puede ser un problema en algunas instituciones. A pesar de que el protocolo de comunicaciones de Internet TCP/IP (Protocolo de Control de Transmisión / Protocolo de Internet) se ha vuelto indispensable, en algunas instituciones todavía se utilizan protocolos heredados. Verifique con administradores de red para asegurarse de que sus planes son compatibles con la red existente.
La Fiabilidad es otra inquietud. Los cortes de la red reducen la productividad y frustran a los usuarios. A pesar de que la fiabilidad del hardware de red ha mejorado en los últimos años, todavía ocurren fallas. Algunas redes más antiguas han "crecido como locas" y son una mezcla de diferentes tecnologías, cableados y hardware. La responsabilidad dividida de la administración de la red también debilita la fiabilidad.
La Seguridad de Internet es una preocupación creciente (vea, por ejemplo: Estadísticas de CERT) para obtener un resumen de las tendencias. Los servidores de imágenes están sujetos a violaciones a la seguridad, haciendo peligrar potencialmente el acceso a los usuarios autorizados, o dejando a los datos vulnerables ante una posible eliminación o modificación realizada en forma intencional. Los administradores de sistemas y de redes pueden proponer remedios tales como firewalls (cortafuegos), software de control especial, o el requisito de autenticación de todos los usuarios. Algunas medidas de seguridad
68 pueden ser onerosas, ya sea porque requieren personal especializado para mantenerlas o porque restringen el acceso a sus materiales más de lo que usted quisiera. Una política institucional puede limitar las posibilidades que usted tiene, pero puede familiarizarlo con dichas opciones.
El Gasto puede o no ser un asunto significativo. En algunas instituciones, usted simplemente conectará su equipo a las redes existentes y estará en camino. Pero si su tarea requiere una actualización fundamental de la red o un nuevo tipo de conexión a Internet, el gasto puede ser muy importante. La claves es probar, y puede ser necesario que tenga que retroceder y ajustar sus planes a algo que pueda realizarse dentro de la infraestructura existente.
REDES: VELOCIDAD: Los asuntos de velocidad y de capacidad están determinados por una cantidad de factores. Algunos están dentro de su control, otros no. Al igual que respecto de tantos otros asuntos de rendimiento, el evitar los cuellos de botella es un objetivo importante. La transmisión por red está regulada por el enlace más lento. Los factores que afectan la entrega por red incluyen:
• Capacidad de transporte (ancho de banda) de la red de área local.
• Ancho de banda de la conexión a Internet de la institución
• Velocidad y capacidad del servidor de red
• Tasa de velocidad de lectura y transferencia de datos de los dispositivos de almacenamiento
• Tamaño de archivo de imagen
• Demanda de usuarios en un momento dado
• Cantidad de tráfico que compita en la red (en todos los niveles de red)
• Velocidad de cualquier paso del procesamiento "a las carreras"
• Tiempo requerido para autenticación y otros chequeos de seguridad
• Capacidades de la computadora del usuario final, incluyendo:
69 o Velocidad de la CPU o Cacheo (caching) de Ram / disco o Rendimiento del subsistema de video o Velocidad de la conexión a Internet.
Existe una variedad de tecnologías de redes que se pueden encontrar entre un servidor de imágenes y el receptor final. La siguiente tabla presenta algunas de las más importantes, en orden descendiente respecto de la velocidad, medida en MB por segundo.
Tabla 5: Velocidades de transferencia de datos en la red
Tipo de Red Velocidad en MB/seg. OC-192 1250 OC-48 (Red de banda ancha Abilene) 300 1000BaseT Ethernet 125 vBNS (Red de banda ancha NSF/MCI) 77,8 FDDI 12,5 Ethernet 100BaseT 12,5 DS-3 (T-3) 5,6 Ethernet 10BaseT 1,25 Cable módem (hacia el usuario) 0,2-0,5 ADSL (hacia el usuario) 0,19 -1 DS-1 (T-1) 0,19 ISDN (uso residencial) 0,018 Módem v.90 0,007
70 Las más rápidas de estas redes sólo se utilizan para las redes de banda ancha de Internet más importantes. El nivel que le sigue son redes de área local, mientras que las más lentas son servicios para el consumidor. Las velocidades presentadas son máximos teóricos, que rara vez se encuentran en las instalaciones verdaderas, si llegaran a encontrarse. Observe que la red más rápida es casi 175.000 veces más rápida que la más lenta.
Una vez que uno sabe la velocidad de transmisión de una red es posible calcular el tiempo aproximado que le tomará atravesarla a un archivo de cualquier tamaño en particular. Utilice esta fórmula:
Fórmula de velocidad de transmisión t (tiempo en segundos) = cantidad de megabytes en el archivo ÷ (velocidad de transmisión (en MB/seg) x 0,8)
REDES: TENDENCIAS: Los esfuerzos continúan aumentando el rendimiento de las redes. Una estrategia es aumentar la velocidad en las redes existentes a través de nuevas formas de compresión o presentación. Sin embargo, la necesidad de reducir el tamaño de archivo para aumentar la velocidad de la entrega puede ser un asunto de tiempo limitado dado que los conductos de información de banda ancha y las capacidades de transferencia de datos a altas velocidades en forma inalámbrica se desarrollarán ampliamente durante los próximos 5-10 años para respaldar la investigación, comercio electrónico y el entretenimiento. La creciente utilización de servicios de cable módem y DSL para uso residencial facilitará las inquietudes acerca del ancho de banda en el extremo del usuario. El potencial de la televisión digital, en especial la Televisión de Alta Definición (HDTV), para proporcionar nuevos y diferentes tipos de información a una gran gama de usuarios -incluyendo el acceso a recursos culturales digitalizados- es tentador. Las normas actuales de la Comisión Federal de Comunicaciones de los Estados Unidos (FCC) exigen que todas las emisiones
71 analógicas se retiren paulatinamente hasta fines del año 2006. Comenzando con Internet 2, el gobierno de los Estados Unidos está financiando esfuerzos para construir la Internet de la Próxima Generación (NGI) para unir los laboratorios de investigación y las universidades a redes de alta velocidad que son entre 100 a 1000 veces más rápidas que la Internet actual. Diseñada para manejar grandes volúmenes de información, la NGI facilitará el acceso a las imágenes digitales, y volverá práctico el audio de alta calidad y la transferencia de imágenes en movimiento.
CONSIDERACIONES DE LA COMPUTADORA: Ya se han mencionado la mayoría de los requisitos para un servidor de redes. Tales máquinas son muy ávidas de recursos, en especial si se las usa demasiado. El mantener un servidor a punto en forma óptima requiere la presencia de un administrador de sistemas capacitado. Quizás el mejor consejo es no escatimar en personal para manejar las redes y los servidores.
6.2.6 PRESENTACIÓN
La utilización de la Web para facilitar el acceso de una gran cantidad de personas a los recursos retrospectivos plantea aspectos de calidad, utilidad y entrega de imágenes del lado del usuario. Los estudios de usuario han llegado a la conclusión de que los investigadores esperan una recuperación rápida, calidad aceptable, y visualización completa de las imágenes digitales. Esto lleva a las instituciones culturales a hacer frente a una gran cantidad de aspectos técnicos que no existen en el mundo analógico.
72 Enlaces técnicos que afectan la visualización:
• Formato de archivo y compresión utilizados.
• Capacidades del navegador web.
• Conexiones de red.
• Rutinas y programas de escala.
• Capacidades informáticas y de visualización del usuario final.
FORMATOS DE ARCHIVO Y COMPRESIÓN: Algunos de los factores a tener en cuenta al elegir un formato de archivo para visualización son los siguientes:
• Profundidades de bits aceptadas
• Técnicas de compresión aceptadas
• Gestión de color
• Comparación entre formato de archivo patentado y formato de archivo estándar
• Soporte técnico (navegador Web, computadora del usuario y capacidades de visualización)
• Capacidad de metadatos
• Comparación entre capacidad fija y capacidad de resolución múltiple
• Características adicionales, por ejemplo: entrelazado, transparencia.
A pesar del interés por encontrar formatos alternativos para los archivos maestros, TIFF continúa siendo el estándar de facto. Los archivos GIF y JPEG son los más comunes para las imágenes de acceso. PDF, si bien no es técnicamente un formato de trama (raster), se usa frecuentemente para imprimir y ver documentos de múltiples páginas que contengan archivos de imagen. PDF también ofrece una característica de zoom que acepta vistas alternativas de una imagen. PNG ha sido aprobado por el World Wide Web Consortium, W3C (Consorcio de la World Wide Web) para su utilización en la web, y a medida que el soporte de navegador para
73 el formato se vuelve más completo, PNG puede llegar a reemplazar a GIF para el acceso a red.
Dado que se usan imágenes cada vez más grandes y complejas para acceder en la Web, existe también más interés en los formatos de archivo y las técnicas de compresión compatibles con capacidades de resolución múltiple, como por ejemplo FlashPix, LuraWave, JTIP y compresión wavelet (de ondas pequeñas), como por ejemplo MrSID de LizardTech o Enhanced Compressed Wavelet (Wavelet Comprimido Mejorado) de ER Mapper. JPEG 2000 también utilizará compresión de ondas pequeñas y será compatible con capacidades de resolución múltiple. DjVu es un formato recientemente desarrollado optimizado para los documentos escaneados. Ofrece una compresión eficiente tanto de las imágenes bitonales (utilizando la variante de JBIG2, JB2), como de las imágenes a todo color, utilizando compresión wavelet. Lamentablemente, todos estos formatos requieren que los usuarios descarguen e instalen conexiones (plug-ins) para poder verlos en la Web. 31
Imagen 25. Resolución a pedido.
31 Resolución A Pedido: Varios de los nuevos formatos de archivo y técnicas de compresión incluyen la función de zoom, mediante la cual los usuarios pueden hacer clic sobre una sección para poder verla con una mayor resolución. Haga clic
31 Ibit preservation/tutorial-spanish/preface.html
74 sobre la imagen superior para ver un ejemplo de una función de Zoom, la técnica de compresión utilizada y el nivel de compresión aplicado pueden afectar tanto la velocidad de entrega como la calidad de la imagen resultante. En la Tabla sobre Compresión se resumen los atributos importantes de las técnicas de compresión comunes. AIIM ofrece un cuestionario para ayudar a elegir un método de compresión que se ajuste a las necesidades del usuario.
Tabla 6. Atributos de las técnicas de compresión comunes
JBIG/JBIG ImagePa Nombre * ITU-T.6** JPEG LZW Deflate Wavelet 2 c
Estándar/patentad Estándar Estándar Estándar Patentado** Estándar Estándar o Patentado o * Patentado
Sin Sin pérdida Con Sin pérdida Sin Sin Con Sin pérdida/con pérdida o Con pérdida pérdida pérdida o pérdida pérdida pérdida Con pérdida
1 bit Típicament 8 bits o 24 Típicamente 8, 16, 24 bits Profundidades de e de 1 bit bits de 1 bit a 8 and 24 bits soportadas hasta 6 bits bits bits
Resolución No No No No No Sí Sí múltiple
Tiff, PDF, TIFF, JPEG/JFIF Zip, TIFF, PNG, JP2, Formatos de fax PDF****, , TIFF, GIF, PDF, Zip, PDF LuraWave, Archivo y fax FlashPix, Postscript MrSID, Applicaciones SPIFF, ERMapper PDF , DjVu
Conexión Conexión o Desde Desde Desde Conexión Aplicación o aplicación Explorer 2, Explorer 3, Explorer o Java o Soporte Web aplicació de ayuda Navigator Navigator 2 4, aplicación aplicación n de 2 *** Navigato de ayuda de ayuda ayuda r 4.04
75 En la siguiente Tabla se compara el tamaño de los archivos obtenidos usando varios programas de compresión sobre una imagen de 24 bits y a 300 dpi, de un mapa a color de 8,45 x 12,75 pulgadas.
Tabla 6. Comparación de tamaño de archivo y compresión
Tipo de compresión Tamaño de archivo Relación de compresión TIFF descomprimido 28,4 MB -- TIFF-LZW 21,2 MB 1:1,34 GIF (8 bits) 4,0 MB 1:6 JPEG-baja 10,4 MB 1:2,7 JPEG-alta 1,2 MB 1:24 PNG 20,8 MB 1:1,37 Imagen 26. Efectos de la compresión con pérdida en documentos de texto/ líneas:
Efectos De La Compresión Con Pérdida En Documentos De Texto/ Líneas : Haga clic en estas imágenes para ver una vista en detalle. La imagen de la izquierda está guardada en formato GIF; la de la derecha, en formato JPEG. Los artefactos de compresión son más evidentes alrededor de los caracteres con bordes pronunciados en la versión ampliada de la imagen de la derecha. 32
32 Ibit preservation/tutorial-spanish/preface.html
76 CAPACIDADES DEL NAVEGADOR WEB: La Web acepta pocos formatos para archivos de trama: JPEG, GIF y, en forma incompleta, PNG. Otros formatos requieren el uso de un visualizador especializado, como por ejemplo una conexión (plug-in), applet (pequeña aplicación java) o alguna aplicación externa. Esta limitación tiende a desalentar su utilización ya que exige más por parte del usuario. En algunas circunstancias, el valor del formato es lo suficientemente persuasivo para vencer la resistencia del usuario, como en el caso de los archivos PDF. Adobe disminuye las limitaciones del usuario proporcionando una conexión para navegadores en el lector de PDF. Si el programa Acrobat Reader autónomo ya está disponible al instalar un navegador, la mayoría de éstos se configurarán de modo tal que se activarán automáticamente al encontrar un archivo PDF. Como respuesta a los requisitos de los usuarios, algunas instituciones convierten cuanto antes los formatos o esquemas de compresión no compatibles con la Web por otros que sí lo son (por ejemplo de wavelet a JPEG).
CONEXIONES DE RED: Los usuarios probablemente se interesen más por la velocidad de entrega, como se mencionó anteriormente. La velocidad de acceso depende de diversas variables, incluyendo el tamaño del archivo, las conexiones a la red y el tráfico en la misma, y la demora para leer el archivo desde el lugar donde está guardado y abrirlo en el escritorio.
CAPACIDADES DEL MONITOR: La satisfacción del usuario con las imágenes en la pantalla dependerá de las posibilidades de los sistemas de visualización. Además de la velocidad de entrega, los usuarios están interesados en la calidad de la imagen (legibilidad y fidelidad del color adecuados para una tarea); la presentación completa de las imágenes en pantalla y, en menor grado, las representaciones exactas de las dimensiones de los documentos originales. Desafortunadamente, debido a la tecnología actual de los monitores, con frecuencia resulta imposible satisfacer todos estos criterios en forma simultánea.
77 TAMAÑO DE LA PANTALLA Y DIMENSIONES DE PÍXEL: A diferencia de los escáneres y las impresoras, los monitores actuales ofrecen una resolución relativamente baja. Los monitores típicos aceptan configuraciones del escritorio de 640 x 480 a 1.600 x 1.200. Estos valores se refirieren a la cantidad de píxeles horizontales por verticales representados en la pantalla cuando se muestra una imagen.
La cantidad de imagen que se puede desplegar de una sola vez depende de la relación entre las dimensiones de píxel (o dpi) y la configuración de escritorio del monitor. El porcentaje de una imagen desplegada se puede aumentar de distintas maneras: mediante el aumento de la resolución de la pantalla y/o la disminución de la resolución de la imagen.
Aumento de la resolución de la pantalla . Piense en la configuración del escritorio como el visor de una cámara. A medida que aumentan las dimensiones de la configuración del monitor, se puede ver una mayor parte de la imagen. La figura a continuación ilustra el área útil de pantalla para una imagen con diferentes configuraciones de monitor.
Imagen 27. Aumento de la resolución de la pantalla.
Aumento De La Resolución De La Pantalla : Comparación del área útil de pantalla para una imagen de 100 dpi (tamaño del documento original: 8 x 10
78 pulgadas) desplegada con diferentes configuraciones de monitor. Las dimensiones de píxel para la imagen son de 800 x 1000. 33
Disminución de la resolución de la imagen . También se puede aumentar la cantidad desplegada de una imagen reduciendo su resolución con escala. En esta figura se ilustra la relación de una configuración de escritorio del monitor a 800 x 600 con una escala de imagen en varias resoluciones. 34
Imagen 28. Equilibrio entre la legibilidad y la integridad.
Equilibrio entre la Legibilidad y la Integridad : Cuando se despliega a 200 dpi en un monitor de 800 x 600, sólo se puede ver una pequeña porción de la página (izquierda). A 60 dpi, se despliega completamente toda la página, pero a expensas de la legibilidad (abajo a la derecha). La solución al escalar la imagen a 100 dpi permite mantener la legibilidad y limitar el desplazamiento a una dimensión (arriba a la derecha).
Usted puede calcular el porcentaje de visualización si conoce las siguientes variables: 1) dimensiones del documento y dpi de la imagen, o dimensiones de píxel de la imagen, y 2) la configuración de escritorio.
33 Ibit preservation/tutorial-spanish/preface.html 34 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006
79 FIDELIDAD DE LAS DIMENSIONES: Algunas veces, puede ser importante representar en la pantalla una imagen con el tamaño real del documento original escaneado. Esto sólo se puede lograr cuando la resolución de la imagen digital es igual a la resolución del monitor (dpi).
CALIDAD DE LA IMAGEN EN LA PANTALLA: Hemos descrito los efectos de varios programas y rutinas de escala sobre la calidad de la imagen. Asimismo, se deben considerar otros dos factores:
A. ¿Es la resolución de la imagen suficiente para asegurar la legibilidad o para respaldar un estudio detallado de una imagen?
B. ¿Se pueden transmitir el color y la tonalidad en forma efectiva?
LEGIBILIDAD DEL TEXTO: Como ya hemos visto, la legibilidad y la integridad con frecuencia están en conflicto. Por ejemplo, cuando se escala una página de texto de 8 x 10 pulgadas escaneada a 200 dpi para un monitor con la resolución configurada en 800 x 600, más del 90% de los píxeles han sido desechados. La imagen se ajusta, pero quizás el texto ya no sea legible.
Cornell ha desarrollado una fórmula de referencia para la visualización de materiales que contienen texto que se correlaciona con la calidad de la imagen, la resolución y el nivel de detalle requerido:
Fórmula de referencia para la legibilidad en la pantalla dpi = QI/(0,03h) QI = dpi x 0,03h h = QI/(0,03dpi)
En esta fórmula, dpi se refiere a la resolución de una imagen (que no se debe confundir con los dpi del monitor), h se refiere a la altura del carácter más pequeño del original (en mm), y QI a los niveles de legibilidad (Nota: si h se mide
80 en pulgadas, multiplique por 25,4 antes de utilizar la fórmula). En esta fórmula se supone que las imágenes bitonales están presentadas con 3 bits de gris o más y que los filtros y rutinas de escala optimizados mejoran la presentación de la imagen. Utilice esta fórmula para establecer sus propios niveles de calidad aceptable. Cornell utiliza como referencia la legibilidad QI en 3,6, a pesar de que, por lo general, 3,0 es suficiente para producir texto de manera nítida, en especial si se escaneó con escala de grises o en colores.
6.2.7 PRESERVACIÓN DIGITAL
El objetivo de la preservación digital es mantener la capacidad de visualizar, recuperar y utilizar colecciones digitales frente a las infraestructuras y elementos tecnológicos y de organización que cambian con mucha rapidez. Los asuntos que se deben tratar en la preservación digital incluyen:
• Mantener la fiabilidad física de los archivos de imagen, los metadatos complementarios, textos y programas (por ejemplo: asegurarse de que el medio de almacenamiento es confiable, con copias de seguridad (back- ups), mantener la infraestructura de hardware y software necesaria para almacenar y proporcionar acceso a la colección).
• Asegurar el uso de la colección de imágenes digitales en forma continuada (por ejemplo: mantener una interfase de usuario actualizada, permitir a los usuarios recuperar y manipular información para poder satisfacer sus necesidades de información)
• Mantener la seguridad de la colección (por ejemplo: implementar estrategias para controlar la alteración no autorizada de la colección, desarrollar y mantener un programa de gestión de derechos para servicios con cargo).
81 Los asuntos asociados con la larga duración necesitan ser discutidos desde el comienzo de cualquier iniciativa de digitalización de imágenes. Muchos de los asuntos que se vuelven impedimentos para la preservación a largo plazo tienen su origen en decisiones tempranas centradas en la selección y conversión. Las decisiones y estrategias respecto de la preservación digital deberían ser desarrolladas como una parte integral de una iniciativa de digitalización de imágenes, dado que muchas decisiones estarán unidas estrechamente con los planes de retención a largo plazo de la institución. 35
¿POR QUÉ ES TAN DESAFIANTE LA PRESERVACIÓN DIGITAL?: Los desafíos son multifacéticos y pueden agruparse en dos categorías:
VULNERABILIDADES TÉCNICAS:
• Medios de almacenamiento, debido al deterioro físico, maltrato almacenamiento incorrecto y obsolescencia
• Formatos de archivo y sistemas de compresión, debido a la obsolescencia o demasiada confianza en los formatos de compresión y de archivo patentados y no compatibles
• Integridad de los archivos, incluyendo la protección del contenido, contexto, fijeza, referencias y procedencia
• Dispositivos, programas, sistemas operativos, interfaces y protocolos de almacenamiento y procesamiento que cambian a medida que la tecnología evoluciona (con frecuencia con compatibilidad hacia atrás limitada)
• Herramientas de recuperación y procesamiento distribuidas, como por ejemplo textos y aplicaciones Java insertados.
35 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006
82 DESAFÍOS ADMINISTRATIVOS Y DE ORGANIZACIÓN:
• Compromiso institucional de preservación a largo plazo insuficiente
• Falta de políticas y procedimientos de preservación
• Escasez de recursos humanos y financieros
• Intereses variables (y asincrónicos) de quienes tienen participaciones, en la creación, mantenimiento y distribución de colecciones de imágenes digitales
• Brechas en la memoria institucional debido a la rotación de personal
• Mantenimiento de registro y metadatos administrativos inadecuados
• Naturaleza evolutiva de las disposiciones sobre derechos de autor y uso justo que se aplican a las colecciones digitales.
ESTRATEGIAS TÉCNICAS: El cuidado duradero debe ser visto como una estrategia continua para controlar que los recursos digitales se encuentren bien. La gestión atenta de la colección incluye el almacenamiento de las imágenes y de los archivos que las acompañan en medios y ubicaciones seguros y confiables; el almacenamiento y la manipulación de los medios de acuerdo con las pautas de la industria para optimizar su expectativa de vida; y la implementación de verificaciones y copias de seguridad (backups) respecto de la integridad, llevadas a cabo en forma periódica y sistemática.
La actualización comprende la copia de contenido de un medio de almacenamiento a otro. Como tal, sólo se centra en la obsolescencia del medio y no es una estrategia de preservación de servicio completo. Un ejemplo de actualización es copiar un grupo de archivos de CD-ROMs a DVDs. La actualización debe verse como una parte esencial de una política de cuidado duradero.
83 La migración es el proceso de transferencia de información digital de una configuración de hardware y software a otra, o de una generación de computadoras a generaciones subsiguientes. Por ejemplo, mover archivos de un sistema de base HP a un sistema de base SUN comprende ajustar las diferencias en los dos medios operativos. La migración también puede estar basada en el formato, para mover archivos de imágenes de un formato de archivo obsoleto o para aumentar su funcionalidad.
La emulación comprende la recreación del entorno técnico requerido para ver y utilizar la colección digital. Esto se logra manteniendo información acerca de los requisitos de hardware y software para que se pueda reestructurar el sistema.
La preservación de la tecnología se basa en preservar el entorno técnico que ejecuta el sistema, incluyendo software y hardware, como por ejemplo: sistemas operativos, software de aplicación original, unidades de medios y similares.
La arqueología digital incluye métodos y procedimientos para rescatar contenidos de medios dañados o de entornos de hardware y software obsoletos o dañados.
ESTRATEGIAS DE ORGANIZACIÓN: Las soluciones técnicas por si solas no son suficientes para asegurar la larga duración de los recursos digitales. Se recurre a un enfoque holístico, dado que éste reconoce las interdependencias entre componentes técnicos y de organización. Entre los asuntos que se deben tratar en tal estrategia se encuentran las necesidades de contratación de personal y de capacitación, los requisitos financieros, los criterios de reselección, y las necesidades de metadatos de preservación.
Si bien es útil examinar cada asunto en detalle, las soluciones exitosas requieren la integración de consideraciones administrativas y técnicas. Por ejemplo, una
84 institución puede tener una estrategia bien desarrollada para el mantenimiento cotidiano de colecciones de imágenes, la cual codifica cómo controlar, probar y actualizar archivos. Sin embargo, a menos que exista un plan financiero y administrativo concomitante que resuma cómo proveer de personal y financiar estas actividades con el tiempo, el plan de mantenimiento no será exitoso a largo plazo. De igual modo, el tener personal dedicado y capacitado no será suficiente a menos que haya una apreciación técnica para la gestión del ciclo vital de los activos digitales. La gestión efectiva de las colecciones digitales requerirá que las instituciones desarrollen y sigan un plan de negocios para evaluar los requisitos de preservación y acceso a largo plazo, identificando los costos y beneficios, y evaluando los riesgos.
Entre los programas que respaldan tal enfoque se encuentran:
• El Servicio de Datos sobre las Artes y las Humanidades.
• El proyecto de Cornell, Gestión de Riesgo de la Información Digital (Risk Management of Digital Information), examinó los riesgos implicados en la migración de formato de archivo (por ejemplo: TIFF 4.0 a TIFF 6.0) y desarrolló una herramienta de valoración para evaluar los riesgos implicados en la migración. Esta herramienta también ayuda a evaluar la disposición institucional para cualquier acción de preservación digital.
Los siguientes programas son ejemplos de enfoques prometedores y prácticos a la preservación digital:
• El modelo de referencia OAIS ( Open Archival Information System - Sistema de Información de Archivo Abierto) proporciona un marco para la preservación y acceso digital a largo plazo, incluyendo terminología y conceptos para describir y comparar arquitecturas de archivo. Tanto el
85 proyecto NEDLIB como Cedars 1 han adoptado el modelo de referencia OAIS como base para sus exploraciones.
• El proyecto Cedars 1 ( CURL Exemplars in Digital Archives - Modelos CURL en los Archivos Digitales) tiene como objetivo producir marcos estratégicos para las políticas de gestión de colecciones digitales, y promover métodos adecuados para la preservación a largo plazo de diferentes clases de recursos digitales, incluyendo la creación de los metadatos apropiados.
• La Biblioteca Europea de Depósito en Red ( Networked European Deposit Library, NEDLIB ) es un proyecto en colaboración de las bibliotecas nacionales europeas para construir un marco para una nueva biblioteca de depósito en red. Entre los asuntos esenciales que explora se encuentran procedimientos de mantenimiento de archivos y el enlace entre los requisitos de metadatos y las estrategias de preservación.
• El proyecto PANDORA ( Preserving and Accessing Networked Documentary Resources of Australia - Preservación y Acceso a Recursos Documentales en Red de Australia) ha establecido en forma exitosa un archivo de publicaciones australianas seleccionadas online, ha desarrollado varias políticas y procedimientos de preservación digital, ha redactado un modelo de datos lógico para los metadatos de preservación, y ha esbozado una propuesta para realizar un acercamiento nacional a la preservación a largo plazo de estas publicaciones.
86 6.2.8 GESTIÓN
Las instituciones que inauguran programas de digitalización de imágenes encarar asuntos de gestión. Los mismos pueden estar caracterizados de distintos modos, pero todos ellos se reducen a establecer correlaciones entre los recursos y procesos y los objetivos del proyecto. Los objetivos del proyecto, como por ejemplo mejorar el acceso o promover eficiencias, deben traducirse a resultados de proyecto, como archivos de imágenes digitales, metadatos complementarios y bases de datos accesibles desde la Web. Un gerente tendrá mayores posibilidades de completar el proyecto con éxito si tiene participación en la definición de los objetivos del proyecto y los resultados. La Figura que se exhibe más abajo coloca a los objetivos y a los resultados en el centro de la gestión del proyecto. Saliendo de ellos están los recursos institucionales, incluyendo colecciones, personal, finanzas, espacio, tiempo y capacidades técnicas. Estos elementos aumentarán o limitarán los esfuerzos de digitalización. El círculo externo representa los procesos o pasos que acompañan a las iniciativas de digitalización de imágenes.
Imagen 29. La rueda de la gestión. 36
36 Ibit preservation/tutorial-spanish/preface.html
87 La Rueda De La Gestión : La figura demuestra la naturaleza orgánica de la digitalización de imágenes, con interdependencias que conectan objetivos, recursos y procesos. 37
Entre las responsabilidades que les corresponden a los gerentes de proyecto se encuentran las siguientes:
• Establecer líneas de tiempo, objetivos y expectativas realistas
• Determinar el mejor enfoque para llevar a cabo los objetivos del proyecto
• Desarrollar y defender los presupuestos
• Facilitar la comunicación entre los participantes del proyecto, incluyendo proveedores externos
• Controlar la producción, calidad y los costos
• Tener visión de futuro que vaya más allá del proyecto.
ESTABLECER LÍNEAS DE TIEMPO, OBJETIVOS Y EXPECTATIVAS REALISTAS: Es responsabilidad del gerente reconocer y planear el ciclo vital de un proyecto, el cual abarca las siguientes etapas:
• Actividades previas al proyecto , incluyendo la identificación de objetivos y metodologías, el asegurar los recursos y el compromiso institucional
• Etapa Inicial , la etapa desde la iniciación del proyecto hasta el primer lote de escaneado
• Producción , en donde la mayor productividad ocurre en la mitad de esta etapa
• Etapa Final del proyecto , un tiempo para concluir el esfuerzo y tratar con problemas que han sido dejados de lado
37 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006
88 • Actividades posteriores al proyecto , principalmente asociadas con el establecimiento de las responsabilidades de mantenimiento para los productos digitales.
Reconocer el ciclo vital de un proyecto permite al gerente desarrollar una línea de tiempo para el proyecto, en donde el comienzo y el fin están claramente definidos. Al mismo tiempo, el gerente debe conseguir recursos para obtener resultados del proyecto a tiempo y dentro del presupuesto. Los pasos y el flujo de trabajo del proyecto deben ser claramente definidos; y los recursos Web indicados al final de esta sección proporcionan información útil que se puede adaptar a sus circunstancias particulares.
El desarrollo de una línea de tiempo se facilita si la institución tiene experiencia con esfuerzos similares o si puede emprender una fase piloto en la cual puedan cuantificarse el tiempo y los recursos asociados con los pasos del proyecto. Crear una línea de tiempo a nivel base utilizando un programa de software capaz de generar un cuadro Gantt, como por ejemplo Microsoft Project, permite al gerente observar secuencias y dependencias del proyecto que serán afectadas por retrasos no anticipados en la producción. Un error común es sobrestimar las posibilidades de producción, especialmente en las primeras fases de un proyecto. Estas herramientas facilitan el seguimiento del proyecto, permiten a los gerentes responder de manera más efectiva a los cuellos de botella, los requisitos que están en contraposición, y cuestiones similares.
CÓMO DETERMINAR EL MEJOR ENFOQUE: TERCERIZACIÓN VS. PROGRAMAS EN LA EMPRESA: Existen ventajas y desventajas respecto de la tercerización o la creación de capacidades dentro de la empresa para los esfuerzos de digitalización de imágenes. Aún cuando se toma la decisión de tercerizar ciertas funciones, la institución debe sustentar muchos aspectos de la
89 cadena de digitalización como se la define en la perspectiva general técnica. Por ejemplo, si la digitalización es tercerizada, la institución de igual manera necesita establecer un programa de inspección interno.
Tercerización:
Ventajas:
• Contención del costo y riesgo limitado; la institución paga por los resultados, con frecuencia un precio fijo por imagen, lo que facilita el planeamiento y presupuesto del proyecto
• Los costos son típicamente más bajos que las cifras que se manejan dentro de la empresa, a pesar de que los precios varían mucho
• Los proveedores pueden manejar un gran volumen y una alta producción
• Los costos de experiencia, capacitación y obsolescencia tecnológica son absorbidos por el proveedor
• Amplia gama de opciones y servicios disponibles, incluyendo, imágenes
• Creación de metadatos, mejoras, procesamiento, codificación, creación de derivados, impresión, almacenamiento y copias de seguridad (backup), desarrollo de bases de datos.
Desventajas:
• La institución se aleja un paso de las funciones de imagen; con mayor frecuencia, los servicios se llevan a cabo fuera de las instalaciones o incluso fuera del país
• Vulnerabilidad debido a la inestabilidad del proveedor
• Venta agresiva de productos y servicios existentes que son diseñados típicamente para el mercado comercial
90 • Inexperiencia del proveedor respecto de las necesidades de las instituciones culturales
• Falta de normas y prácticas óptimas con las cuales definir requisitos o negociar la prestación de servicios
• Desafíos en la comunicación, desde el desarrollo de las solicitudes de propuestas (RFPs) pasando por la contratación, hasta requisitos de producción y calidad
• Asuntos relacionados con la seguridad, manipulación, transporte.
La tercerización es viable si una institución tiene una buena comprensión de los objetivos a corto y a largo plazo de una iniciativa de digitalización de imágenes, y puede especificar en forma completa los requisitos de imagen, metadatos y derivados; ubicar proveedores confiables; evaluar productos y servicios; adoptar políticas y procedimientos para diversas funciones; y definir las responsabilidades institucionales y las de los proveedores. Algunos proveedores de servicios ofrecen un cuestionario o lista de control para que las instituciones pongan en claro los requisitos de proyecto así como también para determinar productos y costos. 38
Realizar el proyecto en la empresa:
Ventaja:
• Se aprende a medida que se hace
• Los requisitos se definen en forma progresiva en lugar de hacerlo en el inicio
• Se mantiene el control directo sobre toda la gama de funciones referidas a la producción de imágenes
38 http://www.library.cornell.edu/preservation/tutorial-spanish/preface.html 12 Agosto 2006
91 • Se prevé la seguridad, manipulación apropiada y accesibilidad respecto de los materiales
• Se asegura la primacía de los requisitos de biblioteca / archivos
• Se mantienen requisitos de seguridad consistentes y de alta calidad.
Desventajas:
• Gran inversión y tiempo prolongado de la etapa inicial
• No hay costos fijos por imagen
• La institución paga los gastos en vez de pagar por los productos, incluyendo los costos de tiempo de inactividad, capacitación y obsolescencia tecnológica
• Capacidad e instalaciones para la producción limitadas
• Se requiere una variedad de experiencias en el personal.
6.2.9 FORMATOS DE VIDEO
Avi : Es el contenedor multimedia mas estandarizado. El video puede estar codificado en Divx o Xvid y el audio en AC3, Mp3, Ogg.
Ogm : Nuevo contenedor multimedia que ofrece mas posibilidades que el "obsoleto" .avi. En este contenedor podremos meter múltiples audio y subtítulos de quita y pon, índice de capítulos.
Matroska : Nuevo contenedor similar al Ogm. Aun esta verde pero se prevé que llegue a ser un formato muy usado. Estos 3 tipos de archivos se graban como CD de DATOS y solo son visiónales en el PC, excepto los avi que se podrá ver si posee un reproductor de divx (ogm también podrá ser visto en estos reproductores en un futuro próximo)
92 VCD : Video CD, estándar Mpeg-1 compatible con la gran mayoría de reproductores de dvds del mercado. Codificado a una resolución de 352x288 y a un bitrate (velocidad binaria) constante de 1150 kbit/s. Se graba como CD de Video marcando la opción conforme al estándar.
CVCD, KVCD: Variantes del VCD q permiten codificar a bitrates (velocidad binaria) variables y meter mas minutos de película por CD. Se graban como CD de Video desmarcando la opción conforme al estándar.
SVCD: Súper Video CD, estándar Mpeg-2, codifica a una resolución de 480x576 y a un bitrate (velocidad binaria) máximo de 2520 Kbit/s. Este formato no es soportado por todos los reproductores dvd (actualmente la mayoría de los dvd medianamente nuevos si lo hace). Es el formato que mayor calidad da pero usualmente necesita 2 Cds. Se graba como CD de Súper Video marcando la opción conforme al estándar.
CVD: variante del SVCD que codifica a una resolución de 352x576. Se graba como CD de Súper Video desmarcando la opción conforme al estándar.
93 TABLA 8: COMPARACIÓN ENTRE FORMATOS DE VIDEO:
Video
N N Ld N Ld P N P P P N P DVC DVD P Ld P Hi-8 P V8 CD-I DD PCM Bcast Bcast SVHS Beta VHS VHS DD
Digita Analo Analo Analo Analo Analo Analo Analo Analo Dominio Digital Analog Analog Digital l g g g g g g g g
Compresión 5:1 60:1 Comp Comp Comp Comp Y/C Y/C Y/C Y/C Y/C Y/C 40:1
Luminancia 500 500 450 420 400 330 400 400 250 240 240 230 240 Res. Horiz.
Luminancia 575 480 575 480 575 480 575 575 575 575 480 575 280 Res. Vert.
Luminancia 54 48 52 55 55 46 45 43 43 45 48 S/N Relac,.
Crominancia 125 250 100 70 100 70 40 40 45 40 40 40 120 Res. Horiz.
Crominancia 200 240 200 480 200 480 140 140 200 140 160 140 140 Res. Vert.
Crominancia 54 48 48 Relac. S/N
Cuadros/s 25 30/24 25 30 25 30 25 25 25 25 30 25 25
Entrelazado Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes No
Minor Artefactos de Dot Dot Dot Sever Mínima / Som Dot crawl No No No No No No compresión crawl crawl crawl e
Audio
N N Ld N Ld P N P P P N P DVC DVD P Ld P Hi-8 P V8 CD-I DD PCM Bcast Bcast SVHS Beta VHS VHS DD
Digita Digita Digita Analo Analo Digita Analo Analo Analo Analo Dominio Digital Digital Digital Digital Digital l l l g g l g g g g
Compresió No N-lin 10:1 No 10:1 No 14:10 - DBX N-lin. DBX DBX N-lin. 5:1 n
Bits 18..2 18..2 16 12 16 16 14 - - 8 - - - - 8 16 Muestreo 0 0
Velocidad 4800 3200 4800 4800 4405 3200 de 44100 32000 ------32000 0 0 0 0 6 0 muestreo
Relac. S/N 96 90 90 96 90 96 84 65 90 85 65 90 90 90 85 96
Baja 5 5 5, 2 5 5, 2 5 5 60 20 20 30 20 20 20 20 20 Frecuencia
Alta 20k, 20k, 22k 15k 20k 20k 15k 15k 20k 15k 14k 20k 20k 20k 15k 20k Frecuencia 120 120
Canales n x 2 2 (calidad + 2 4 2 1..2 2 (+1) 2 (+2) 2 2 (+1) 2 (+1) 2 (+1) 2 (+2) 2 5.1 (+2) (+1) baja)
94 COLUMNAS:
• P DVC: PAL Digital Video
• DVD: Digital Video Disk
• P Ld: PAL Laser disk
• N Ld DD: NTSC Láser disk con 5.1 canales de audio es Dolby Digital (AC-3)
• N Ld PCM: NTSC Láser disk con audio PCM digital convencional.
• P Bcast: PAL Emisión
• N Bcast: NTSC Emisión
• P SVHS: PAL Super-VHS
• P Hi-8: PAL Hi-8
• P Beta: PAL Beta
• P VHS: PAL VHS
• N VHS: NTSC VHS
• P V8: Pal Video-8. Ten en cuenta que el audio digital no es típico de los modelos de gran público. Mira en Hi-8 para ver información de sonido analógico.
• CD-I: Philips CD-I o MPEG-1
FILAS:
Video
• Dominio: ¿Está la señal de video en el dominio digital o el analógico?
• Compresión: Si es digital, cuánto se comprime la señal? Si es analógico, cómo se almacena la señal?
Comprimir: Video compuesto: Es responsabilidad del receptor recobrar la luminancia y la crominancia de la señal.
Y/C: Video separado. La crominancia y la luminancia de la imagen se almacenan en el haz de video por separado. Por lo tanto, pueden ser enviadas al receptor por separado. (A menudo no se da el caso,
95 por ejemplo, aun tengo que ver un video VHS casero con salidas Y/C)
• Luminancia Res. Horiz.: Luminancia resolución horizontal (líneas)
• Luminancia Res. Vert.: Luminancia resolución vertical (líneas)
• Luminancia Relación. S/N: Luminancia, relación señal/ruido (DB)
• Crominancia Res Horiz.: Crominancia, resolución horizontal (líneas)
• Crominancia Res. Vert.: Crominancia, resolución vertical (líneas)
• Crominancia Relación. S/N : Crominancia, relación señal/ruido (dB)
• Cuadros/s: Cantidad máxima de planos completos por segundo (p/s)
• Intercalado: ¿Se muestra la imagen en modo entrelazado?
• Artefactos de Compresión. : ¿Si la imagen es comprimida, produce la compresión artefactos visibles? (los puntos parece que se arrastran cunado un aparato de TV no puede separar bien la luminancia de la crominancia)
Audio
• Dominio: ¿Esta la señal de audio en el dominio digital o analógico?
• Compresión: ¿Si es digital, cuánto está el sonido comprimido? ¿Si es analógico, qué método de compresión/expansión se ha usado?
• Bits Muestreo: Si es digital, la cantidad de bits usados en muestrear antes de la compresión.
• Velocidad de Muestreo: Si es digital, la velocidad de muestreo (muestras/seg)
• Relación S/N: La relación Señal/ruido del sonido con reducción de ruido (dB)
• Baja Frecuencia: La frecuencia más baja que el sistema puede reproducir sin atenuar más de s dB (Hz)
• Alta Frecuencia: La frecuencia mas alta que el sistema puede reproducir sin atenuar mas de 3 dB (Hz)
96 • Canales (Calidad + baja) Los canales que pueden usarse. En paréntesis están los canales analógicos del láser disk NTSC y las pistas lineales de video VHS.
Calculando la Resolución Horizontal: Aunque calcular la resolución vertical es fácil (Cantidad de líneas de escaneo horizontales), la resolución horizontal es una cosa un poco engañosa.
En la industria del video, la resolución horizontal se da como si la pantalla de video fuese tan ancha como alta. De este modo, si un dispositivo de video tiene la misma resolución vertical, se puede pensar que tiene "píxeles cuadrados". Si quieres saber cuantas líneas verticales puede mostrar realmente el dispositivo (en el ancho total de la pantalla, digamos), tienes que multiplicar la resolución dada por 4/3 que es la relación normal para dispositivos de video normales.
Por ejemplo, si tienes un ordenador Amiga que puede mostrar gráficos (en modo entrelazado baja resolución) en una resolución de ordenador de 368x564, la resolución de video es 368*3/4x564=276x564, lo cual es un poco mejor que el VHS. El paso inverso: Si tienes un reproductor láser disk NTSC, que tiene una resolución de 420 líneas, puedes tener 420*4/3=560 líneas verticales, o píxeles en horizontal, en tu pantalla de televisión.
Por esta causa, por ejemplo, la resolución de la luminancia horizontal del CD-I no se da como 320, sino como 240 (320*3/4). El número podría incluso ser mas bajo si se usase un filtrado paso-bajo apropiado, pero en el CD-I no se hace nada para prevenir que los píxeles salgan mal.
Por otra parte, la resolución teórica del DVD podría ser de 540 líneas de video según mis cálculos. Sin embargo, puesto que la señal es filtrada paso-bajo (como debe ser) se pierde un poco menos del 10% (40 líneas) en el proceso.
97 Imagen 30: Tipos de codificación y formatos de vídeo:
Montaje de imágenes
Una de las decisiones más importantes que debemos tomar, antes y después de la edición, es elegir el formato de video que usaremos, y su codificación (CODEC). Esto afectará notablemente al resultado final de nuestro trabajo.
El formato, es la manera en que se guardan los datos en el archivo. El CODEC, en cambio, es el algoritmo de compresión usado para codificar los datos de la película digital dentro del archivo.
La elección de un formato y codéc, dependerá de las utilidades que le queramos dar a la película. Sus diferentes usos pueden ser:
• Almacenaje de archivo: la película resultante será almacenada en cualquier soporte magnético u óptico, de ordenador, disco duro, CD o DVD. Su reproducción se podrá realizar exclusivamente en un equipo informático con el software de reproducción y codéc apropiados.
• Streaming: el clip será guardado en un ordenador para su difusión en Internet o Intranet. Este tipo de vídeos, son usados para verlos online. Para este tipo de visualización es necesario un servidor con el software
98 apropiado de "streaming", para poder enviar los datos a los ordenadores conectados.
• Reproductor de salón: la grabación será almacenada en cualquier tipo de soporte magnético u óptico, ya sea cinta VHS, DV, CD, DVD, etc. En este caso para grabar la película en formato VHS, necesitaremos disponer de una salida de vídeo en nuestro ordenador o cámara digital.
6.2.10 FORMATOS
En cuanto a formatos de vídeo, se puede destacar los siguientes:
• AVI y AVI2: el formato AVI (Audio Video Interleave) tiene un funcionamiento muy simple, pues almacena la información por capas, guardando una de vídeo seguida por una de audio. Sus codécs están desarrollados como controladores para ACM (Audio Compresión Manager) y VCM (Video Compresión Manager), y también pueden ser usados por algunas otras arquitecturas, incluidas Direct Show y Windows Media. 39
• Microsoft Windows Media Vídeo: Este formato es una de las últimas propuestas de Microsoft que funciona con el Windows Media Player desde la versión 6.2. Ha tenido gran impulso debido a Windows XP, ya que viene integrado con el sistema operativo. También tiene una opción para "streaming", que viene incluida en Windows 2000 Server. Las extensiones de este tipo de contenidos son: .asf y .wmv para vídeo, y .wma para audio.
• Real Video: Real Audio, ha sido uno de los más usados para "streaming" de audio en diversos medios. También tiene una propuesta para video llamada Real Video. Ambas versiones, requieren de su propio reproductor, que es el "Real One".
39 http://www.macintec.com.mx/pages/video2body.html 22 Agosto 2006 9:00 Am
99 • Apple QuickTime: Apple también tiene una interesante opción nativa de los sistemas Macintosh. Sus archivos .mov requieren de un reproductor especial que es el "Quicktime Player" para visualizarlos. Este reproductor, tiene una versión sencilla gratuita y una profesional, que entre otras cosas permite realizar vídeos en dicho formato y editar algunas características de los mismos.
Codécs: Los Codécs de vídeo más usados actualmente son:
• Sin Compresión: aunque no es muy normal usar vídeo sin comprimir, es de los que pueden ofrecer la máxima calidad posible, ya que no sufre ninguna alteración. Su gran problema: el peso excesivo de los archivos.
• DV: si tienes una cámara MiniDV y capturas vídeo mediante el firewire, verás que debes hacerlo con su propio codéc que es el DV, una vez terminada la captura ya puedes comprimirlo como quieras. Dos horas de video DV con calidad similar a la del DVD, ronda cerca de los 15Gbytes de disco duro, destacar que este codéc solo comprime el vídeo, el audio lo trata sin comprimir.
• MPEG: el formato MPEG (Moving Picture Experts Group) es un estándar para compresión de vídeo y de audio. Al ser creado se establecieron cuatro tipos: MPEG-1, MPEG-2, MPEG-3, y MPEG-4. Cada uno de ellos según su calidad y ancho de banda usado. De aquí nace el popular formato MP3 para audio.
Principalmente, ofrece tres ventajas: compatibilidad mundial, gran compresión y poca degradación de la imagen. El estándar no especifica cómo se debe hacer la compresión. Los diferentes fabricantes luchan para
100 determinar el mejor algoritmo, manteniendo siempre la compatibilidad. 40 Además, una cadena MPEG se compone de tres capas: audio, video y una capa a nivel de sistema. Esta última incluye información sobre sincronización, tiempo, calidad, etc.
• DIVX: este codéc es una gran alternativa a la hora de comprimir. Con mucha gente trabajando en sus diferentes aplicaciones, el DivX es el método más utilizado para pasar grabaciones de DVD a CD.
- Formatos de Video
Aquí se trata de hablar digitalmente y dentro de estos podemos subdividir dos categorías: Formatos comunes de video y formatos para el web.
Formatos comunes: Formatos digitales de bastante popularidad:
• AVI y AVI 2.0: El formato AVI (Audio Video Interleave) es el formato standard de video digital. Su funcionamiento es muy simple pues almacena la información por capas, guardando una capa de video seguida por una de audio. Cuando capturamos video hacia nuestra computadora llega en formato AVI. Puede generar archivos muy grandes y de difícil manejo.
Han existido dos versiones de formatos AVI: El primero que tenía algunos limitantes y la segunda versión que eliminó dichas limitantes, aunque ocasionó archivos gigantezcos de video.
Expedientes "X" AVI DV: Algo de historia : A menudo, para referirse a Video for Windows, se refiere a un "AVI" debido a que las extensiones .avi son las que utiliza VfW de forma específica. Sus codecs están desarrollados como controladores para ACM (Audio Compression Manager) y VCM (Video
40 http://www.mplayerhq.hu/DOCS/HTML/es/formats.html 25 Agosto2006 11:00 Am
101 Compression Manager), y también pueden ser usados por algunas otras arquitecturas, incluidas DirectShow y Windows Media.
Microsoft lanzó Video for Windows 1.0 para Windows 3.1 en noviembre de 1992, seguido por Video for Windows 1.1. Han existido varias versiones de Video for Windows 1.1 identificadas por una letra en orden alfabético tal como la 1.1e
Microsoft también creó una versión de 32-bit de Video for Windows para Windows 95, mientras proyectaba reemplazar a Video for Windows por ActiveMovie. Esta versión tenía asimismo versiones de los codecs de 32-bit tales como Cinepak. Otras DLL de Video for Windows 95 eran también 32-bit.
Windows NT 3.5, 3.51 y Windows NT 4.0 incluían un Video for Windows para NT. Presumiblemente era completamente 32-bit. No está claro cuánto de este código estaba compartido entre las versiones para Win95 y NT teniendo en cuenta que los controladores de dispositivos de hardware son muy diferentes en estos dos sistemas.
ActiveMovie 1.0 y DirectShow (realmente un ActiveMovie 2.0) son sucesores 32- bit de VfW tanto para Win95 como para NT. ActiveMovie inició su vida bajo el nombre clave de Quartz. De hecho, las primeras Beta de ActiveMovie fueron conocidas como Quartz.
ActiveMovie 1.0 estaba incluido en Windows 95b (OEM Service Release 2.x) que era la primera versión de Windows 9x que admitía discos configurados en FAT 32, y en Internet Explorer 3.x/4.x para Windows 95. También podía ser descargado e instalado en Windows 95 de forma separada. Hay que decir que ActiveMovie 1.0 no reemplazaba de forma completa a VfW. Por ejemplo, ActiveMovie 1.0 no tenía ningún mecanismo de captura de vídeo. Por ello, algunas capturadoras y
102 programas de origen algo más antiguo aún usan drivers de captura Video for Windows.
ActiveMovie 1.0 era un componente de software 32-bit que podía correr en NT User Mode tan bien como con Windows 95.
ActiveMovie 2.0 es el actual sistema que estamos empleando generalmente bajo la denominación DirectShow.
¿Cómo nació AVI?: Los archivos AVI son un caso especial de archivos RIFF (Resource Interchange File Format o Formato de Archivos para el Intercambio de Recursos) un formato de propósito general para el intercambio de datos multimedia que fue definido por Microsoft e IBM tiempo atrás.
De hecho RIFF es un clon del formato IFF inventado por Electronic Arts in 1984 para Deluxe Paint en plataforma AMIGA. IFF se erigió enseguida como un estándar de intercambio en esta plataforma y fue mantenido por Commodore hasta su desaparición. Al decidir Electronics Arts cambiar a la plataforma PC, trajo consigo el formato IFF.
¿Qué es un AVI?: AVI significa Audio Video Interleave o Audio y Vídeo Intercalado y fue desarrollado por Microsoft. "Intercalado" significa que en un fichero AVI los datos de audio y vídeo son almacenados consecutivamente en capas (un segmento de datos de vídeo es seguido inmediatamente por otro de audio). Es el formato más extendido para el manejo de datos de audio/vídeo en un PC. AVI es un ejemplo de un estándar "de facto".
En los primeros momentos de la popularización del DV doméstico existió mucha confusión sobre los tipos de AVI que empleaba la captura de vídeo digital (DV).Se ha hablado largo y tendido de AVI1 y AVI2 y en parte el error surgía de lo
103 comentado más arriba de mezclar la denominación del formato AVI con VfW y los codecs empleados para almacenar en dicho formato.
En algunos casos se hablaba de AVI 1 refiriéndose en orden cronológico al primer formato aparecido y AVI 2 al segundo. De ello se deducía erróneamente que el formato empleado para DV era AVI tipo 2 cuando en realidad dentro del segundo formato cronológicamente hablando, hay a su vez una división denominadas por la propia Microsoft como AVI DV Tipo-1 y AVI DV tipo-2, siendo las diferencias el tipo de codecs empleados para su manejo y la forma en que se guardan los flujos de datos internamente.
Así pues, ciñéndose a la realidad, sólo existen dos tipos generales de AVI, Los basados en Video for Windows (los primeros en aparecer) y los basados en DirectShow (originalmente ActiveMovie). Y como hemos dicho, un AVI no es más que un formato de archivo que puede guardar datos en su interior codificados de diversas formas y con la ayuda de diversos codecs que aplican diversos factores de compresión, aunque para liar la cosa aún más si cabe, también existe la posibilidad de almacenar los ficheros en un formato AVI "raw" o crudo, es decir, sin compresión y muchos fabricantes aportan su granito de arena con codecs que añaden más confusión a nuestra babel particular.
Los formatos de AVI basados en Video for Windos son los que ahora forman el núcleo de los denominados AVI DV Tipo-2 mientras que los basados en DirectShow (y por extensión en DirectX) son los denominados AVI DV tipo-1.
Dado que el interés se centra en la imagen digital no se seguirá profundizando en el formato AVI genérico para centrar en los métodos utilizados para almacenar datos de DV en archivos AVI. Simplemente se insiste en que un formato AVI para vídeo "analógico" puede usar muchos codecs, la elección del cual dará una calidad máxima determinada. Entre estos codecs aún es sencillo acceder a un
104 puñado a través de aplicaciones tan conocidas como Premiere 6 (con Cinepack Codec de Radius) o con Mediastudio 6 que da las opciones de Intel Indeo Video R3.2, Microsoft Vídeo 1, Microsoft RLE e Indeo Video 5.04. La mayoría de estos codecs consiguen compresiones muy altas pero de una calidad bastante pobre siendo el mejor posiblemente el Cinepack Codec. También existe la posibilidad de crear AVI a partir de tarjetas que capturan utilizando codecs MJPEG con un resultado bastante bueno.
De todas formas hay que añadir que el tamaño del flujo de datos que aporta el vídeo analógico exige dispositivos de captura y ordenadores en general con mayor capacidad que los necesarios para la captura y edición DV que, paradójicamente, aporta mucha mejor calidad.
Video for Windows: Como ya se vió Video for Windows (VfW) versión 1.0 fue lanzada en noviembre de 1992 para el sistema operativo Windows 3.1 y fue optimizado para capturar imagen en movimiento a disco. Desde entonces, las posibilidades de la captura han crecido espectacularmente debido al uso de nuevos buses PCI, nuevos controladores de bus, nuevos formatos Wide SCSI, y transferencia directa del vídeo capturado de la memoria del adaptador al disco y por supuesto las tarjetas firewire y la tecnología DV.
Por diversos motivos técnicos y algunas deficiencias de la arquitectura del sistema sacadas a la luz en especial con la aparición de la videoconferencia y la convergencia PC/TV, se hizo necesario el desarrollo de una nueva tecnología de captura de vídeo.
La arquitectura VfW fallaba en puntos importantes referidos a la videoconferencia, visionado de televisión, captura de campos de vídeo y otros referidos a los flujos de datos como el intervalo de refresco vertical. Algunos fabricantes han añadido extensiones propietarias para evitar estas limitaciones pero, sin interfaces
105 estandarizadas, los programas que usan estas posibilidades deben incluir códigos específicos para el hardware. La estrecha relación entre los drivers de captura de VfW y los de visionado significa que un cambio realizado en el driver de captura implica un cambio en los de visionado también.
Los drivers VfW continúan apareciendo en los sistemas operativos con dispositivos que son principalmente usados para capturar vídeo debido a la larga lista de aplicaciones que aún lo utilizan. Para apoyar a estos dispositivos, VfW sigue presente en Windows 98, ME, Windows 2000, y Windows NT. Sin embargo, la dependencia hacia VfW está declinando rápidamente por tres rezones principales:
• Windows Direct Media proporciona un apoyo óptimo a los dispositivos de captura usados para visionado de TV, videoconferencia y DV.
• DirectShow proporciona mucha más funcionalidad y flexibilidad.
• Microsoft no desarrollará mejoras en VfW.
Así se puede deducir que el formato AVI DV tipo-2 basado en VfW es en realidad una actualización o puente pensado para apoyar ciertas aplicaciones proporcionando compatibilidad hacia atrás y permitirles aprovechar el potencial del DV pero está condenado a desaparecer o al menos a quedarse estancado.
Tipos de Media admitidos por VfW : Audio, Vídeo, Texto y MIDI
Algunos "viejos" codecs de vídeo: Aunque ya están ampliamente superados y generalmente en desuso, muchos de estos codecs aún aparecen en aplicaciones actuales de edición.
106 TABLA 9: CODECS PROS Y CONTRAS
Codec Pros Contras (Uso principal)
Funciona en una gran variedad No trabaja bien por debajo de los 30 KB/s Cinepak de máquinas y suele dar una alargándose la compresión y perdiendo calidad CD-ROM video calidad aceptable. de imagen.
Eidos Escape Alta calidad de vídeo y Los data rates elevados requieren ordenadores CD-ROM video compresión rápida. potentes. (4x)
Superior a Cinepak en algunos Indeo 3.2 No muy eficaz para Web, provoca "artefactos" aspectos, la compresión es CD-ROM video de color y necesita más CPU que Cinepak algo más rápida
Indeo Video Muy Buena calidad de imagen y Solo utilizable con procesadores potentes de Interactive 4, 5 opciones interactivas Pentium en adelante. No utilizable en otras CD-ROM video adicionales. plataformas.
Microsoft Run No tiene una relación compresión/calidad tan Length - buena como Cinepak Encoding
Microsoft Video - Baja calidad 1
Basado en estándares de red . H.261 calidad de imagen en WWW Normalmente peor que H.263 WWW decente.
MJPEG Al 100% de calidad la Necesita mucha potencia de CPU, Las Edición de degradación de la imagen es imagenes de tamaños grande o alta calidad no vídeo mínima. corren suavemente sin hardware especial.
Pocos requisitos para IMA reproducción. Suele funcionar Data rates relativamente elevados. CD-ROM correctamente.
107 DirectShow para DV: DirectShow permite el acceso completo a los archivos Tipo- 1 y Tipo-2 en lectura y escritura (incluido la codificación y descodificación de vídeo digital)
El filtro " DV splitter " de DirectShow puede ser usado para separar el flujo DV intercalado en pistas de video y audio que pueden ser escritas en un archivo AVI, produciendo un archivo AVI DV tipo-2. Sin embargo hay que tener presente que este tipo de datos de video no es utilizable por aplicaciones basadas en VfW sin la presencia de un codec DV VfW. Microsoft no proporciona este codec y no tiene pensado desarrollarlo en un futuro.
El filtro DirectShow " DV Mux " puede ser usado para multiplexar un flujo de vídeo codificado como DV con audio en PCM para crear un flujo de DV intercalado. El resultado puede ser almacenado como un archivo AVI, produciéndose un AVI DV tipo-1 o puede ser enviado a una combinación de filtros de render y dispositivos para transmitirlo a un dispositivo DV.
El filtro DirectShow " DV Encoder " puede ser usado para codificar datos de vídeo en un formato de compresión DV para almacenamiento o transmisión a dispositivos DV. El filtro DirectShow " DV Decoder ", de forma resumida, puede ser usado para descodificar video con compresión DV y crear un vídeo DV no comprimido para el visionado o procesado posterior, tal como una compresión a un formato diferente.
En resumen, el sistema actual proporcionado por Microsoft (DirectShow) es más flexible pero causa problemas con aplicaciones basadas en VfW. Para estas aplicaciones se hace imprescindible el uso de captura en formato AVI DV tipo-2 o su reconversión posterior.
108 Veremos ahora casos prácticos de integración a diferentes niveles entre el software de edición y las tarjetas firewire.
1394 y DV: Integración de aplicaciones de Edición No Linear ( Non-Linear Editing Application -NLE-) y DV : Normalmente, una tarjeta firewire o IEEE-1394 trabaja con una aplicación de edición no linear del tipo de Adobe Premiere, Ulead VideoStudio, Ulead VideoStudio, Vegas Video... El grado de integración entre el hardware y software varía de un producto a otro.
Se podrían definir tres casos básicos de integración entre las firewire y una aplicación dada.
Ejemplo A: Sencillo, compatible pero sin integración:
Los vídeo clips DV son "capturados" (transferidos) por una aplicación independiente (por ejemplo DV-IO) desde un dispositivo DV (normalmente una cámara DV o un VCR DV) a través de una tarjeta IEEE-1394. Estos archivos multimedia son después importados a una aplicación de edición no linear en la que son editados en un nuevo proyecto. El proyecto resultante es renderizado o exportado como uno o varios archivos multimedia tipo AVI DV o QuickTime DV. Estos archivos son devueltos al dispositivo DV usando una utilidad reproductora independiente del programa de edición que acompaña a la tarjeta firewire.
Ejemplo B: Integración con sistemas de Edición No Linear abiertos:
Estos sistemas se caracterizan por el uso de plug-ins para integrar el hardware DV/IEEE-1394 con software específico de edición no linear (Premiere 6, Mediastudio 6...). En estos sistemas los clips de DV vídeo son "capturados" del dispositivo DV en formato AVI o QT por la aplicación de edición o asociada. Posteriormente, estos archivos multimedia son editados como una nueva película.
109 La banda editada resultante es entonces volcada de regreso al dispositivo DV desde la línea de tiempos de la aplicación usando un plug-in tipo "Print to DV" que admite y reconoce a la tarjeta IEEE-1394. De forma alternativa el proyecto puede ser renderizado o exportado a archivos multimedia estándar. Dado que estos sistemas están basados en programas de edición no lineal con posibilidades de extensibilidad abiertas y archivos multimedia estándar, se puede utilizar otra tarjeta firewire o programa de edición posteriormente que use el mismo sistema.
Ejemplo C: Integración con sistemas de Edición cerrados:
En este caso los video clips DV son "capturados" del dispositivo reproductor al programa editor en archivos basados en codecs propietarios (Canopus, Avid...). Estos archivos son editados en un nuevo proyecto. El resultado es entonces enviado de nuevo desde la línea de tiempos al dispositivo grabador DV usando la característica "Print to DV". En otros casos los nuevos archivos generados pueden ser renderizados o exportados por la aplicación.
La principal diferencia en este caso es que los clips DV no se almacenan en formatos DV estándar (p.e. AVI o QuickTime). Esto limita la posibilidad de usar fácilmente estos clips en otras aplicaciones que sólo acepten formatos estándar o sus propios formatos.
Sin embargo, por lo general los programas de edición tienen la posibilidad de exportar en formato AVI o QT si es necesario. Y aunque el trabajo esté realizado en este tipo de programas no hay que preocuparse excesivamente. En su favor hay que decir que dado que estos sistemas no se ciñen a los estándares, pueden, por lo general, evitar algunas de las limitaciones de los otros sistemas tales como los 9 minutos (2 GB) o 19 minutos (4 GB) máximos de tamaño de clip. Los programas de edición de estos sistemas cerrados normalmente está integrado de forma muy especial con el hardware IEEE-1394. Esta integración puede limitar las
110 futuras elecciones de captura con un programa diferente o, en el mejor de los casos, se podrá utilizar un programa de edición típico de estos equipos cerrados con otra tarjeta firewire en la forma descrita en el caso A (captura con una utilidad independiente y volcado similar) con lo que se perdería la ventaja de la integración que hace interesante el ejemplo de los equipos cerrados.
Características IEEE 1394/DV :Captura integrada: Algunas tarjetas permiten la captura de clips a través de los programas de edición mientras que otras requieren el uso de utilidades independientes. Para programas de edición basados en archivos de media estándar normalmente no hay mucha diferencia en la práctica. Una excepción puede ser que uno quiera usar alguna cualidad específica del programa de captura y edición como capturar cuadros congelados por ejemplo. Otra excepción posible es la expuesta en el ejemplo C donde los clips están capturados en formatos de archivo propietarios para poder eludir la limitación de tamaño de los AVI y QT estándar.
"Print to DV" desde la línea de tiempos: Algunas tarjetas permiten la función de volcado a cámara desde la línea de tiempos (print to DV). Esta función permite volcar directamente el proyecto editado a el dispositivo DV (cámara o VTR) sin necesidad de renderizar previamente. Las tarjetas que permiten esta función en ocasiones suelen simplemente no grabar los trozos de vídeo que excedan los límites físicos de 2 o 4 gigas. Por ello cuando estos archivos son mayores es necesario renderizar en uno o varios clips separados y volcarlos de forma separada y normalmente manual.
Reproducción en un dispositivo DV mientras se edita o visiona: Mientras que todos los codecs DV pueden reproducir la salida de imagen en el monitor del PC (el desktop o escritorio virtual), algunos pueden también mostrar esa imagen de forma simultánea o alternativa a través del puerto IEEE-1394 en el dispositivo DV
111 (Monitor de la cámara). Esta opción facilita el visionado de los previos en una pantalla PAL o NTSC y como el dispositivo DV puede descodificar fácilmente los datos DV se podrán ver el previo en resolución completa desde el programa de edición incluso cuando nuestro ordenador no tenga potencia suficiente para descodificarlo a esa resolución.
Reproducción fluida en el ordenador: Hay varios factores que limitan la ejecución de descodificación DV en la pantalla del ordenador (Visionado a tamaño completo y framerate completo).
La calidad de ejecución de DV está determinada por la velocidad a la que el ordenador pueda leer, descodificar y reproducir frames en datos tipo DV. Además ha de tener el trabajo añadido de reproducir los datos de audio.
El primer paso es probablemente el más sencillo, dado que los flujos de datos DV tienen una velocidad constante de transferencia de 3.6 MB/s. Esto no es mucho para la mayoría de los discos duros modernos que tienen los PC. Un problema que se puede presentar es que algunos puerto EIDE y algunos sistemas RAID-0 basados en software requieren parte del procesado a través de la CPU. Por ello, tales sistemas ocultan potencia de la CPU a otras partes del proceso de reproducción DV, en especial de a descodificación. Otras alternativas tales como UltraWide o Ultra2Wide SCSI con controladores bus-mastering y RAID-0 por hardware están diseñados para provocar el mínimo impacto en la CPU, pero estos sistemas son caros y seguramente fuera de las posibilidades de la mayoría de los usuarios "de a pie". La capacidad de entrada/salida de los discos duros no es el factor más importante en la capacidad de reproducción DV.
El segundo paso es la descodificación de los datos DV. En esencia, en este proceso se descodifican los frames de datos DV "crudo" (raw) a imágenes de
112 datos RGB de 720x576 (PAL). Aquí parecen estar las mayores diferencias de rendimiento entre los diferentes codecs y subsistemas de video disponibles.
Los diferentes codecs tratan de conseguir el mejor rendimiento posible usando varios métodos. Algunos son más rápidos porque su código ha sido optimizado para alto rendimiento, otros usan las instrucciones extendidas presentes en algunas CPU (p.e. las MMX de Intel) para mejorar la velocidad de descodificación.
Muchos codecs DV tienen opciones para manejar la reproducción para optimizarla. Pueden acelerar la representación en pantalla utilizando atajos tales como descodificar sólo a media resolución (Microsoft™DirectShow) o usando un algoritmo menos preciso (Apple QuickTime DV). Tales opciones a menudo llegan a dar resultados aceptables.
El tercer paso de la reproducción de DV es mostrar las imágenes RGB de tamaño completo en la pantalla una velocidad apropiada. Tradicionalmente esto se logra moviendo las imágenes rasterizadas RGB que han sido descodificadas de cada cuadro al buffer o memoria de almacenamiento intermedio de la pantalla. Este transporte de imagen se denomina "bit blit". La rapidez con la que el sistema lo pueda efectuar es la principal determinante de la calidad de reproducción del vídeo que puede alcanzarse. Si un sistema no puede realizar esta operación con la suficiente rapidez se producirán saltos en la imagen. Esta operación exige también un esfuerzo a la CPU. A 25 frames por segundo hay unos 30 megas de datos moviéndose a través del bus al la memoria de video de la placa cada segundo.
Algunas tarjetas de video tienen un sistema que usa un hardware especializado para el overlay de los datos RGB en el escritorio de Windows en un buffer separado (crean una capa específica para esta reproducción) Esto puede acelerar bastante la reproducción al necesitar un uso menor de la CPU y la imagen no ha
113 de moverse a la memoria. Pero para que esto sea posible, debe estar permitido por el driver de la tarjeta de vídeo, el subsistema de vídeo y el codec DV. No está claro, por ejemplo que QT para Windows tenga estas posibilidades por ejemplo.
Otros codecs: Por muchos es conocida la existencia de codecs alternativos a los proporcionados por Microsoft con sus sistemas operativos. Por citar algunos podríamos hablar del Codec DV de MainConcept o del de Canopus. Estos Codecs parecen tener en la mayoría de los casos mejores rendimientos que los originales. Una explicación plausible, en el caso de ser cierto, es que la mayoría de estos desarrollos están diseñados y optimizados para su uso con equipos específicos de captura y edición y no necesitan la ubicuidad imprescindible en desarrollos como los que componen Windows Direct Media que han de estar abiertos a su uso cruzado con aplicaciones tan dispares como la videoconferencia, streaming, captura de TV, captura de vídeo, edición y otras posibilidades presentes y futuras. En el caso de poder utilizar estos codecs en nuestro equipo, es importante señalar que posiblemente estemos añadiendo calidad o velocidad por un sitio y quitando funcionalidades por el otro.
Límites de tamaño de los archivos: Cuando trabajamos con video digital a menudo hay que manejar con archivos AVI de varios gigas de tamaño. Sin embargo hasta hace relativamente poco los sistemas no estaban diseñados para manejar tales tamaños y por ello muchas personas han tenido y tienen problemas para la creación de archivos AVI de larga duración.
Los límites más comunes en la actualidad son los 2 y 4 gigas. Estas barreras están causadas por dos factores: Los límites del formato AVI estándar y el sistema de archivos del sistema operativo.
114 Límites de formato estándar de archivos AVI:
Como se ha dicho, muchas aplicaciones, especialmente las más antiguas, usan arquitectura basada en Video for Windows, lo que limita el tamaño de los archivos AVI a 2 GB. Los AVI estándar pueden llegar hasta los 4 gigas usando otros sistemas como DirectShow.
Límites del sistema de archivos:
Para poder almacenar (y encontrarlos posteriormente) archivos en el disco duro, el ordenador usa un sistema de archivos. Dependiendo del sistema operativo, hay varios sistemas que se pueden usar. En la tabla vemos los máximos tamaños de archivo permitidos para cada sistema.
Tabla 10. Límites del sistema de archivos
Windows 95 Windows 95 OSR2+, Sistema Windows NT 4.0 Windows 2000 (pre-OSR2) Windows 98/SE/ME
FAT16 2 GB 2 GB 4 GB 4 GB
FAT32 N/A 4 GB N/A 4 GB
NTFS N/A N/A ilimitada * ilimitada*
DirectShow para Windows 98, Windows ME y Windows 2000: Para sacar ventaja de las entradas de video analógicas y digitales de las tarjetas capturadoras (DV, S-video, Composite or TV-Tuner), Microsoft ofrece el filtro DirectShow con DirectX 8.0 SDK. Esto da a los desarrolladores una interface programable para el hardware de captura de vídeo. Este SDK puede ser usado en la mayoría de las tarjetas actuales.
115 Usando Microsoft DirectShow se puede:
• Crear un video en una aplicación Windows
• Crear un programa de captura
• Interactuar con otras posibilidades de las tarjetas
MPEG: El formato MPEG (Moving Picture Experts Group) es un standard para compresión de video y de audio. Al ser creado se establecieron 4 tipos de MPEGs, MPEG-1, MPEG-2, MPEG-3 y MPEG-4. Cada uno de estos según su calidad. De aquí nace el popular formato MP3 para audio y también se habla de que el MPEG- 4 que es el de mayor compresión le da vida al DivX explicado a continuación.
DVD y MPEG-2 son palabras que se están poniendo muy de moda. Por un lado, las dos plataformas digitales de TV transmiten con este formato. Por otro, los lectores de DVD, tanto domésticos como para ordenador, y las películas DVD están en plena expansión. Como formato digital, está relacionado con el DV. Además, el formato DV es un formato de captura y edición, mientras que el DVD (MPEG-2) es el formato de almacenamiento por excelencia. Lo que viene a continuación es, como siempre, un extracto de artículos sacados de la web.
Una cadena MPEG se compone de tres capas: audio, video y una capa a nivel de sistema. Esta última incluye información sobre sincronización, tiempo, calidad. 41
MPEG-1: Establecido en 1991, se diseñó para introducir video en un CD-ROM. Por aquel entonces eran lentos, por lo que la velocidad de transferencia quedaba limitada a 1.5 Mbits y la resolución a 352x240. La calidad es similar al VHS. Se usa para videoconferencias, el CD-i, etc. Si es usado a mayor velocidad, es capaz de dar más calidad.
41 http://www.maestrosdelweb.com/editorial/videofor 29 Agosto 2006 5:00 Pm
116 MPEG-2: Establecido en 1994 para ofrecer mayor calidad con mayor ancho de banda (típicamente de 3 a 10 Mbits). En esa banda, proporciona 720x486 píxeles de resolución, es decir, calidad TV. Ofrece compatibilidad con MPEG-1.
MPEG-3: Fue una propuesta de estándar para la TV de alta resolución, pero como se ha demostrado que MPEG-2 con mayor ancho de banda cumple con este cometido, se ha abandonado.
MPEG-4: Está en discusión. Se trata de un formato de muy bajo ancho de banda y resolución de 176x144, pensado para videoconferencias sobre Internet. Realmente está evolucionando mucho y hay fantásticos codificadores soft que dan una calidad semejante al MPEG-2 pero con mucho menor ancho de banda. Es la última moda.
JPEG: Joint Photographic Experts Group. Como su nombre indica es un sistema de compresión de fotografías. Muchos de los sistemas de compresión de vídeo, tal como el M-JPEG (motion JPEG) Cinepak e Indeo, se basan en él. Consideran el vídeo como una sucesión de fotografías. MPEG introduce la noción de movimiento de una manera mucho más compleja y agresiva el M-JPEG.
La compresión MPEG-2: Bueno, vamos con él. La compresión intraframe trata cada fotograma como una foto independiente, mientras que la interframe, usada por MPEG, crea fotogramas de referencia para luego comparar los anteriores o posteriores con él. Sólo las diferencias son almacenadas. Por tanto el codec no tiene que almacenar cada fotograma, sino lo distintivo con el anterior.
En MPEG se distinguen tres tipos de fotogramas: I o intraframes, P o foto predicha y B o frames bidirecionales. Las I son los únicos fotogramas completos en una cadena MPEG. Contienen pues una información completa, lo que las convierte en posibles puntos de acceso aleatorio. La P es una frame basada en una anterior
117 pero conteniendo sólo las diferencias. Están muy comprimidas. Las B se referencias tanto a una anterior como a una futura y son las que menos ocupan. Nunca se usan como referencia para otras.
Las técnicas de compresión son dos: Compensación de movimientos (Motion Compensation) y redundancia espacial. La primera determina cómo las frames P o B se relacionan con los fotogramas de referencias. El primer paso es dividir cada imagen en bloques de 16x16 píxeles que se comparan con bloques equivalentes en otro fotograma. Si son similares se obtiene una buena compresión. Si se detecta movimiento en el bloque se almacena un "vector de movimiento". El otro método, redundancia espacial, comprime aún más describiendo las diferencias entre bloques. Usando un proceso matemático llamado Discrete Cosine Transform (DCT), los macro bloques son divididos aún más en bloques de 8x8 que hacen un seguimiento de los cambios de color y brillo en el tiempo.
Se denomina GOP a la mínima cadena MPEG completamente decodificable por sí sola. Por tanto debe tener una frame I y sus referenciadas P o B. Este concepto es importante en el campo de la edición.
El audio : Tema controvertido y confuso durante cierto tiempo. Originariamente había dos propuesta: para el mercado americano el sistema elegido fue el Dolby Digital. Para el europeo el sistema sería el MPEG-2 LII Audio. Finalmente se ha impuesto el Dolby Digital para todo el mundo. En cualquier caso, todo decodificador debe obligatoriamente soportar, al menos, el sistema Dolby Digital. Las diferencias entre ambos son pequeñas o nulas desde el punto de vista del usuario: soportan el sistema de altavoces llamado 5.1 (cinco canales y un subwoofer). Pero claro, a la industria americana no le interesa tener que hacer diferentes versiones o formatos. Evidentemente, para películas antiguas que no lleven el sonido en Dolby Surround, se emplean una o dos pistas de sonido PCM.
118 Una gran ventaja del DVD es la presencia de bandas sonoras y subtítulos en varios idomas, permitiendo cualquier combinación de ellos
¿Qué es el DVD? " Digital Versatil Disc". Es el nuevo formato de distribución de películas de vídeo (y datos en general). Tiene el mismo tamaño que un CD-ROM pero su capacidad de almacenamiento va de los 4.5GB hasta los 17GB dependiendo de si se usan una o dos capas / una o dos caras. En un disco de simple cara/simple capa cabe una película de duración normal. El sistema de compresión de las imágenes es el MEPG-2.
DivX: En estos días todo trata de compresión y el DivX es una gran alternativa para esta tarea. Con mucha gente trabajando en sus diferentes codecs el DivX se ha vuelto muy popular y está bastante relacionado con los DVDs y su piratería, ya que con dicho formato mucha gente se ha dado a la tarea de pasar sus DVDs a CDs con una calidad aceptable de video.
¿Qué es el DivX?: Técnicamente, DivX es un formato de codificación de video que funciona sobre Windows 9x y NT y que, combinado con la compresión de audio MP3, consigue una alta calidad de imagen superior a la del VHS con un caudal inferior a 1 Mbit/s. Traducido a su aplicación práctica, esto permite tener una película de un poco más de dos horas en el espacio de un solo CD-Rom convencional. Como contrapartida, los únicos inconvenientes son técnicos: hace falta un equipo moderno -en torno a los 400 Mhz-, con una cantidad de memoria RAM suficiente para la ejecución de los programas de cualquier suite ofimática actual.
La primera consecuencia es clara: cualquier ordenador que cuente con una unidad DVD-Rom entre sus componentes (el 90% de los DVD en están instalados en ordenadores multimedia) y se arme de un poco de paciencia, podrá generar un fichero de video y audio de unos 600 megabytes y grabarlo en un soporte (CD-
119 Rom) cuyo costo y tiempo de duplicación es, en ambos casos, insignificante, y por supuesto inferior al costo de cualquier DVD o sistema VHS.
Historia: del DVDForum al primer DivX: ¡y eso es precisamente lo que se quería evitar al crear el estándar! Para evitar este tipo de prácticas se sacrificó cualquier oportunidad legal del uso del DVD como un sistema de grabación doméstico, y para ello se introdujeron todo tipo de trabas y restricciones que no hicieron sino enturbiar el mercado y ralentizar la introducción masiva del DVD en el mercado doméstico.
El nacimiento del DVD ya fue problemático y provocó serias disputas entre las empresas tecnológicas y las de producción de contenidos, y en ocasiones incluso dentro de ambos grupos. Tras varios años de discusión y elaboración del estándar (a través del DVD Forum) se alcanzaron una serie de compromisos entre todas las empresas involucradas, compromisos que bien podrían ser calificados de torpes o malintencionados. Se establecieron diversas zonas de comercialización cuyos productos eran incompatibles entre sí y fragmentaban un mercado que debería ser mundial debido a las características propias del DVD (múltiples montajes, idiomas y subtítulos) para rentabilizar los ciclos de distribución de los distintos mercados. Esta característica fracasó desde el primer momento por las iniciativas piratas (y a veces desde la propia industria) de usuarios en desacuerdo con que se coartase la libertad de mercado. Además, el principal mecanismo de protección contra copia, el denominado CSS, estaba basado en la colaboración de los fabricantes de reproductores y en la ocultación como mecanismo de seguridad.
Como alternativa fallida frente al DVD se creó el DivX, un disco cuyo funcionamiento expiraba a las 48 horas y permitía su "recarga" para poder visualizar las películas durante más tiempo. El nuevo estándar, promovido por los
120 videoclubs americanos, fue un auténtico fracaso, y en cierto modo el nombre de la alternativa "hacker" se burla de aquel otro traspiés de la industria.
DeCSS: Desafortunadamente para el DVD Forum, uno de los fabricantes de software de reproducción se olvidó de encriptar su clave privada al registrarse en el sistema, provocando que con esa clave privada cualquiera pudiera desencriptar cualquier DVD de un modo sencillo, ya que el algoritmo de encriptación fue rápidamente descubierto por medio de la ingeniería inversa. La ruptura de este sistema se produjo rápidamente, pero debido a que quien había producido y distribuido el código se ocultaba tras pseudónimos crackers no despertó ningún tipo de medida legal, medidas que cayeron brutalmente sobre el primer desarrollador que puso en práctica los principios, válidos en Europa, de que los algoritmos no pueden ser patentados (como no se puede patentar el genoma humano) y publicó el código fuente de su programa desencriptador bajo su nombre real. El juicio a este incauto idealista está siendo costeado por la Asociación en favor de las libertades civiles Fronteras Electrónicas. El DeCSS permite, por lo tanto, el acceso libre a los contenidos de un DVD. Pero debido al bloqueo por parte del DVD Forum de formatos grabables del DVD no es posible la copia de estos contenidos de un modo sencillo y barato. Hasta que la tecnología superó a la industria.
El MPEG-4, un estándar por llegar: El MPEG-4 es el sucesor de los estándares MPEG-1 y MPEG-2 (utilizado en el DVD) de compresión de video, que permanece todavía en forma de borrador (bien es verdad que prácticamente definitivo) y que da un nuevo salto en el orden de magnitud en cuanto al ancho de banda -y por lo tanto, tamaño de almacenamiento- diseñado para obtener mejores rendimientos en el entorno de Internet fija y móvil. El hecho de no estar completamente finalizado ha provocado la aparición de versiones incompatibles de la implementación, entre ellas la de Microsoft que,
121 denominada MPEG-4V2, apareció temporalmente en su propia página web. Este CODEC (como se denomina a los filtros de codificación-decodificación) fue crackeado posteriormente por un grupo de desarrolladores independientes para mejorar sus características y estabilidad
Este es el CODEC que empieza a usarse masivamente en Internet y en círculos universitarios para producir una alternativa barata y prácticamente universal al DVD en la distribución de películas y otros contenidos de video.
¿Cómo se hace el DivX?: Esencialmente, los pasos son cuatro: Primero se ha de extraer del DVD el contenido original del disco mediante una herramienta desencriptadora como el DeCSS o similar. Tras ello, se debe recodificar el contenido de video en su formato original de MPEG-2 al del CODEC DivX. Esto nos generará un fichero AVI sin contenidos de audio.
Por lo tanto, el siguiente paso es convertir el contenido de audio original en codificación Dolby AC3 a formato MP3 de un modo análogo al anterior.
Finalmente, se han de mezclar ambas fuentes de información para producir un video en formato AVI con una calidad notablemente superior a la del video convencional.
Consecuencias: Cuando empresas e instituciones actúan de espaldas a los usuarios, situaciones como la actual tienden a ser la tónica en la Era Internet. No es la primera vez que esto sucede, ni probablemente será la última. La absoluta falta de previsión de las instituciones responsables, la utilización de absurdos mecanismos de protección y la incompetencia técnica, siempre tan irresponsable e ignorante de la realidad de la red, facilitan que los usuarios -que hoy ya ostentan el poder, mal que les pese a algunos- sean quienes tomen la iniciativa y creen vías
122 alternativas. El divorcio entre la industria y las personas no puede ser más evidente. Y como consecuencias, pocas cosas no obvias se pueden decir. El mercado del DVD, herido ya tras la desprotección del DeCSS, se encuentra ahora ante su declaración de obsolescencia, ya que se ha encontrado con que su antecesor (el CD-Rom), ya presa de un desenfrenado mercado pirata, es la alternativa válida, barata, de calidad y accesible para todos los usuarios. Que cada uno extraiga sus consecuencias, pero probablemente en los próximos meses proliferará el mercado pirata de películas en CD-Rom, el DVD se convertirá en la alternativa de "gama alta" del mercado y esto, o bien acabará con el DVD, o bien lo potenciará. Lo que sí queda claro es que la ignorancia y la falta de previsión de la industria cinematográfica, ya denunciada por algunos durante la elaboración del estándar, ha quedado más en evidencia que nunca.
De este modo, lo que pretendía ser una salvaguarda de la industria cinematográfica a costa de hurtar al usuario la posibilidad de seguir teniendo grabaciones domésticas y de la televisión, se ha convertido en un modo de permitir la piratería, sin que los usuarios hayan recuperado lo que les fue arrebatado en la elaboración del estándar
Formatos de Streaming para el Web: Actualmente hay 3 compañias que están esforzándose en presentar las mejores propuestas:
Microsoft Windows Media Video : El windows Media video es una de las últimas propuestas de Microsoft que funciona con el Windows Media player de la versión 6.2 en adelante. Ha tenido gran impulso debido al XP y que viene integrado en dicho sistema operativo. También tiene una opción para streaming que viene incluida en el Windows 2000 Server. Las extensiones de este tipo de contenidos son las .asf y .wmv para el video y .wma para el audio. Ofrece el player y su
123 encoder de forma gratuita a todos los interesados. Premier y Vegas también tienen opción de generar este tipo de contenidos.
Real Video : Real en los pasados años fue muy utilizado para streaming de audio en diversos medios. También tiene una propuesta para video llamada Real Video. Requiere de su propio player que es el Real Player (Recientemente fue lanzado el Real One) y para hacer streaming requiere del Real Server. Premier y Vegas traen opción para generar este tipo de archivos. En el sitio de Real también hay información para convertir archivos .avi a este formato. Real siempre tiene una versión simple y limitada de sus productos y una profesional que debe ser comprada.
Formato Real Video: Real video es el equivalente para las secuencias de imágenes a Real Audio para el sonido. Con el mismo reproductor Real Player, tenemos acceso a los ficheros sonoros RA y a los ficheros de vídeo RM. A la hora de generar los ficheros de vídeo se emplea un codificador diferente, que en este caso se denomina Real Publisher.
Imagen 31: Real Video
124 Se puede a partir de ficheros AVI como inicio, o bien grabar directamente desde la cámara de vídeo, aunque en este caso se necesita un ordenador suficientemente potente para poder comprimir en tiempo real la entrada de vídeo que está recibiendo de forma simultánea por la cámara. La compresión al formato RM permite definir que cantidad de bits por segundo se dedica al audio y cuantos al vídeo. Puede codificarse un vídeo con 20 Kbits por segundo, con lo cual un modem convencional de 33.6 es capaz de recibir la secuencia en tiempo real. En la práctica la calidad de este supuesto es muy baja, con tamaños de ventanas del orden de 160x120, y totalmente insuficiente para transmitir secuencia de video de casos microscópicos. Si disponemos de una conexión RDSI (con 2 canales) podemos disminuir el grado de compresión hasta situarlo en torno a unos 100 Kbps, con lo que la calidad del vídeo es muy superior. Y si no necesitamos transmisión en tiempo real, sino que grabamos una secuencia que será descargada desde el servidor web, para ser reproducida al termino de la descarga; los requerimientos de compresión pueden adaptarse a niveles de calidad asumibles que permitan diagnósticos microscopicos. En la práctica esto será siempre con compresiones a partir de 300 Kbps.
A continuación se muestran como ejemplo dos secuencias de vídeo comprimidas con Real Video a 300 y 200 Kbits por segundo respectivamente. Pertenecen al caso 2 del Poster 024 del Congreso. El fichero AVI original ocupa 100 Mb y en versión comprimida 3,43 Mb.
Apple Quicktime : Apple también tiene una interesante opción nativa de los sistemas Mac. Sus archivos .mov requieren de un player especial que es el Quicktime player para visualizarlos. Este player tiene una versión sencilla gratuita y una versión profesional que entre otros permite realizar videos en dicho formato y editar algunas cualidades de los mismos.
125 Ofrece dos alternativas de servidores web. El Darwind Streaming Server y el Quicktime Server, ambos para plataformas Mac. Su codec es muy utilizado para presentar películas cortas y previews de los últimos lanzamientos de hollywooed por su calidad, aunque el tamaño es más pesado que otros formatos. En el sitio de Quicktime hay una amplia galería de cortos y videos para explorar.
Lo más tedioso del encoding final es que un proyecto muy grande demandará mucho tiempo de codificación. Siempre recordemos que todos los días terminan con una larga noche y también tenemos a los fines de semana para cuando el proyecto sea muy grande. La velocidad de la codificación está dada por el procesador y memoria de su máquina como ya hemos comentado anteriormente.
6.2.11 METADATOS “DUBLÍN CORE”
La "Dublín Core Metadata Initiative" (Iniciativa de Meta Datos Central de Dublín, en traducción literal) es una organización dedicada a promover la adopción universal de estándares de meta datos ínter operables y a desarrollar vocabularios especializados de meta datos, para describir recursos que permitan sistemas de acceso a la información más inteligentes.
Su nombre proviene de que el encuentro original sobre este tema se realizó en Dublín, Ohio (Estados Unidos) en 1995 donde OCLC (Online Computer Library Center) y NCSA (National Center for Supercomputing Applications), convocaron en Dublín, Ohio, a 52 investigadores expertos en el campo de la bibliotecología, ciencias de la computación, codificadores de textos y áreas afines, al Metadata Workshop, con el objetivo de hacer un avance en el desarrollo de registros descriptivos de recursos de información on line. Han habido cinco versiones desde
126 1995, siendo la última en septiembre de 1997 donde se ha formalizado el formato que se describe a continuación. 42
CARACTERÍSTICAS GENERALES: Las características que postulan al Dublín Core como un sistema para ser adoptado en la descripción de recursos electrónicos recaen en varias categorías: • Simpleza: El Dublín Core está diseñado para ser utilizado tanto por personas sin conocimientos de catalogación, como por catalogadores con experiencia en el uso de modelos de descripción de recursos tradicionales. La mayoría de los 15 elementos que componen Dublín Core, tienen una semántica que puede ser descrita como el equivalente a un registro catálogo. • Interoperabilidad Semántica : En el ámbito de Internet, los distintos métodos para describir meta data, interfieren con la capacidad de buscar traspasando los límites de los formatos. Promover el uso de un conjunto de descriptores que ayude a unificar y estandarizar el contenido de los datos, aumenta la posibilidad de interoperabilidad semántica de las disciplinas. • Consenso Internacional: El consenso internacional sobre la necesidad de mejorar la recuperación de Webs es fundamental para el desarrollo de una infraestructura eficaz para esa recuperación. En la estructuración del Dublín Core han participado activamente países tales como Reino Unido, Australia, Suecia, Dinamarca, Noruega, Finlandia, Alemania, Francia, Tailandia, Japón, Canadá y Estados Unidos. • Flexibilidad: Aunque es motivado inicialmente por la necesidad de la descripción de recursos por los autores-generadores de cada sitio, el Dublín Core tiene suficiente flexibilidad como para codificar adicionalmente,
42 http://es.dublincore.org 3 Septiembre 2006 7:00 Pm
127 estructuras con semántica más elaboradas que puedan ser aplicadas en la descripción de recursos tradicionales. • Modularidad de Metadata en la WEB: La amplia diversidad de meta data en el Web, requiere de un medio ambiente que soporte la coexistencia de muchos desarrollos independientes y la manutención de paquetes de meta data. El Núcleo de Dublín apunta específicamente a la recuperación de recursos, pero se desarrollarán distintos campos para ser utilizados en otros ámbitos, administrativo, judicial, etc. • Arquitectura de Metadata para la Web: El World Wide Web Consortium (W3C) es el foro principal en los estándares para la Web, y ha comenzado recientemente a centrarse en la configuración de una arquitectura de meta data para la Web. El Resource Description Framework o RDF, se está desarrollando para sustentar diversas necesidades de meta data que tienen proveedores y vendedores de información. Los representantes del Núcleo de Dublín están implicados activamente en el desarrollo de esta configuración, aportando la perspectiva de la biblioteca digital, en el desarrollo de esta arquitectura.
¿CÓMO FUNCIONAN?: El Dublín Core (Núcleo de Dublín) es un conjunto de 15 elementos propuestos para facilitar la búsqueda de Recursos Electrónicos. Originalmente fue desarrollado para que el autor-generador de un sitio Web lo describiera, sin embargo ha atraído la atención de instituciones como museos y bibliotecas, que son por excelencia las autoridades en el tema de la descripción. Los metadatos que cumplen con el estándar Dublín Core se caracterizan por usar las iniciales DC. Estas propiedades incluyen entre otras: título, autor, descripción, tema, editor, tipo de recurso, fecha de publicación, idioma, formato, documentos relacionados y derechos de autor, entre otros.
128 El conjunto del elemento de Metadata de la base de Dublín es un conjunto de meta data previsto para describir documentos o el documento como los objetos (Por Ejemplo correspondencias, fotos, música). Define los atributos siguientes:
Título (el título del recurso) Autor o creador (los autores del recurso) Subject y claves (el asunto del recurso) Descripción (A más larga, textual, descripción del recurso) Editor (el editor de la versión electrónica del recurso) Otros colaboradores (otros contribuidores al recurso) Fecha (la versión electrónica de la fecha del recurso fue hecha disponible) Tipo del recurso (categoría del recurso, por ejemplo novela, informe técnico) Formato (formato de datos del recurso, por ejemplo HTML, posdata) Identificador del recurso (identificador de la extracción) Fuente (fuente de la cual la versión electrónica fue derivada) Lengua (lenguaje del recurso) Relación (lazos con otros recursos) Cobertura (cobertura geográfica o temporal del recurso) Derechos (conexión a la información en cuanto a propiedad)
Cada elemento es opcional y puede repetirse. Además, los elementos pueden aparecer en cualquier orden. Aunque algunos entornos, como HTML, no diferencian entre mayúsculas y minúsculas, es recomendable escribir correctamente cada metadato, según su definición, para evitar conflictos con otros entornos, como SGML y XML
Los atributos de la base de Dublín pueden contener una combinación de palabras, de números, de símbolos y de otros caracteres.
129 Los elementos poseen nombres descriptivos que pretenden transmitir un significado semántico a los mismos. Para promover una interoperabilidad global, una descripción del valor de algunos elementos podrá ser asociada a vocabularios controlados. Se asume que otros vocabularios controlados serán desarrollados para asegurar esta interoperabilidad en dominios específicos. Cada elemento es opcional y puede repetirse. Además, los elementos pueden aparecer en cualquier orden. Aunque algunos entornos, como HTML, no diferencian entre mayúsculas y minúsculas, es recomendable escribir correctamente cada meta data según su definición para evitar conflictos con otros entornos, como XML (Extensible Markup Language) Se puede clasificar estos elementos en tres grupos que indican la clase o el ámbito de la información que se guarda en ellos: Elementos relacionados principalmente con el contenido del recurso Elementos relacionados principalmente con el recurso cuando es visto como una propiedad intelectual
Elementos relacionados principalmente con las instancias del recurso
Propiedad Contenido Instanciación Intelectual
Titulo Creador Fecha
Palabras Claves Editor Tipo de Material
Descripción Colaboradores Formato
Fuente Derechos Identificador
Lenguaje
Relacion
Cobertura
130 DESCRIPCIÓN DE LOS ELEMENTOS:
1. Título. Etiqueta: "Title" El nombre dado a un recurso, en general por el autor o editor. 2. Autor o Creador. Etiqueta: "Creator" Persona u organización responsable de la creación del contenido intelectual del recurso. Por ejemplo: los autores en el caso de documentos escritos, artistas, fotógrafos e ilustradores en el caso de recursos visuales. 3. Materias y Palabras Claves. Etiqueta: "Subject" Los temas del recurso. Generalmente el Subject expresará las palabras claves o frases que describen el tema o contenido del recurso. Se fomenta el uso de vocabularios controlados y de sistemas de clasificación formales. 4. Descripción. Etiqueta: "Description" Descripción textual del contenido de un recurso. Incluye un resumen en el caso de un documento textual o una descripción del contenido en el caso de un documento visual. 5. Editor. Etiqueta: "Publisher" Entidad responsable de que el recurso se encuentre disponible en la red en su formato actual, por ejemplo una empresa editora, un departamento universitario u otro tipo de organización. 6. Otros Colaboradores. Etiqueta: "Contributor" Persona u organización que haya tenido una contribución intelectual significativa en la creación del recurso pero cuyas contribuciones son secundarias en comparación a las de las personas u organizaciones especificadas en la etiqueta "Creator". Por ejemplo, editor, ilustrador o traductor. 7. Fecha. Etiqueta: "Date" Fecha asociada a la creación o disponibilidad del recurso. Esta fecha no debe confundirse con la etiqueta "Coverage", que sería asociada con el recurso sólo
131 en la medida en que el contenido intelectual está de algún modo relacionado con esa fecha. Se recomienda la utilización de uno de los formatos definidos en el documento "Date and Time Formats", basado en la norma ISO 8601, disponible en el sitio de W3C Technical note, http://www.w3.org/TR/NOTE-datetime. Incluye, entre otras, fechas en el formato YYYY y YYYY-MM-DD. De esta forma la fecha 1994-11-05 correspondería al 5 de Noviembre de 1994. 8. Tipo del Recurso 43 . Etiqueta: "Type" La categoría del recurso, por ejemplo Home Page, novela, poema, documento de trabajo informe técnico, ensayo, diccionario. Para asegurar la interoperabilidad, "Type" debería ser seleccionado de entre una lista enumerada que actualmente se encuentra en desarrollo en uno de los grupos de trabajo. 9. Formato. Etiqueta: "Format" La etiqueta "format" de un recurso es usado para identificar el software y posiblemente, el hardware que se necesitaría para desplegar u operar el recurso. Para asegurar la interoperabilidad, "format" debería ser seleccionado de entre una lista enumerada que actualmente se encuentra en desarrollo en uno de los grupos de trabajo. 10. Identificador del Recurso. Etiqueta: "Identifier" Secuencia de caracteres usados para identificar unívocamente un recurso. Ejemplos para recursos pueden ser URLs y URNs (cuando estén implementados). Para otros recursos pueden ser usados otros formatos de identificadores, tales como Internacional Standard Book Number - ISBN. 11. Fuente. Etiqueta: "Source" Información sobre un segundo recurso del cual deriva el recurso que está siendo descrito. A pesar de que generalmente se recomienda colocar
43 http://dublincore.org/documents/dcmi-type-vocabulary Agosto 12 del 2006. 6:30 Pm
132 información del recuso que se está describiendo, este elemento puede contener información de fechas, autor, identificadores, u otros meta datas del segundo recurso si se considera relevante para la recuperación del recurso descrito. Por ejemplo, es posible usar Source con la fecha de 1603 en la descripción de una película filmada en 1996, aunque, en tal caso es preferible usar la etiqueta "relation": "IsBased On" con una referencia a otro recurso cuya descripción contiene el elemento "Date" 1603. 12. Lengua. Etiqueta: "Language" Idioma del contenido intelectual del recurso. Prácticamente el contenido de este campo debería coincidir con los de la RFC 1766, Tags para la identificación de lenguas. Ejemplo: en, es, de, fi, ja y zh. 13. Relación. Etiqueta: "Relation" Identificador de un segundo recurso y su relación con el recurso actual. Este elemento permite enlazar los recursos relacionados y las descripciones de los recursos. Por ejemplo: IsVersionOf Incluye la edición de un trabajo IsBasedOn Traducción de un trabajo IsPartOf Capítulo de un libro IsFormatOf Mecanismo de transformación de un conjunto de datos en una imagen Para asegurar la interoperabilidad, "format" debería ser seleccionado de entre una lista enumerada que actualmente se encuentra en desarrollo en uno de los grupos de trabajo. 14. Cobertura. Etiqueta: "Coverage" Características de cobertura espacial y/o temporal del contenido intelectual del recurso. La cobertura espacial se refiere a una región física (por ejemplo, sector terrestre); uso de coordenadas (eje.: longitud y latitud) o nombres de lugares extraídos de una lista controlada.
133 La cobertura temporal se refiere a los períodos que abarca el contenido del recurso, en lugar de a cuando fue creado o puesto disponible en la red. Esto último pertenece a la etiqueta "Date". Se recomienda la utilización del mismo formato de la etiqueta "date" . "Date and Time Formats", basado en la norma ISO 8601, disponible en el sitio de W3C Technical note. 15. Derechos. Etiqueta: "Rights" Mención de los derechos de autor (copyright), un identificador que enlace (URL, por ejemplo) a una nota sobre derechos de autor, a un servicio de gestión de derechos o a un servicio que dará información sobre términos y condiciones de acceso a un recurso.
CODIFICACIÓN DE LOS ELEMENTOS DE DUBLÍN CORE: Como se señaló anteriormente, Dublín Core se basa en 15 etiquetas. En general antes de comenzar la codificación se debe tener en cuenta lo siguiente: Los elementos poseen nombres descriptivos que pretenden transmitir un significado semántico a los mismos, además de una etiqueta formal representada en una palabra, tendiente a hacer más sencilla la especificación sintáctica de los elementos para su codificación. Cada elemento es opcional y puede repetirse. Además, los elementos pueden aparecer en cualquier orden. Indispensable es en la creación de meta data el uso de esquemas formales y tradicionales en la descripción. Específicamente, Library of Congress Subject Headings (LCSH) para codificación de subjects y otras normas referentes a países, idiomas, etc. A nivel general, una entrada Dublín Core dentro de HTML tiene la siguiente sintaxis: donde 'NombreElemento' y 'Valor' se sustituirían respectivamente por uno de los 15 elementos y su valor. Por ejemplo:
134 La sigla DC, corresponde a la identificación del formato que se está utilizando para la descripción: DC = Dublín Core Luego debemos colocar la etiqueta correspondiente al elemento que deseamos describir: "DC.Creator" El atributo CONTENT se usa para describir el valor del elemento, en el ejemplo, es el autor Universidad de Chile.
Ejemplo práctico
“Este ejemplo que tiene varios faltantes con el propósito de no hacer demasiado compleja la información (relacionados con control de caché, tablas de caracteres, robots son algunos de los omitidos), sirve para ejemplificar algunos de los meta del sistema Dublín Core aplicados en un encabezamiento y pueden ser comparados con otros meta datos de contenido idéntico y uso mucho más corriente que dicho sea de paso, pueden emplearse complementando a este nuevo sistema.
135 “
6.2.12 PHP
“PHP es un lenguaje interpretado de alto nivel embebido en páginas HTML y ejecutado en el servidor. La mayor parte de su sintaxis ha sido tomada de C, Java y Perl con algunas características especificas de si mismo. La meta del lenguaje es permitir rápidamente a los desarrolladores la generación dinámica de paginas ” [PHP] Inicialmente fue desarrollado para la creación de aplicaciones web exclusivamente. Actualmente es posible desarrollar aplicaciones de escritorio con PHP-GTK. Fue creado en 1994 por Rasmus Lerdorf. El crecimiento del uso de PHP por parte de la comunidad de programadores ha sido exponencial desde su creación. En el año 2002 ya era utilizado por más de nueve millones de programadores de todo el mundo, en la actualidad son más de veinte millones. Las siglas de PHP, inicialmente significaban Personal Home Page (página de inicio personal), pero se cambiaría posteriormente de acuerdo con la convención de designación de GNU pasando a significar, PHP Hipertext Preprocessor. 44
44 www.programacion.com/php/articulo 15 Septiembre 2006 5:40 Pm
136 Algunas características de PHP son:
• Multiplataforma. • Ofrece un alto rendimiento. • Conectividad con un número amplio de sistemas de bases de datos: InterBase, mSQL, MySQL, Oracle, Informix, PosgreSQL, entre otras. • Es un lenguaje de carácter libre. Al ser un producto de código abierto, PHP goza de la colaboración de un número amplio de programadores, que encuentran y modifican rápidamente los errores. • Sintaxis sencilla, lo que proporciona gran facilidad a la hora de aprender el lenguaje y su posterior utilización. • Portabilidad. El código escrito en PHP en una máquina y en un sistema operativo es válido en cualquier otro sistema operativo y en cualquier otra máquina. No es necesario reescribir el código. • Gran cantidad de librerías disponibles. Muchas de estas bibliotecas son proporcionadas por desarrolladores sin ánimo de lucro.
6.2.13 PHP5
PHP 5 es la evolución de PHP, se trata de la última versión de este lenguaje de programación. La principal característica es que es orientado a objetos, esto supone todas las grandes ventajas del paradigma orientado a objetos: herencia, polimorfismo, facilidad de reutilización del software
Novedades de PHP 5:
• Herencia. • Polimorfismo. • Clases abstractas.
137 • Interfaces. • Objetos por referencia. • Clonación de objetos. • Identificadores de visibilidad: public, private, y protected. • Tratamiento de excepciones.
6.2.14 ¿POR QUÉ ELEGIR PHP 5?
De acuerdo a las encuestas de NetCraft, PHP es ahora el módulo más popular para el servidor Apache, creciendo un 4% mensual sobre la totalidad de sitios de Internet. Aquí contamos algunas de las razones por la cual PHP se ha convertido en uno de los lenguajes de script más populares.
• UN POCO DE HISTORIA
PHP (siglas que originalmente significaban Personal Home Page) fue primero escrito por Rasmus Lerdorf como un simple conjunto de scripts de Perl para guiar a los usuarios en sus páginas. Luego para satisfacer inquietudes del mismo tipo por parte de otra gente lo reescribe, pero esta vez como un lenguaje de script agregándole entre otras características soporte para formularios. Al ver como la popularidad del lenguaje aumenta, un grupo de desarrolladores crea para él un API, convirtiéndose así en el PHP3. Fue en ese momento cuando el parser de scripts PHP es completamente reescrito (el Zend Engine) dando vida al PHP4 mucho mas rápido, tal y como lo conocemos en la actualidad. 45
PHP actualmente significa Hypertext Preprocessor y esta listo para su mejor momento.
45 www.programacion.com/php/articulo 15 septiembre 2006 8:00 Pm
138 • COSAS PARA TENER EN CUENTA EN UN LENGUAJE DE SCRIPTS
Las cuatro grandes características: Velocidad, estabilidad, seguridad y simplicidad.
• Velocidad: No solo la velocidad de ejecución, la cual es importante, sino además no crear demoras en la máquina. Por esta razón no debe requerir demasiados recursos de sistema. PHP se integra muy bien junto a otro software, especialmente bajo ambientes Unix, cuando se configura como módulo de Apache, esta listo para ser utilizado.
• Estabilidad: La velocidad no sirve de mucho si el sistema se cae cada cierta cantidad de ejecuciones. Ninguna aplicación es 100% libre de bugs, pero teniendo de respaldo una increíble comunidad de programadores y usuarios es mucho mas difícil para lo bugs sobrevivir. PHP utiliza su propio sistema de administración de recursos y dispone de un sofisticado método de manejo de variables, conformando un sistema robusto y estable.
• Seguridad: El sistema debe poseer protecciones contra ataques. PHP provee diferentes niveles de seguridad, estos pueden ser configurados desde el archivo .ini
• Simplicidad: Se les debe permitir a los programadores generar código productivamente en el menor tiempo posible. Usuarios con experiencia en C y C++ podrán utilizar PHP rápidamente.
Bueno otra característica a tener en cuenta seria la conectividad. PHP dispone de una amplia gama de librerías, y agregarle extensiones es muy fácil. Esto le permite al PHP ser utilizado en muchas áreas diferentes, tales como encriptado, gráficos, XML y otras.
139 • VENTAJAS ADICIONALES DE PHP
Las siguientes son algunas ventajas de php 5:
• PHP corre en (casi) cualquier plataforma utilizando el mismo código fuente, pudiendo ser compilado y ejecutado en algo así como 25 plataformas, incluyendo diferentes versiones de Unix, Windows (95,98,NT,ME,2000,XP,bla,bla,bla) y Macs. Como en todos los sistemas se utiliza el mismo código base, los scripts pueden ser ejecutados de manera independiente al OS. 46
• La sintaxis de PHP es similar a la del C, por esto cualquiera con experiencia en lenguajes del estilo C podrá entender rápidamente PHP. Entre los lenguajes del tipo C incluimos al Java y Javascript, de hecho mucha de la funcionalidad del PHP se la debe al C en funciones como fread() o srtlen(), así que muchos programadores se sentirán como en casa.
• PHP es completamente expandible. Está compuesto de un sistema principal (escrito por Zend), un conjunto de módulos y una variedad de extensiones de código.
• Muchas interfaces distintas para cada tipo de servidor. PHP actualmente se puede ejecutar bajo Apache, IIS, AOLServer, Roxen yTHTTPD. Otra alternativa es configurarlo como modulo CGI.
• Puede interactuar con muchos motores de bases de datos tales como MySQL, MS SQL, Oracle, Informix, PostgreSQL, y otros muchos. Siempre podrás disponer de ODBC para situaciones que lo requieran.
• Una gran variedad de módulos cuando un programador PHP necesite una interfase para una librería en particular, fácilmente podrá crear una API para esta. Algunas de las que ya vienen implementadas permiten manejo de
46 www.programacion.com/php/articulo 15 septiembre 2006 8:00 Pm
140 gráficos, archivos PDF, Flash, Cybercash, calendarios, XML, IMAP, POP, etc.
• Rapidez. PHP generalmente es utilizado como modulo de Apache, lo que lo hace extremadamente veloz. Esta completamente escrito en C, así que se ejecuta rápidamente utilizando poca memoria.
• PHP es Open Source, lo cual significa que el usuario no depende de una compañía específica para arreglar cosas que no funcionan, además no estás forzado a pagar actualizaciones anuales para tener una versión que funcione. Muchos de nosotros que hemos esperado que Allaire arregle algo apreciamos esto. 47
• ALGUNAS CONTRAS
El manejo de errores no es tan sofisticado como Cold Fusion o ASP.
No existe IDE o Debugger. Una IDE puede no ser importante para la mayoría de los programadores y un debugger ha sido prometido por Zend Tech para un futuro muy cercano.
• ¿CUÁNDO SE DEBE UTILIZAR PHP Y CUÁNDO SE DEBE UTILIZAR OTRO LENGUAJE?
Si se está desarrollando bajo una plataforma UNIX o Linux, se debe elegir entre Perl y PHP, ambos excelentes. Para mucha gente PHP es más simple a la hora de escribir scripts, haciéndolo más productivo en proyectos no tan grandes. ¡Claro que no existe razón para no tener PHP y Perl al mismo tiempo!
En ambientes Windows compite muy de cerca con ASP y Cold Fusion, aquí la elección se basa en asuntos un poco más técnicos y en la política que desee
47 www.programacion.com/php/articulo 15 septiembre 2006 8:00 Pm
141 utilizarse para el sitio. ASP junto a IIS es probablemente más estable que PHP con IIS. Pero en términos puramente técnicos, PHP bajo Windows NT es mucho más estable que los otros dos (además de ser más rápido y utilizar menos recursos). De cualquier manera ASP ofrece una mejor integración con este ambiente sobre todo si se desea utilizar COM.
6.2.15 ASP y ASP.NET
Active Server Pages (ASP), es un lenguaje de script de Microsoft del lado del servidor que permite desarrollar páginas web dinámicas. ASP ha pasado por cuatro iteraciones mayores, ASP 1.0 (distribuido con IIS 3.0), ASP 2.0 (distribuido con IIS 4.0), ASP 3.0 (distribuido con IIS 5.0) y ASP.NET (parte de la plataforma .NET de Microsoft). Las versiones pre-.NET se denominan actualmente (desde 2002) como ASP clásico . [WIK]. Los servidores que soportan este lenguaje son de la familia de Windows NT: Personal Web Server (PWS) e Internet Information Server (IIS).
ASP.NET es la nueva versión de ASP disponible con la plataforma .NET de Microsoft. La arquitectura ha sido rehecha desde cero para facilitar al máximo la creación de aplicaciones web dinámicas, promoviendo una mejor reutilización y compartición del código. Una de las principales características de esta nueva versión de ASP es el soporte de múltiples lenguajes compilados (Visual Basic, C++ o C# entre otros). La primera vez que se solicita un página es compilada y almacenada en memoria caché, de tal forma que las siguientes peticiones serán atendidas de forma más rápida, esto produce un incremento del rendimiento.
142 Al poder emplear diferentes lenguajes, como C++, C#, Visual Basic .NET es posible el desarrollo de aplicaciones bajo el paradigma de la orientación a objetos y por tanto la posibilidad de realizar un diseño multicapa. 48
6.2.16 JSP
Java Server Pages (JSP) es otro de los lenguajes de programación para la generación de sitios web dinámicos desarrollado por Sun Microsystems. Existe la posibilidad de integrar JSP con clases Java, lo que permite separar en diferentes capas las aplicaciones, teniendo desarrollado la capa de dominio en lenguaje Java puro y presentar los datos vía web con JSP. Además tiene la gran ventaja de ser multiplataforma, pudiendo funcionar sobre diferentes sistemas operativos, permitiendo la portabilidad de las aplicaciones desarrolladas y posee soporte para la conectividad con diferentes gestores de bases de datos. Los archivos JSP son muy similares a los servlets: es compilado la primera vez que es invocado y comienza a ejecutarse en el servidor como un servlet, proporcionando un alto rendimiento. El coste de desarrollo de aplicaciones JSP es bajo. La tecnología Java puede ser adquirida de forma gratuita de la página oficial de Sun Microsystems, si necesidad de la adquisición de licencias para el desarrollo. Como en cualquier otra aplicación web, deben implantarse en un servidor de aplicaciones. Tomcat es uno de los servidores más utilizados para aplicaciones JSP, incluye el compilador Jasper, que compila los JSPs convirtiéndolos en servlets. Tomcat está escrito en Java, por lo que funciona en cualquier sistema operativo que disponga de la máquina virtual de Java instalada. Tomcat está desarrollado y mantenido por los miembros de la Apache Software Foundation y voluntarios independientes. Cualquier usuario puede acceder de
48 www.programacion.com/php/articulo
143 forma libre al código fuente bajo los términos de la Apache Software Foundation. Las versiones más recientes son las 5.x, que implementan las especificaciones de Servlet 2.4 y de JSP 2.0. En las versiones 4.x, Jakarta Tomcat utiliza el contenedor de servlets.
6.2.17 CSS
CSS (Cascading Style Sheets), hojas de estilo en cascada, es un lenguaje formal definido como estándar [CSS03] para añadir información sobre el estilo de documentos HTML y XML. Existen dos versiones publicadas en W3C, CSS1 publicada en 1996 y CSS2 publicada en 1998. CSS1 está soportado por la mayoría de navegadores. CSS2 aporta nuevas funcionalidades con respecto a la primera versión y soporte para documentos XML, no todos los navegadores están preparados para su procesamiento. Las hojas de estilo son utilizadas por los diseñadores para definir el aspecto de la capa de presentación. Es posible definir la estructura del documento con etiquetas HTML y el aspecto visual con las hojas de estilo. La utilización de hojas de estilo simplifica el código HTML de tal forma que hace más fácil la búsqueda de errores y el depurado de las páginas. Para una misma aplicación web es posible utilizar diferentes hojas de estilo, adaptando la presentación a las necesidades del usuario. Por ejemplo para personas con deficiencias visuales, es posible crear hojas de estilo donde los elementos posean un tamaño mayor, mejorando de esta forma la accesibilidad. Las hojas se estilo están definidas mediante una serie de reglas en un fichero de texto plano. Cada una de estas reglas consta del tipo de elementos sobre el cual se desea definir un estilo y un conjunto de atributos con sus valores correspondientes. Los elementos sobre los que se pueden crear estilos, son aquellos que pertenecen a cualquier estructura de un documento: tablas, fuentes, capas, fondo del documento.
144 Es posible definir un estilo sobre un tipo de elemento de forma general, o bien crear varias clases de un mismo tipo de elemento. Una de las grandes ventajas que proporcionan las clases de estilos, es la herencia. Un elemento que se encuentre contenido en otro, puede heredar propiedades de estilo. Un ejemplo de definición general para un elemento sería: table{ color :black; font-size :12px; } Todas las tablas definidas en el documento HTML tendrían un borde de color negro y un tamaño de fuente de doce pixels. Para definir una clase de un tipo de elemento se especificaría el tipo de elemento seguido de un punto y el nombre de la clase: table.central{ border :1px solid #cccccc; font-size :12px; padding : 0px 0px 0px 0px; background-color :#ffffff; width :85%; margin-left :auto; margin-right :auto; } Para que una tabla tome las propiedades definidas en la clase “central” se definiría como: