Un Enfoque Semántico
Total Page:16
File Type:pdf, Size:1020Kb
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS DEPARTAMENTO DE CIENCIAS DE LA COMPUTACION BÚSQUEDA Y VISUALIZACIÓN DE IMÁGENES EN MEMORIA CHILENA: UN ENFOQUE SEMÁNTICO MEMORIA PARA OPTAR AL TITULO DE INGENIERO CIVIL EN COMPUTACION FELIPE IGNACIO SAAVEDRA CÉSPEDES PROFESOR GUIA: CLAUDIO GUTIERREZ GALLARDO MIEMBROS DE LA COMISION: CARLOS HURTADO LARRAIN SANTIAGO DE CHILE SEPTIEMBRE 2007 RESUMEN DE LA MEMORIA PARA OPTAR AL TITULO DE INGENIERO CIVIL EN COMPUTACION POR: FELIPE SAAVEDRA CESPEDES FECHA: 23/10/2007 PROF. GUIA: Sr. CLAUDIO GUTIERREZ. BÚSQUEDA Y VISUALIZACIÓN DE IMÁGENES EN MEMORIA CHILENA: UN ENFOQUE SEMÁNTICO La Web Semántica ha cambiado la forma de presentar los contenidos en la web. Ha logrado el desarrollo de nuevos estándares descriptores para los recursos presentados denominados metadatos, como también estructurarlos y relacionarlos. Esto ha permitido una ganancia en cuanto a expresividad de contenidos, a la vez de posibilitar su interacción tanto por la profundidad de las relaciones como por la interactividad lograda con el usuario. En la actualidad, se están utilizando metadatos principalmente como una manera de relacionar los recursos y almacenar mayor información descriptiva sobre recursos de distintas naturalezas (textos, multimediales, etc). Aún no resulta común encontrar aplicaciones que permitan al usuario interactuar directamente con las relaciones proporcionadas por el modelo de datos inherente de algún portal, y si se añade un interés especial en contenidos multimediales es aún menor. Un caso particular se encuentra en el sitio web de Memoria Chilena, cuyos contenidos presentan metadatos. En el siguiente trabajo se proporciona un enfoque para lograr explotar los metadatos y brindar mayor expresividad para el usuario final, con el motivo final de presentar recursos visuales que faciliten al usuario explorar contenidos y realizar búsquedas de contenidos. El trabajo se encuentra dividido en tres etapas de su desarrollo. En una primera instancia se presenta distintas soluciones para modelar los metadatos descriptivos de las imágenes presentadas de manera de permitir relaciones naturales existentes de la catalogación de estas. Luego se presenta una solución lógica para el manejo y la interacción de los metadatos, logrando ser lo más abstracto posible para obtener una solución generalizada. Finalmente se brinda la visualización de contenidos que interactúa con el modelo lógico anterior, mediante el uso de tecnologías neutrales. Resultado de este trabajo es posible concluir que el explotar los metadatos existentes en catalogaciones de contenidos, no tan sólo sirve para proporcionar un análisis general sobre ellos, sino también permite mediante tecnologías visuales, brindar mayor expresividad a estos contenidos, permitiendo encontrar conceptos de recursos relacionados que antes permanecían ocultos al usuario. Gracias a esto es posible no tan sólo reducir el tiempo de búsqueda para los usuarios, sino también cambiar la manera en que se realizan las búsquedas actualmente. ´Indice general 1. Introduccion´ 1 1.1. ConceptosB´asicos. ............. 4 1.1.1. MemoriaChilena ............................... ........ 4 1.1.2. ResourceDescriptionFramework(RDF) . ............... 4 1.1.3. DublinCoreMetadataInitiative(DCMI) . ................ 5 2. Problema 6 2.1. Motivaci´on.................................... ........... 6 2.2.Impacto ........................................ ........ 8 2.3. ObjetivosdelTrabajo . ............. 9 2.3.1. ObjetivoGeneral . ...... ...... ...... ...... ..... ......... 9 2.3.2. ObjetivosEspec´ıficos . ............ 9 2.4. PlandeTrabajo .................................. .......... 9 III ´INDICE GENERAL 3. Antecedentes 12 3.1. DatosGenerales................................. ........... 12 3.2. Estructuraci´onde datos enMemoriaChilena . ................... 15 3.3. DublinCoreMetadataInitiative(DCMI) . .................. 18 3.4. Visualizadores................................. ............ 20 3.5. Bibliotecas.................................... ........... 21 3.5.1. JRDF......................................... ..... 21 3.5.2. RDF2Go ....................................... ..... 21 3.5.3. JENA......................................... ..... 22 3.5.4. SESAME....................................... ..... 22 4. Solucion´ Propuesta 23 4.1. AspectosGenerales . ............ 23 4.2. ModeloL´ogicodeMetadatos . .............. 24 4.2.1. ErroresaConsiderar . .......... 25 4.2.2. EstructuradelosRecursos . ............ 27 4.2.3. Definici´ondelModelo. ........... 28 4.3. Exploraci´ondeMetadatos . .............. 38 IV ´INDICE GENERAL 4.3.1. LectorMetadatosRDF/XML . .......... 39 4.3.2. ManejadorOntolog´ıaDublinCore . .............. 40 4.3.3. ManejadordeModeloparaMemoriaChilena . .............. 41 4.4. Visualizaci´ondeMetadatos . ................ 41 4.4.1. Visualizaci´onEst´atica . ............... 42 4.4.2. Interacci´onconExplorador . .............. 43 5. Solucion´ Implementada 44 5.1. Obtenci´on y Creaci´on de Metadatos RDF/XML . .................. 44 5.1.1. ModeloRDF/XMLImplementado . .......... 46 5.1.2. CreadordeMetadatos . ......... 52 5.2. ExploradordeMetadatos . ............. 54 5.2.1. LectorMetadatosRDF/XML . .......... 55 5.2.2. ManejadordeOntolog´ıaDublinCore . .............. 55 5.3. VisualizadordeMetadatos . .............. 58 5.3.1. Interacci´onconExplorador . .............. 58 5.3.2. Visualizaci´on . .......... 60 6. Resultados Obtenidos y Esperados 62 V ´INDICE GENERAL 7. Conclusiones y Trabajo Futuro 65 7.1. TrabajoFuturo.................................. ........... 65 7.1.1. Visualizaci´on . .......... 65 7.1.2. Exploraci´on ................................. ......... 66 7.1.3. OtrasMejoras ................................. ........ 66 7.2. Conclusiones ................................... .......... 67 VI ´Indice de cuadros 5.1. Relaci´on existente entre Metadatos y Atributos de TablasenBD.................. 45 VII ´Indice de figuras 1.1. WebdeMemoriaChilena . ........... 4 2.1. Puntosimportantesenunab´usqueda . ................ 7 2.2. Visualizaci´on de una b´usqueda en Memoria Chilena . ..................... 8 2.3. Planificaci´ondeProyecto . ............... 10 2.4. Planificaci´ondeProyectoModificada . ................. 11 3.1. Modelo de b´usqueda cl´asico vs Modelo WIDE de b´usqueda .................... 12 3.2. EstructuradeMetadatosdeunaImagen . ................ 16 4.1. EsquemadelaSoluci´on. ............. 24 4.2. Esquema de la Soluci´on: Detalle de Generador de Metadatos ................... 25 4.3. EstructuradeRecursosdeMemoriaChilena . .................. 28 4.4. Modelo conceptual RDF de una Unidad Tem´atica . .................. 29 VIII ´INDICE DE FIGURAS 4.5. Modelo conceptual RDF de unDetalleTem´atico . .................. 29 4.6. ModeloconceptualRDFdeunaImagen . .............. 30 4.7. SegundomodeloconceptualRDF . ............. 34 4.8. TercermodeloconceptualRDF . ............. 37 4.9. Esquema de la Soluci´on: Detalle de Explorador de Metadatos ................... 39 4.10.PosiblePresentaci´onVisualdeDatos . .................... 42 4.11.Presentaci´onVisualdeDatosEsperada . ................... 43 5.1. ModeloVisualactual . ............ 61 6.1. Relaciones de pintores realistas chilenos por medio de im´agenes ................. 62 6.2. Secuencia de b´usqueda de relaciones de pintores realistaschilenos . 64 IX Cap´ıtulo 1 Introduccion´ La Web Sem´antica [TBLL01] es un concepto que ya lleva alg´un tiempo de vida y que ha ganado gran auge, siendo uno de los principales focos de inter´es para la implementaci´on futura de la web, y que ya en la actualidad, posee un gran n´umero de portales y aplicaciones adopt´ando sus est´andares. B´asicamente, la web sem´antica pretende superar las limitaciones de la actual implementaci´onweb, y para ello, resulta necesario la descripci´onde los contenidos (recursos disponibles en l´ınea) junto con sus existentes relaciones. De manera de satisfacer esta necesidad se han utilizado lenguajes descriptivos denominados ontolog´ıas. Estas han permitido descripciones de conceptos, ideas y recursos disponibles en la web con naturalezas muy variadas. Adicionalmente, resultado de la necesidad de automatizar y ser comprendidas por m´aquinas estas descripciones, se han generado est´andares para la descripci´onformal de recursos. Es as´ı, que el formato estandarizado en la actualidad se denomina RDF [Wor04a]. Este formato proporciona la estructura o sintaxis necesaria para la descripci´on sin ambig¨uedad, ya sea de recursos o relaciones. Con esto, dichas descripciones dan nacimiento a los denominados metadatos sem´anticos1 o simplemente los denominados metadatos a lo largo de este trabajo, con los cuales nos referimos a la capa de informaci´ondescriptiva de recursos web. 1´Indices descriptivos de los recursos que se˜nalan, basados en alguna ontolog´ıa y descritos utilizando el formato RDF 1 Es as´ı como en la actualidad ya se encuentran disponibles en la web, portales, aplicaciones, herramientas, etc., que permiten el manejo, presentaci´ony utilizaci´onde estos recursos con sus respectivos metadatos. Dentro de estos portales con metadatos descriptivos nos encontramos con Memoria Chilena2. Memoria Chilena es un sitio web, dependiente de la Biblioteca Nacional de Chile, que se encuentra dedicado a reunir la historia que conforma la identidad de nuestro pa´ıs. Dentro de la informaci´oncontenida por este portal, se encuentra una gran base de datos de im´agenes catalogadas, cuya descripci´onactualmente, puede ser rescatada en formato RDF y ser comprendida mediante la utilizaci´ondel