Documento Completo Descargar Archivo
Total Page:16
File Type:pdf, Size:1020Kb
Clasificación de las recomendaciones obtenidas del BlueFinder para la propiedad semántica birthPlace Lic. Andrea Noemí Alende Directora: Dra. Alicia Díaz Trabajo Final Integrador para obtener el grado de Especialista en Ingeniería de Software Facultad de Informática Universidad Nacional de La Plata Mayo, 2015 Resumen ikipedia es una gran enciclopedia editada colaborativamente por usuarios de todo el mundo. DBpedia es un proyecto desarrollado para extraer información estructurada de Wikipedia. La W información semántica extraída de facilita la búsqueda de información que en algunos casos no es posible obtener navegando por Wikipedia. Para resolver este gap de información entre la web semántica y la web social, podemos aplicar el algoritmo BlueFinder que devuelve un conjunto de recomendaciones en forma de caminos navegacionales para una propiedad semántica de DBpedia en Wikipedia. En este artículo se analizará el nivel de precisión de los resultados de la aplicación de dicho algoritmo. Se propondrá entonces una taxonomía que permita clasificar un conjunto de recomendaciones para luego determinar la validez de las mismas. Índice Resumen ........................................................................................................................................................ ii Índice ............................................................................................................................................................ iii Índice de Figuras ............................................................................................................................................ iv 1 Introducción ........................................................................................................................................... 2 1.1 Contexto ....................................................................................................................................................... 2 1.2 Objetivo ........................................................................................................................................................ 3 1.3 Estructura ..................................................................................................................................................... 3 2. Tecnologías Relacionadas ....................................................................................................................... 4 2.1. Web Semántica................................................................................................................................................. 4 2.1.1. Lenguajes de la Web Semanticá ......................................................................................................... 6 2.1.1.1. RDF - Resource Descripcion Framework ........................................................................................................... 6 2.1.1.2. RDFS – RDFS Schema. .......................................................................................................................................... 8 2.1.1.3. OWL Ontology Web Language ............................................................................................................................ 9 2.1.2. Lenguaje de Consulta – SPARQL ....................................................................................................... 10 2.2. Wikipedia ........................................................................................................................................................ 12 2.2.1. Recursos para estructurar información en Wikidata ...................................................................... 13 2.2.2. Infoboxes ............................................................................................................................................ 15 2.2.3. Categorías ........................................................................................................................................... 17 2.3. Dbpedia ........................................................................................................................................................... 20 2.3.1. Ontología de DBpedia ....................................................................................................................... 21 2.3.2. SPARQL endpoint ............................................................................................................................... 22 2.3.3. La importancia de DBpedia en el enfoque global de Linked Open Data ....................................... 24 3. BlueFinder ............................................................................................................................................ 28 3.1. Sistemas de recomendación basados en filtrado colaborativo ................................................................... 28 3.2. BlueFinder ....................................................................................................................................................... 30 3.3. Debilidades detectadas en BlueFinder .......................................................................................................... 34 3.3.1. Ejemplo 1 ............................................................................................................................................ 34 3.3.2. Ejemplo 2 ............................................................................................................................................ 35 3.3.3. Ejemplo 3 ............................................................................................................................................ 37 3.3.4. Ejemplo 4 ............................................................................................................................................ 39 4. Clasificación de las recomendaciones ................................................................................................... 42 4.1. Taxonomía propuesta .................................................................................................................................... 42 4.1.1. Clases Positivas .................................................................................................................................. 42 4.1.2. Clases Negativas ................................................................................................................................ 43 4.2. Descripción de la Metodología ...................................................................................................................... 44 4.3. Evaluación y análisis estadístico .................................................................................................................... 47 5. Conclusiones y Trabajos Futuros ........................................................................................................... 50 5.1. Conocimientos adquiridos ............................................................................................................................. 50 5.2. Conclusiones ................................................................................................................................................... 50 5.3. Trabajos futuros ............................................................................................................................................. 51 Referencias .................................................................................................................................................. 53 Índice de Figuras Logo de la Web Semántica y W3C ................................................................................................................................................. 5 Modelo de la Web Semántica propuesto por Tim Berners-Lee (Berners-Lee, Hendler, & Lassila, The Semantic Web, 2001) 5 Modelo de la Web Semántica propuesto por el W3C ................................................................................................................. 6 Wikipedia logo 2.0 - Wikimedia Foundation .............................................................................................................................. 13 "Wikidata-logo-en" by Planemad - Own work. Licensed under Public Domain via Wikimedia Commons ........................... 13 Los elementos y sus datos están interconectados. (Wikidata, 2015) ....................................................................................... 14 Este diagrama sugiere los términos más importantes que resultan interesantes en torno a Wikidata. (Wikidata, 2015) . 15 Ejemplo de Infobox del articulo Norwegian Lundehund en la Wikipedia en Ingles ................................................................ 16 La Categorización de artículos en Wikipedia y su modo de usarlo ........................................................................................... 18 Category:Milán ............................................................................................................................................................................ 18 Category:People from Milan ........................................................................................................................................................ 19 Category:People from Milan by occupation .............................................................................................................................. 19 Category: SportPeople from Milan ............................................................................................................................................