Interacting with Semantic Web Data Through an Automatic Information Architecture Josep Maria Brunetti Fernández
Total Page:16
File Type:pdf, Size:1020Kb
Nom/Logotip de la Universitat on s’ha llegit la tesi Interacting with Semantic Web Data through an Automatic Information Architecture Josep Maria Brunetti Fernández Dipòsit Legal: L.313-2014 http://hdl.handle.net/10803/131223 Interacting with semantic web data throught an automatic information architecture està subjecte a una llicència de Reconeixement-NoComercial-CompartirIgual 3.0 No adaptada de Creative Commons (c) 2013, Josep Maria Brunetti Fernández Universitat de Lleida Escola Polit`ecnicaSuperior Interacting with Semantic Web Data through an Automatic Information Architecture by Josep Maria Brunetti Fern´andez Thesis submitted to the University of Lleida in fulfillment of the requirements for the degree of Doctor in Computer Science Under supervision of PhD Roberto Garc´ıaGonz´alez Lleida, December 2013 Acknowledgments Voldria mostrar el meu agra¨ıment a totes aquelles persones que han col laborat d’una · manera o altra amb aquesta tesis. I despr´es d’escriure tantes p`agines en angl`es, voldria fer-ho en catal`a. Al cap i a la fi, si en aquesta mem`oria hi ha una petita part on puc expressar lliurement all`oque sento, ´es aqu´ı; i no tinc millor manera de fer-ho que en catal`a, perqu`e´es la meva llengua materna i ´es amb la que millor m’expresso. Tot i que alguns es capfiquin en canviar-li el nom o intentin reduir-ne el seu ´us, som moltes persones les que parlem en catal`a i seguirem fent-ho. Nom´es demanem que es respecti com qualsevol altra llengua. En primer lloc, el meu m´es sincer agra¨ıment al Roberto Garc´ıa, director d’aquesta tesis. Gr`acies per donar-me aquesta possibilitat, confiar en mi, aconsellar-me, guiar-me i a la vegada donar-me llibertat per tirar endavant les meves idees. Igualment, voldria donar les gr`acies a tots aquells amb els qui he treballat durant el desenvolupament d’aquesta tesis i que hi han contribu¨ıt: Juan Manuel Gimeno, Rosa Gil, Antonio L´opez i Jos´eLu´ıs Gonz´alez. Voldria donar les gr`acies de forma especial a la Ll´ucia Masip, companya de doctorat al grup i amiga, amb qui he compartit viatges, congressos, alegries i penes durant aquests anys. Sempre que he necessitat res o he tingut algun dubte amb algun tr`amit, nom´es he hagut de trucar a la porta del davant i preguntar. Sense tu tot aix`ohauria estat molt m´es dif´ıcil. A la resta de professors, estudiants i companys del grup GRIHO, gr`acies per acollir-me tan b´eal grup des del primer dia i fer que em sent´ıs com a casa. La llista de persones amb les que he compartit el dia a dia ´es molt llarga i no em voldria deixar a ning´u. Sobretot, gr`acies per ajudar-me en els moments dif´ıcils. No nom´es he tingut companys de feina, sin´oamics. A nivell econ`omic, aquesta tesis ha estat possible gr`acies a una beca predoctoral que em va atorgar la Universitat de Lleida. Igualment, he gaudit d’altres ajuts de la universitat que han perm`es financiar parcialment l’assist`encia a congressos i l’estada predoctoral que vaig realitzar a Leipzig. En aquest sentit, tamb´evoldria agrair a l’empresa GFT Group i en especial al Carlos Lozano el seu inter´es pel nostre treball i que ens convid´essin a assistir al CEBIT de Hannover. Tan de bo d’aquestes col laboracions en puguin sortir projectes interessants. · Igualment, part d’aquest treball aix´ıcom l’assist`encia a congressos ha comptat amb el suport del Ministerio de Ciencia e Innovaci´ona trav´es dels projectes OMediaDis (Open Platform for Multichannel Content Distribution Management, TIN2008-06228) i InDAGuS (Infrastructures for Sustainable Open Government Data with Geospatial Features, TIN2012- 37826-C02). Tot i aquest suport, s´ocuna de les moltes persones que s’han vist afectades per les retallades, la reducci´ode sous o l’augment del preu de les matricules de la universitat. Des d’aqu´ı, mostrar el meu rebuig total a les pol´ıtiques que s’estan duent a terme en ensenyament i investigaci´oen aquest pa´ıs. Es´ una llastima que el treball de molta gent quedi pr`acticament en un no-res per la falta de finan¸cament. Tan de bo ben aviat es pugui canviar aquesta tend`encia. 3 Vaig tenir l’oportunitat de fer una estada de tres mesos al grup AKSW de Leipzig on vaig poder treballar amb altres investigadors i estudiants en temes relacionats amb el d’aquesta tesis. Voldria agrair a S¨oren Auer la seva dedicaci´oi col laboraci´o,especialment en relaci´oa la · visualitzaci´ode dades enlla¸cades. Estic molt agra¨ıt pel temps que vaig passar a Leipzig i per tota la gent que hi vaig con`eixer, sens dubte va ser una gran experi`encia. Tamb´evull donar les gr`acies a Jakub Kl´ımek i Martin Neˇzask´y, de la Charles University de Praga, amb els qui tamb´ehem col laborat en aquesta tem`atica. · Durant aquest temps per la universitat he compartit esmorzar principalment amb dos bons amics. Al Francesc Guitart i C`esar Fern´andez, gr`acies per tot el temps i activitats que compartiu amb mi. Retrobar-me amb tot all`oque m’agrada ha estat una de les sorpreses m´es agradables d’aquests ´ultims anys. Tamb´evoldria mostrar el meu agra¨ıment a la Meritxell P´erez, amb qui he compartit el poc temps lliure que he tingut i m’ha donat suport en aquests ´ultims mesos m´es estressants. Finalment, voldria donar gr`acies als meus pares, germans i fam´ılia. S´onmolts anys els que porto davant d’una pantalla i tot i no entendre exactament a qu`eem dedico, sempre ho heu respectat i m’heu donat suport. Dif´ıcilment es poden resumir m´esde tres anys en un full de paper. Es´ molt d´ıficil donar les gr`acies a tanta gent i per tantes coses; per molt que escriv´ıs, mai seria suficient. A tots aquells que heu contribu¨ıt d’una manera o altra en aquesta tesis o que heu estat al meu costat durant tots aquests anys, moltes gr`acies de tot cor. M’enduc un munt d’amics i una pila d’experi`encies innoblidables: els aniversaris cel lebrats · a GRIHO, els kebabs del dijous, esmorzars i batalletes, viatges, congressos, ciutats que he conegut, una petita estada a Alemania... En el fons, s´onaquestes petites coses les que donen sentit a tot plegat i que fan aquests anys hagin estat, simplement, genials. I would like to acknowledge the people who somehow contributed to this work. First of all, I would like to thank my supervisor Dr. Roberto Garc´ıa for guiding me during this work and granting me the freedom to develop my research ideas. I would also like to express my gratitude to all the members of the GRIHO Group of the Universitat de Lleida whom I worked with and shared friendship. Financially, I was supported by a PhD grant from the Universitat de Lleida. This work was also partially supported by Spanish Ministry of Science and Innovation through research projects OMediaDis (Open Platform for Multichannel Content Distribution Management, TIN2008- 06228) and InDAGuS (Infrastructures for Sustainable Open Government Data with Geospatial Features, TIN2012-37826-C02). I had the opportunity to work for three months within the AKSW group at the University of Leipzig. I would like to thank Dr. S¨oren Auer, head of the group, who inspired me with ideas and guided me in some parts of these work, especially in the Linked Data Visualization Model. I am grateful for my time in Leipzig where I all the people I met there. Finally, I would also like to thank Jakub Kl´ımek and Martin Neˇzask´y, from the Charles University in Prague. Our collaboration with them lead to new ideas in the research topic of visualizing Linked Data. 4 Abstract The amount of semantic data available in the Web is rapidly increasing. The proliferation of Linked Open Data and other data publishing initiatives has increased the amount of data available for analysis and reuse. The potential of this vast amount of data is enormous but it results in the need for handling the Information Overload phenomenon. In most cases it is very difficult for users to explore and use this data, especially for those without experience with Semantic Web technologies. This is due to the lack of tools designed for end-users and the prevalence of specialised browsers that require complex queries to be formed and intimate knowledge on how datasets are structured. Our contribution in order to solve this problem is applying the Visual Information-Seeking Mantra: “Overview first, zoom and filter, then details-on-demand”, which is implemented using Information Architecture components users are already familiar with. Information Architecture is the discipline that organizes and labels the information on websites, analyzing the contents, organizing web pages and designing the navigation systems. This thesis o↵ers algorithms and methods to automatically generate and drive the information architecture components for websites based on Semantic Web data. These components are automatically generated from data and ontologies, what makes the proposed approach generic and scalable. First of all, users can obtain an overview of the dataset through di↵erent components: navigation menus, site map, site index or treemap. These components are useful for obtaining a broad view of the datasets, the main types of things they describe and how they are relate. They serve as a starting point for navigation.