Content Ontology Design Patterns Qualities, Methods, and Tools
Total Page:16
File Type:pdf, Size:1020Kb
“Dissertation” — 2017/8/15 — 10:53 — page i — #1 Linkoping¨ Studies in Science and Technology Dissertaons. No. 1879 Content Ontology Design Paerns: Qualies, Methods, and Tools by Karl Hammar Linkoping¨ University Department of Computer and Informaon Science Division of Human-Centered Systems SE-581 83 Linkoping,¨ Sweden Linkoping¨ 2017 \Dissertation" | 2017/8/15 | 10:53 | page ii | #2 © 2017 Karl Hammar Cover photograph by Jenny Hammar ISBN: 978-91-7685-454-9 ISSN: 0345{7524 URL: http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-139584/ Printed by LiU Tryck, Link¨oping2017 \Dissertation" | 2017/8/15 | 10:53 | page iii | #3 Abstract Ontologies are formal knowledge models that describe concepts and rela- tionships and enable data integration, information search, and reasoning. Ontology Design Patterns (ODPs) are reusable solutions intended to sim- plify ontology development and support the use of semantic technologies by ontology engineers. ODPs document and package good modelling practices for reuse, ideally enabling inexperienced ontologists to construct high-quality ontologies. Although ODPs are already used for development, there are still remaining challenges that have not been addressed in the literature. These research gaps include a lack of knowledge about (1) which ODP features are important for ontology engineering, (2) less experienced developers' prefer- ences and barriers for employing ODP tooling, and (3) the suitability of the eXtreme Design (XD) ODP usage methodology in non-academic contexts. This dissertation aims to close these gaps by combining quantitative and qualitative methods, primarily based on five ontology engineering projects involving inexperienced ontologists. A series of ontology engineering work- shops and surveys provided data about developer preferences regarding ODP features, ODP usage methodology, and ODP tooling needs. Other data sources are ontologies and ODPs published on the web, which have been studied in detail. To evaluate tooling improvements, experimental ap- proaches provide data from comparison of new tools and techniques against established alternatives. The analysis of the gathered data resulted in a set of measurable quality indicators that cover aspects of ODP documentation, formal representation or axiomatisation, and usage by ontologists. These indicators highlight qual- ity trade-offs: for instance, between ODP Learnability and Reusability, or between Functional Suitability and Performance Efficiency. Furthermore, the results demonstrate a need for ODP tools that support three novel prop- erty specialisation strategies, and highlight the preference of inexperienced developers for template-based ODP instantiation|neither of which are sup- ported in prior tooling. The studies also resulted in improvements to ODP search engines based on ODP-specific attributes. Finally, the analysis shows that XD should include guidance for the developer roles and responsibilities in ontology engineering projects, suggestions on how to reuse existing ontol- ogy resources, and approaches for adapting XD to project-specific contexts. iii \Dissertation" | 2017/8/15 | 10:53 | page iv | #4 \Dissertation" | 2017/8/15 | 10:53 | page v | #5 Popul¨arvetenskaplig sammanfattning De senaste tv˚adecennierna har anv¨andningen av Internet och dess killer app World Wide Web (i dagligt tal webben) ¨okat explosionsartat, s˚av¨alvad g¨aller antal anv¨andaresom antal tillg¨angligatj¨anster.Vi surfar inte l¨angrebara p˚a webben f¨oratt s¨oka efter information { snarare lever vi i allt h¨ogreutstr¨ack- ning v˚araliv uppkopplade via den. Vi handlar mat och g¨orbank¨arenden,vi bokar semestrar och l¨aserb¨ocker, vi delar bilder och videos och minnen med varandra. I de flesta avseenden har webben och dess m¨ojligheterutvecklats l˚angtbortom vad de flesta trodde var m¨ojligt. I andra avseenden har vi dock bara skrapat p˚aytan. Webben ¨arfort- farande i huvudsak ett medium f¨orkommunikation m¨anniskor emellan. Det inneh˚allsom publiceras p˚awebben, oavsett om det ¨ari text-, bild-, eller videoformat, ¨artill st¨orredel of¨orst˚aeligtf¨orprogramvara { det ¨aravsett f¨or konsumtion av m¨anniskor, som tolkar, f¨orst˚ar,och eventuellt agerar p˚adet. Om webbinneh˚alli st¨alletkunde tolkas och f¨orst˚asmaskinellt av mjukvaror, s˚askulle det m¨ojligg¨oram¨angder av innovativa nya integrerade tj¨ansteroch produkter: intelligenta mobila agenter skulle kunna svara p˚aanv¨andarens fr˚agorgenom att l¨asaoch f¨orst˚ainformation publicerat p˚awebben, snarare ¨anatt bara svara vad de blivit programmerade till; information fr˚anolika f¨oretagseller myndigheters webbsidor skulle enkelt kunna samk¨oras,s˚aatt till exempel kunder enkelt kan j¨amf¨oraliknande produkter eller tj¨anster hos olika webbhandlare; rapportering fr˚anolika nyhetssajter skulle kunna j¨amf¨orasmaskinellt f¨oratt detektera olika tolkningar eller vinklingar p˚a det rapporterade materialet, etc. Visionen av den h¨arframtida webben d¨ar m¨anniskor och maskiner delar information p˚aett s¨oml¨ostoch integrerat s¨att har ett namn: den Semantiska Webben. F¨oratt m¨ojligg¨oraden Semantiska Webben s˚akr¨avsatt deltagande m¨anniskor och system kommer ¨overens om och standardiserar kommunika- tion p˚atv˚aolika niv˚aer:dels p˚aformat- och syntaxniv˚a,och dels p˚akon- ceptuell definitionsniv˚a.Den f¨orstaniv˚anr¨ordet rent tekniska informations- utbytet mellan system f¨orolika sorters data (textstr¨angar,siffror, bilder, etc.). Parallellt med och p˚agrund av Internets och webbens framv¨axts˚ahar ett flertal standarder etablerats kring dessa format f¨ordatarepresentation v \Dissertation" | 2017/8/15 | 10:53 | page vi | #6 och -utbyte, vilka fungerar v¨al¨aven f¨oren Semantisk Webb. P˚aden senare niv˚an,standardiseringen av formella definitioner f¨orde ting som system och m¨anniskor skall kunna kommunicera om (de semantiska ontologierna), finns det betydligt mer kvar att g¨ora. En stor utmaning ¨aratt konstruktionen av dessa ontologier ¨arf¨orh˚allande- vis komplex och kr¨aver kunskaper som f˚aprogrammerare eller analytiker be- sitter { de beh¨over ha djupg˚aendef¨orst˚aelsef¨oralla de koncept som de vill f˚angaoch formalisera definitioner av (produkter, h¨andelser,organisationer, processer, etc), de beh¨over ha stor erfarenhet av konceptuell modellering, och de beh¨over k¨annatill de relativt komplicerade format och verktyg som anv¨andsf¨oratt konstruera ontologier. Designm¨onsterf¨orontologier (Ontology Design Patterns, eller ODP:er) ¨aravsedda att f¨orenklautvecklingen av ontologier. ODP:er beskriver, i text och i bild, vanligt f¨orekommande modelleringsproblem och etablerade l¨osningarp˚adessa problem. En ODP kan till exempel beskriva hur man b¨astmodellerar h¨andelser,oaktat vilken typ av h¨andelse(en konsert, ett kurstillf¨alle,en flygresa, etc.) det r¨orsig om. ODP:er brukar, ut¨over sagda beskrivning, ¨aven best˚aav en liten och ˚ateranv¨andbarbit ontologi-kod, som en utvecklare enkelt kan anpassa och ˚ateranv¨anda. Genom anv¨andning av ODP:er och ODP-baserade verktyg s˚akan utvecklarens behov av dju- pare kunskaper inom konceptuell modellering och ontologiutveckling min- skas v¨asentligt. Den h¨aravhandlingen studerar ODP:er och ODP-anv¨andningur tre per- spektiv. Till att b¨orjamed unders¨oker f¨orfattarenvilka egenskaper eller kvaliteter hos ODP:er som ¨arviktiga f¨orderas anv¨andning,och hur dessa kvaliteter kan m¨atas.Avhandlingens resultat avseende dessa fr˚agorformal- iseras i en kvalitetsmodell som inkluderar ett antal olika kvaliteter (Func- tional Suitability, Usability, Maintainability, Compatibility, Resulting perfor- mance efficiency), ett antal underkvaliteter f¨orvar och en av dessa, och ett antal (38 st.) kvalitetsindikatorer som bidrar till respektive kvalitet eller underkvalitet. Vidare studeras i avhandlingen hur verktyg f¨oranv¨andningav ODP:er kan f¨orb¨attrass˚aatt utvecklare enklare kan hitta l¨ampligaODP:er, och l¨attarekan anv¨andadessa i sina ontologier p˚akorrekt s¨att.Resultat inom detta omr˚adeinkluderar nya metoder (och tillh¨orande verktyg) f¨orinstan- siering av ODP:er in i en ontologi, metoder som ¨ars¨arskiltl¨ampadei sce- narion d¨aranv¨andaren¨armindre kunnig om ontologi-utveckling, eller i sce- narion d¨aranv¨andarenenklare vill kunna integrera sina ontologier och sina data med sedan tidigare publicerade ontologier och data. Andra resultat p˚a verktygsomr˚adetinkluderar en s¨okmotorf¨orODP:er som presterar b¨attre ¨antidigare anv¨andteknik f¨oratt hitta ODP:er. Slutligen unders¨oksi avhandlingen hur en etablerad projektmetod f¨or anv¨andningav ODP:er, eXtreme Design-metoden (XD), fungerar i praktiken och hur den kan f¨orb¨attrasf¨oratt matcha utvecklares behov av metodst¨od. F¨orfattarenfinner att XD kan f¨orb¨attrasgenom tydligare dokumentation \Dissertation" | 2017/8/15 | 10:53 | page vii | #7 av olika projektroller och ansvarsomr˚aden,genom rekommendationer f¨or ˚ateranv¨andningav etablerade ontologier (inte bara ODP:er), och genom anpassningar som tar st¨orreh¨ansyntill projektspecifika sammanhang som kundrelationer, utvecklingsteamets kompetenser, och teamets organisation. Sammanfattningsvis bidrar den h¨aravhandlingens resultat till att ¨oka kunskapen om hur ODP:er b¨orvara konstruerade och beskrivna, hur ODP:er anv¨andsp˚ab¨asts¨att,och hur verktyg f¨oratt st¨odjas˚adananv¨andning b¨orfungera. Dessa bidrag m¨ojligg¨orf¨orenkladutveckling av ontologier och ontologi-baserad teknik, vilket i sin tur bidrar till utvecklingen av den Se- mantiska Webben och de m˚angafunktioner och tj¨anstersom f¨oljerutav den. \Dissertation" | 2017/8/15 | 10:53 | page