Content Ontology Design Patterns Qualities, Methods, and Tools

“Dissertation” — 2017/8/15 — 10:53 — page i — #1 Linkoping¨ Studies in Science and Technology Dissertaons. No. 1879 Content Ontology Design Paerns: Qualies, Methods, and Tools by Karl Hammar Linkoping¨ University Department of Computer and Informaon Science Division of Human-Centered Systems SE-581 83 Linkoping,¨ Sweden Linkoping¨ 2017 \Dissertation" | 2017/8/15 | 10:53 | page ii | #2 © 2017 Karl Hammar Cover photograph by Jenny Hammar ISBN: 978-91-7685-454-9 ISSN: 0345{7524 URL: http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-139584/ Printed by LiU Tryck, Linköping2017 \Dissertation" | 2017/8/15 | 10:53 | page iii | #3 Abstract Ontologies are formal knowledge models that describe concepts and relationships and enable data integration, information search, and reasoning. Ontology Design Patterns (ODPs) are reusable solutions intended to sim- plify ontology development and support the use of semantic technologies by ontology engineers. ODPs document and package good modelling practices for reuse, ideally enabling inexperienced ontologists to construct high-quality ontologies. Although ODPs are already used for development, there are still remaining challenges that have not been addressed in the literature. These research gaps include a lack of knowledge about (1) which ODP features are important for ontology engineering, (2) less experienced developers' preferences and barriers for employing ODP tooling, and (3) the suitability of the eXtreme Design (XD) ODP usage methodology in non-academic contexts. This dissertation aims to close these gaps by combining quantitative and qualitative methods, primarily based on five ontology engineering projects involving inexperienced ontologists. A series of ontology engineering work- shops and surveys provided data about developer preferences regarding ODP features, ODP usage methodology, and ODP tooling needs. Other data sources are ontologies and ODPs published on the web, which have been studied in detail. To evaluate tooling improvements, experimental approaches provide data from comparison of new tools and techniques against established alternatives. The analysis of the gathered data resulted in a set of measurable quality indicators that cover aspects of ODP documentation, formal representation or axiomatisation, and usage by ontologists. These indicators highlight quality trade-offs: for instance, between ODP Learnability and Reusability, or between Functional Suitability and Performance Efficiency. Furthermore, the results demonstrate a need for ODP tools that support three novel prop- erty specialisation strategies, and highlight the preference of inexperienced developers for template-based ODP instantiation|neither of which are sup- ported in prior tooling. The studies also resulted in improvements to ODP search engines based on ODP-specific attributes. Finally, the analysis shows that XD should include guidance for the developer roles and responsibilities in ontology engineering projects, suggestions on how to reuse existing ontology resources, and approaches for adapting XD to project-specific contexts. iii \Dissertation" | 2017/8/15 | 10:53 | page iv | #4 \Dissertation" | 2017/8/15 | 10:53 | page v | #5 Populärvetenskaplig sammanfattning De senaste tv˚adecennierna har användningen av Internet och dess killer app World Wide Web (i dagligt tal webben) ökat explosionsartat, s˚avälvad gäller antal användaresom antal tillgängligatjänster.Vi surfar inte längrebara p˚a webben föratt söka efter information { snarare lever vi i allt högreutsträck- ning v˚araliv uppkopplade via den. Vi handlar mat och görbankärenden,vi bokar semestrar och läserböcker, vi delar bilder och videos och minnen med varandra. I de flesta avseenden har webben och dess möjligheterutvecklats l˚angtbortom vad de flesta trodde var möjligt. I andra avseenden har vi dock bara skrapat p˚aytan. Webben ärfort- farande i huvudsak ett medium förkommunikation människor emellan. Det inneh˚allsom publiceras p˚awebben, oavsett om det äri text-, bild-, eller videoformat, ärtill störredel oförst˚aeligtförprogramvara { det äravsett för konsumtion av människor, som tolkar, först˚ar,och eventuellt agerar p˚adet. Om webbinneh˚alli ställetkunde tolkas och först˚asmaskinellt av mjukvaror, s˚askulle det möjliggöramängder av innovativa nya integrerade tjänsteroch produkter: intelligenta mobila agenter skulle kunna svara p˚aanvändarens fr˚agorgenom att läsaoch först˚ainformation publicerat p˚awebben, snarare änatt bara svara vad de blivit programmerade till; information fr˚anolika företagseller myndigheters webbsidor skulle enkelt kunna samköras,s˚aatt till exempel kunder enkelt kan jämföraliknande produkter eller tjänster hos olika webbhandlare; rapportering fr˚anolika nyhetssajter skulle kunna jämförasmaskinellt föratt detektera olika tolkningar eller vinklingar p˚a det rapporterade materialet, etc. Visionen av den härframtida webben där människor och maskiner delar information p˚aett sömlöstoch integrerat sätt har ett namn: den Semantiska Webben. Föratt möjliggöraden Semantiska Webben s˚akrävsatt deltagande människor och system kommer överens om och standardiserar kommunika- tion p˚atv˚aolika niv˚aer:dels p˚aformat- och syntaxniv˚a,och dels p˚akon- ceptuell definitionsniv˚a.Den förstaniv˚anrördet rent tekniska informations- utbytet mellan system förolika sorters data (textsträngar,siffror, bilder, etc.). Parallellt med och p˚agrund av Internets och webbens framväxts˚ahar ett flertal standarder etablerats kring dessa format fördatarepresentation v \Dissertation" | 2017/8/15 | 10:53 | page vi | #6 och -utbyte, vilka fungerar väläven fören Semantisk Webb. P˚aden senare niv˚an,standardiseringen av formella definitioner förde ting som system och människor skall kunna kommunicera om (de semantiska ontologierna), finns det betydligt mer kvar att göra. En stor utmaning äratt konstruktionen av dessa ontologier ärförh˚allande- vis komplex och kräver kunskaper som f˚aprogrammerare eller analytiker be- sitter { de behöver ha djupg˚aendeförst˚aelseföralla de koncept som de vill f˚angaoch formalisera definitioner av (produkter, händelser,organisationer, processer, etc), de behöver ha stor erfarenhet av konceptuell modellering, och de behöver kännatill de relativt komplicerade format och verktyg som användsföratt konstruera ontologier. Designmönsterförontologier (Ontology Design Patterns, eller ODP:er) äravsedda att förenklautvecklingen av ontologier. ODP:er beskriver, i text och i bild, vanligt förekommande modelleringsproblem och etablerade lösningarp˚adessa problem. En ODP kan till exempel beskriva hur man bästmodellerar händelser,oaktat vilken typ av händelse(en konsert, ett kurstillfälle,en flygresa, etc.) det rörsig om. ODP:er brukar, utöver sagda beskrivning, även best˚aav en liten och ˚ateranvändbarbit ontologi-kod, som en utvecklare enkelt kan anpassa och ˚ateranvända. Genom användning av ODP:er och ODP-baserade verktyg s˚akan utvecklarens behov av dju- pare kunskaper inom konceptuell modellering och ontologiutveckling min- skas väsentligt. Den häravhandlingen studerar ODP:er och ODP-användningur tre per- spektiv. Till att börjamed undersöker författarenvilka egenskaper eller kvaliteter hos ODP:er som ärviktiga förderas användning,och hur dessa kvaliteter kan mätas.Avhandlingens resultat avseende dessa fr˚agorformal- iseras i en kvalitetsmodell som inkluderar ett antal olika kvaliteter (Func- tional Suitability, Usability, Maintainability, Compatibility, Resulting performance efficiency), ett antal underkvaliteter förvar och en av dessa, och ett antal (38 st.) kvalitetsindikatorer som bidrar till respektive kvalitet eller underkvalitet. Vidare studeras i avhandlingen hur verktyg föranvändningav ODP:er kan förbättrass˚aatt utvecklare enklare kan hitta lämpligaODP:er, och lättarekan användadessa i sina ontologier p˚akorrekt sätt.Resultat inom detta omr˚adeinkluderar nya metoder (och tillhörande verktyg) förinstan- siering av ODP:er in i en ontologi, metoder som ärsärskiltlämpadei sce- narion däranvändarenärmindre kunnig om ontologi-utveckling, eller i sce- narion däranvändarenenklare vill kunna integrera sina ontologier och sina data med sedan tidigare publicerade ontologier och data. Andra resultat p˚a verktygsomr˚adetinkluderar en sökmotorförODP:er som presterar bättre äntidigare användteknik föratt hitta ODP:er. Slutligen undersöksi avhandlingen hur en etablerad projektmetod för användningav ODP:er, eXtreme Design-metoden (XD), fungerar i praktiken och hur den kan förbättrasföratt matcha utvecklares behov av metodstöd. Författarenfinner att XD kan förbättrasgenom tydligare dokumentation \Dissertation" | 2017/8/15 | 10:53 | page vii | #7 av olika projektroller och ansvarsomr˚aden,genom rekommendationer för ˚ateranvändningav etablerade ontologier (inte bara ODP:er), och genom anpassningar som tar störrehänsyntill projektspecifika sammanhang som kundrelationer, utvecklingsteamets kompetenser, och teamets organisation. Sammanfattningsvis bidrar den häravhandlingens resultat till att öka kunskapen om hur ODP:er börvara konstruerade och beskrivna, hur ODP:er användsp˚abästsätt,och hur verktyg föratt stödjas˚adananvändning börfungera. Dessa bidrag möjliggörförenkladutveckling av ontologier och ontologi-baserad teknik, vilket i sin tur bidrar till utvecklingen av den Se- mantiska Webben och de m˚angafunktioner och tjänstersom följerutav den. \Dissertation" | 2017/8/15 | 10:53 | page

Content Ontology Design Patterns Qualities, Methods, and Tools

Realising the Potential of Algal Biomass Production Through Semantic Web and Linked Data

From Cataloguing Cards to Semantic Web 1

Automated Ontology Creation Using XML Schema Elements

Download Slides

Knowledge Extraction for Hybrid Question Answering

Datatone: Managing Ambiguity in Natural Language Interfaces for Data Visualization Tong Gao1, Mira Dontcheva2, Eytan Adar1, Zhicheng Liu2, Karrie Karahalios3

Directions in AI Research and Applications at Siemens Corporate

A Framework for Ontology-Based Library Data Generation, Access and Exploitation

Using a Natural Language Understanding System to Generate Semantic Web Content

Transforming Recursive Relationships to OWL2 Components

Ontology Life Cycle: a Survey on the Ontology and Its Development Steps

An Approach to Formalizing Ontology Driven Semantic Integration: Concepts, Dimensions and Framework Wenlong Gao