Ontology-Based Infrastructure for Intelligent Applications

Ontology-based Infrastructure for Intelligent Applications Andreas Eberhart Dissertation zur Erlangung des Grades Doktor der Ingenieurwissenschaften (Dr.-Ing.) der Naturwissenschaftlich-Technischen Fakultät I der Universität des Saarlandes Saarbruc¨ ken, 2004 Tag des Kolloquiums: 18.12.2003 Dekan: Prof. Dr. Slusallek Vorsitzender: Prof. Dr. Andreas Zeller Berichterstatter: Prof. Dr. Wolfgang Wahlster, Prof. Dr. Andreas Reuter Fur¨ Hermann und Martin in liebevollem Gedenken Abstract Ontologien sind derzeit ein viel diskutiertes Thema in Bereichen wie Wissens- management oder Enterprise Application Integration. Diese Arbeit stellt dar, wie Ontologien als Infrastruktur zur Entwicklung neuartiger Applikationen verwendet werden können, die den User bei verschiedenen Arbeiten unterstutzen.¨ Aufbauend auf den im Rahmen des Semantischen Webs entstandenen Spezi- fikationen, werden drei wesentliche Beiträge geleistet. Zum einen stellen wir Inferenzmaschinen vor, die das Ausfuhren¨ von deklarativ spezifizierter Applika- tionslogik erlauben, wobei besonderes Augenmerk auf die Skalierbarkeit gelegt wird. Zum anderen schlagen wir mehrere Lösungen zum Anschluss solcher Sys- teme an bestehende IT Infrastruktur vor. Dies beinhaltet den, unseres Wissens nach, ersten lauffähigen Prototyp der die beiden aufstrebenden Felder des Se- mantischen Webs und Web Services verbindet. Schließlich stellen wir einige intelligente Applikationen vor, die auf Ontologien basieren und somit großteils von Werkzeugen automatisch generiert werden können. Abstract Ontologies currently are a hot topic in the areas of knowledge management and enterprise application integration. In this thesis, we investigate how ontologies can also be used as an infrastructure for developing applications that intelligently support a user with various tasks. Based on recent developments in the area of the Semantic Web, we provide three major contributions. We introduce inference engines, which allow the execution of business logic that is specified in a declarative way, while putting strong emphasis on scalability and ease of use. Secondly, we suggest various solutions for interfacing applications that are de- veloped under this new paradigm with existing IT infrastructure. This includes the first running solution, to our knowledge, for combining the emerging areas of the Semantic Web and Web Services. Finally, we introduce a set of intelligent applications, which is built on top of ontologies and Semantic Web standards, providing a proof of concept that the engineering effort can largely be based on standard components. Abstract Ontologien sind derzeit ein viel diskutiertes Thema in Bereichen wie Wissens- management oder Enterprise Application Integration. Diese Arbeit stellt dar, wie Ontologien als Infrastruktur zur Entwicklung neuartiger Applikationen verwendet werden können, die den User bei verschiedenen Arbeiten unterstutzen.¨ Hierbei werden die folgenden wesentlichen Fragestellungen beantwortet. 1. Wie viel und welche Art von semantisch gekennzeichneten Daten sind im Web derzeit verfugbar?¨ Wir suchen das Web mittels vier verschiedener Methoden nach RDF ab. Die gefundenen RDF Fakten werden aufgrund des Prädikatnamespaces und dem Fundort analysiert. Die Resultate zeigen, dass RDF noch nicht von einer großen Nutzergruppe verwendet wird. Dennoch sind viel ver- sprechende Anzeichen wie die RDF Unterstutzung¨ der Adobe Werkzeuge zu erkennen. 2. Können Regeln und Ontologien in eine etablierte IT Landschaft aus Daten- bank und objektorientierten Programmiersprachen integriert werden? Wir präsentieren die OntoJava und OntoSQL Inferenzmaschinen, die sich auf bewährte Technologien wie Java und relationale Datenbanken stutzten.¨ Dabei werden RDF Schema Ontologien und RuleML in Java beziehungsweise SQL ub¨ ersetzt. Trotz einiger inhärenter Einschränkungen bewährten sich diese Werkzeuge als Basis fur¨ die Entwicklung weiterer Applikationen. Leistungstest zeigen, dass Datenbanken durchaus mit tra- ditionellen regelbasierten Inferenzmaschinen wie XSB mithalten können. 3. Können Ontologien und Ereignis Bedingung Aktionsregeln zur Spezifika- tion des Verhaltens von Agenten verwendet werden? Die deklarative Spezifikation von Agenten ist ein sehr viel versprechender Ansatz, da er den Entwickler von vielen der Lasten befreit, die die Pro- grammierung von Agenten normalerweise mit sich bringt. Mit OntoAgent stellen wir eine Plattform vor, die es erlaubt einen Agenten komplett mit Standards des Semantischen Webs, insbesondere RDF, RDF Schema und RuleML, zu spezifizieren. Die Implementierung basiert auf OntoSQL und einigen Modulen zur Realisierung von Reaktionsregeln, einer Komman- dobibliothek und einer Kommunikationseinheit. Wir diskutieren ferner etliche der getroffenen Designentscheidungen. 4. Ist es möglich semantisch gekennzeichnete Dienste ad hoc aufzurufen? Wir präsentieren WSDF, eine semantische Annotation von Web Ser- vices basierend auf WSDL, RDF Schema und RuleML. Mit Hilfe eines WSDL Kompilers und unseres OntoSQL RuleML-SQL Konverters wird ein Klient in die Lage versetzt, die generische Beschreibung des Dien- stes in lauffähigen Code umzusetzen. Dadurch ist lediglich eine gemeinsame Ontologie die Voraussetzung fur¨ das Aufrufen des Dienstes. Ob- wohl wir uns auf die einfachste Form, nämlich Dienste ohne Seiteneffekte, beschränken ist dies ein wesentlicher Schritt nach vorn, da bisher im- mer explizit gegen die Schnittstelle programmiert werden musste oder ein vorab bekanntes UDDI tModel implementiert sein musste. Verglichen mit anderen Ansätzen wie DAML-S oder WSMF bieten wir nicht nur die Sprache, sondern erstmals auch eine funktionierende Laufzeitumgebung die es dem Klienten erlaubt generische Dienste aufzurufen und die Ergeb- nisse korrekt zu interpretieren. 5. Ist es möglich linguistische Funktionen mittels derselben Mechanismen zu verwirklichen, die auch zur Einbindung von anderen Informationsquellen verwendet werden? Die OntoLang und SmartDialog Sprachsysteme demonstrieren diese Möglichkeit. OntoLang verwendet linguistische Annotationen um ein- fache Sätze zu verstehen und die darin enthaltenen Fakten in die RDF Wissensbasis einzufugen.¨ Dadurch ist OntoLang in der Lage ub¨ er die Inferenzmaschine mit beliebigen anderen Applikationen zu interagieren. 6. Bietet die einer Software zugrunde liegende Ontologie eine ausreichende Basis um verschiedenen Komponenten eine Kooperation zu ermöglichen? Angenommen die Ontologie ist sowohl in dem Datenmodell der Fakten- basis als auch in der Inferenz- und der Anfrageschicht vertreten, so zeigen wir, dass Applikationsteile ub¨ er diese Schnittstelle kooperieren können. Das gemeinsame Datenmodell fungiert hierbei als Mediator. 7. Sind Ontologien bei der Entwicklung von komplexen Applikationen hilfre- ich? Wir stellen die Tragfähigkeit unserer Konzepte dadurch unter Beweise, indem wir einige Beispielapplikationen mit unseren eigenen Werkzeugen entwickeln. SmartGuide und SmartDialog demonstrieren hierbei wie eine komplexe Document Retrieval Anwendung die den Nutzerkontext mit ein- bezieht und klärende Fragen stellt mit vertretbarem Aufwand implementiert werden kann. Abstract Ontologies currently are a hot topic in the areas of knowledge management and enterprise application integration. In this thesis, we investigate how ontologies can also be used as an infrastructure for developing applications that intelligently support a user with various tasks. In particular, the following key questions are answered. 1. How much and what kind of semantically tagged data is available on the Web today? We crawled the Web for RDF data using four different search strategies. The RDF facts were analyzed according to their predicate namespaces and their location. The results show that RDF has not yet caught on with a large user community. However, there are promising signs such as Adobe supporting RDF in its tools. 2. Can rules and ontology be integrated into a mainstream IT infrastructure of databases and object oriented programming languages? We present the OntoJava and OntoSQL inference engines which leverage proven technologies such as Java and relational databases by translating RDF Schema ontologies and RuleML into Java and SQL respectively. De- spite some inherent limitations on the rule expressiveness, the tools prove to be a valuable backbone for application development. Performance mea- surements show that SQL databases can very well keep up with traditional rule engines such as XSB. 3. Can ontologies and event condition action rules be used to define the behavioral aspects of agents? Declaratively specifying agents is an extremely promising approach since it relieves programmers from many of the burdens that are usually inherent with the implementation of agent systems. We present OntoAgent, a framework, which builds on Boley et. al's idea of specifying an agent en- tirely using the Semantic Web mark-up languages RDF, RDF Schema, and RuleML. The implementation is based on OntoSQL and a set of add-ons for realizing reaction rules, a command library, and a messaging subsystem based on HTTP. Several design choices and trade-offs are discussed. 4. Is it possible to invoke a semantically tagged service on the fly? We present WSDF, a semantic annotation of Web Services based on the existing languages WSDL, RDFS, and RuleML. Using a WSDL compiler and our OntoSQL RuleML to SQL converter, a client application is able to process the generic descriptions into running code. Web Services can therefore be invoked simply by agreeing on

Ontology-Based Infrastructure for Intelligent Applications

Base64 Character Encoding and Decoding Modeling

The Semantic Web and Its Languages Editor: Dieter Fensel Vrije Universiteit Amsterdam [email protected]

French Montana Do for Drugs

Works S11-1.Pub

The Base16, Base32, and Base64 Data Encodings

Interaction Between Record Matching and Data Repairing

IDOL RSS Connector (CFS)

Confidentiality Technique to Enhance Security of Data in Public Cloud Storage Using Data Obfuscation

Better Is Better Than More: Complexity, Economic Progress, and Qualitative Growth

The Role of Ontology in Information Management

Chapter 4: Inter-Process Communications

XEP-0116: Encrypted Session Negotiation