Information Retrieval (SS 2011)
Total Page:16
File Type:pdf, Size:1020Kb
7. Seman)sche(re) Suche Rückblick ✦ World Wide Web – dezentralisiert organisierter Hypertext ✦ Crawler sammeln dezentralisiert gespeicherte Web-Inhalte ✦ Duplikate und Beinahe-Duplikate müssen eliminiert werden ✦ Link-Analyse für besseres Ranking miJels Web-Graph ✦ Lernbasiertes Ranking kombinieren verschiedene Merkmale ✦ Web-Archive – vergangene Web-Inhalte als Kulturerbe ✦ Sponsored Search – Haupteinnahmequelle von Google & Co Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 2 Mo)vaon The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-deined meaning, better enabling computers and people to work in cooperation [Tim Berners-Lee] ✦ World Wide Web ist für Computer nicht interpre?erbar – Suchmaschinen chancenlos für Informaonsbedürfnisse wie Zahnarzt in Marburg mit Sprechstunde bis 19.00 Uhr am Donnerstag Filme in denen Ben Affleck Regie geführt und selbst mitgespielt hat Welche Politiker haben Spenden von Energieunternehmen im Wahlkampf erhalten und gegen einen Atomausstieg gestimmt? Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 3 Inhalt (1) Seman)c Web (2) URIs und RDF (3) Ontologien und Wissensbasen (4) SPARQL Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 4 7.1 Semanc Web ✦ Semanc Web ist eine Ergänzung des World Wide Webs mit dem Ziel Inhalte für Computer interpre?erbar zu machen ✦ Inhalte aus verschiedenen Quellen können damit automasch verknüpG und neue Zusammenhänge entdeckt werden ✦ Berners-Lee et al. [3] beschreiben Vision des Seman)c Web bereits im Jahr 2001; breite Anwendung der vorgestellten Ideen jedoch erst in den letzten ca. 5 Jahren Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 5 Seman)c Web ✦ World Wide Web Consorum (W3C) definiert Standards ✦ zur eindeu)gen Iden)fizierung von Ressourcen (URIs) ✦ zur Beschreibung der Eigenschaen von Ressourcen (RDF) ✦ zur Beschreibung von Schemata (RDF/S) ✦ zur Beschreibung von Ontologien (OWL) ✦ zum Formulieren von Anfragen (SPARQL) Semanc Web Stack Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 6 7.2 URIs und RDF ✦ Unified Resource Iden?fier (URI) ist eine ZeichenkeJe zur Iden?fika?on einer abstrakten oder physischen Ressource http://www.bbc.co.uk/music/artists/67f66c07-6e61-4026-ade5-7e782fad3a5d http://en.wikipedia.org/wiki/Foo_Fighters http://www.musicbrainz.org/artist/67f66c07-6e61-4026-ade5-7e782fad3a5d ✦ Ein URI verweist auf genau eine Ressource ✦ Ressource kann von mehreren URIs referenziert werden Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 7 Unified Resource Iden)fier http://www.host.org/pub/bands?query=FF#albums ✦ Bestandteile eines Uniform Resource Iden)fiers sind ✦ Scheme (z.B. hJp, urn, hp) bes)mmt Art des URI und seine Interpretaon ✦ Authority (z.B. Name eines Hosts) gibt Instanz an, die für Verwaltung der Namen in diesem Raum zuständig ist ✦ Path enthält hierarchische Angaben zur Iden)fizierung einer Ressource ✦ Query enthält nicht hierarchische Angaben zur Iden)fizierung einer Ressource ✦ Fragment referenziert einen Teil innerhalb einer Ressource Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 8 Resource Descrip)on Framework ✦ Resource Descrip)on Framework (RDF) ist Daten-Modell zur formalen Repräsenta?on von Informa?onen über Ressourcen ✦ RDF-Ausdruck (RDF statement) ist ein (S,P,O)-Tripel bestehend aus Subjekt, Prädikat und Objekt, welche jeweils URIs sind ✦ Beispiel: Foo Fighters haben Bandmitglied Dave Grohl http://dbtune.org/musicbrainz/page/artist/67f66c07-6e61-4026-ade5-7e782fad3a5d (S) http://xmlns.com/foaf/spec/20100809.html#member (P) http://dbtune.org/musicbrainz/page/artist/4d5f891d-9bce-45ae-ad86-912dd27252fa (O) Subjekt Prädikat Objekt Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 9 Resource Descrip)on Framework ✦ Eine Menge von RDF-Tripeln ergibt einen RDF-Graphen a:playsOn a:makerOf a:member a:member a:makerOf ✦ Namespaces repräsen)eren (häufig verwendete) Präfixe von URIs und erlauben eine kompaktere Notaon @prefix a: http://allaboutmusic.org/ Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 10 Resource Descrip)on Framework ✦ RDF/N3 als Text-Format zur Darstellung von RDF-Daten @ prefix a: http://allaboutmusic.org a:Foo_Fighters a:member a:Dave_Grohl a:Foo_Fighters a:member a:Pat_Smear ✦ RDF/XML als XML-Format zur Darstellung von RDF-Daten <?xml version=”1.0”> <rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:a=”http://allaboutmusic.org/”> <rdf:Description rdf:about=”http://allaboutmusic.org/Foo_Fighters”> <a:member rdf:resource=”http://allaboutmusic.org/Dave_Grohl” /> <a:member rdf:resource=”http://allaboutmusic.org/Pat_Smear” /> </rdf:Description> </rdf:RDF> Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 11 7.3 Ontologien und Wissensdatenbanken ✦ Taxonomie (taxonomy) beschreibt bestehende Klassen und deren entity subclass/superclass-Relaonen zueinander organization person musical organization artist ✦ Ontologie (ontology) beschreibt zusätzlich beliebige Relaonen zwischen Klassen ✦ Wissensdatenbank (knowledge base) beschreibt zusätzlich Instanzen sowie Fakten über diese Instanzen subclassOf Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 12 7.3 Ontologien und Wissensdatenbanken ✦ Taxonomie (taxonomy) beschreibt bestehende Klassen und deren entity subclass/superclass-Relaonen zueinander organization person musical organization artist ✦ Ontologie (ontology) beschreibt zusätzlich beliebige Relaonen zwischen Klassen ✦ Wissensdatenbank (knowledge base) beschreibt zusätzlich Instanzen sowie Fakten über diese Instanzen subclassOf hasMember Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 12 7.3 Ontologien und Wissensdatenbanken ✦ Taxonomie (taxonomy) beschreibt bestehende Klassen und deren entity subclass/superclass-Relaonen zueinander organization person musical organization artist ✦ Ontologie (ontology) beschreibt zusätzlich beliebige Relaonen zwischen Klassen Dave_Grohl Foo_Fighters Pat_Smear ✦ Wissensdatenbank (knowledge base) beschreibt zusätzlich Instanzen sowie Fakten über diese Instanzen subclassOf hasMember type Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 12 Ontologien und Wissensdatenbanken ✦ Das Gebiet der Künstlichen Intelligenz hat sich schon lange vor dem Seman)c Web mit Ontologien, Wissensdatenbanken und anderen Methoden der Wissensrepräsentaon befasst ✦ Ontologien manuell zu erstellen ist ein aufwendiger Prozess, so dass Ontologien in der Vergangenheit sehr klein waren bzw. nur einen besmmtes Gebiet (z.B. Archäologie) abdeckten ✦ Eine Reihe von Projekten hat in den letzten Jahren Verfahren zur Informa?onsextrakon auf Wikipedia und andere Datenquellen angewendet, um daraus automasch umfassende Wissensdatenbanken abzuleiten Informaon Retrieval (SS 2011) 7. Seman)sche(re) Suche 13 DBpedia ✦ http://dbpedia.org ✦ 3.5 Millionen En))es / 670 Millionen Fakten About: Foo Fighters An Entity of Type : Band, from Named Graph : http://dbpedia.org, within Data Space : dbpedia.org Foo Fighters are an American alternative rock band from Seattle, Washington, formed in 1995. Drummer Dave Grohl formed the group as a one-man project after the dissolution of his previous band, Nirvana, in 1994. Prior to the release of the band's eponymous debut album in 1995, Grohl drafted two members from the former band Sunny Day Real Estate, Nate Mendel as bassist, and William Goldsmith as drummer, as well as fellow Nirvana bandmate Pat Smear as guitarist to complete the group. Property Value dbpedia-owl:abstract Foo Fighters ist eine US-amerikanische Rockband. Prominentestes Mitglied ist der ehemalige Nirvana- Schlagzeuger Dave Grohl. Foo Fighters are an American alternative rock band from Seattle, Washington, formed in 1995. Drummer Dave Grohl formed the group as a one-man project after the dissolution of his previous band, Nirvana, in 1994. Prior to the release of the band's eponymous debut album in 1995, Grohl drafted two members from the former band Sunny Day Real Estate, Nate Mendel as bassist, and William Goldsmith as drummer, as well as fellow Nirvana bandmate Pat Smear as guitarist to complete the group. The band was small, young, and began with performances in Portland, Oregon before gaining popularity. Goldsmith left during the recording of the group's second album, The Colour and the Shape (1997), and Smear's departure followed soon afterward. They were replaced by Taylor Hawkins and Franz Stahl, respectively, although Stahl left prior to the recording of the group's third album, There Is Nothing Left to Lose (1999). Chris Shiflett joined as the band's third guitarist after the completion of There Is Nothing Left to Lose. The band released its fourth album, One by One, in 2002. The group followed that release with the two-disc In Your Honor (2005), which was split between acoustic songs and harder-rocking material. Foo Fighters released its sixth album, Echoes, Silence, Patience & Grace, in 2007. Later that year, guitarist Pat Smear rejoined the band. Over the course of the band's existence, three of its albums have won Grammy Awards for Best Rock Album, and all six have been nominated for Grammys. Foo Fighters es una banda de origen estadounidense creada en el año 1995 por Dave Grohl, ex-baterista de Nirvana. La banda ha conseguido varios reconocimientos y ha marcado muchísimos éxitos alrededor del mundo, tales como "Big Me", "This is a Call", "Everlong", "Monkey Wrench", "Learn to Fly", "All My Life", "Times Like These", "Best of You", "D.O.A. ", "No Way Back", "The Pretender", que alcanzó el puesto N° 1 en Informaon Retrieval (SS 2011) los Hot Modern5. Evaluierung von IR-Systemen Rock Tracks