Webontológiák Felhasználási Lehet˝Oségei
Total Page:16
File Type:pdf, Size:1020Kb
Webontol´ogi´ak felhaszn´al´asi lehet˝os´egei Doktori (PhD) ´ertekez´es Jeszenszky Peter´ T´emavezet˝o: Dr. Bognar´ Katalin Debreceni Egyetem Term´eszettudom´anyi Doktori Tan´acs Informatikai Tudom´anyok Doktori Iskola Debrecen, 2010 Ezen ´ertekez´est a Debreceni Egyetem Term´eszettudom´anyi Doktori Tan´acs Informatikai Tudom´anyok Doktori Iskola Alkalmazott inform´aci´o technol´ogia ´es elm´eleti h´attere programja keret´eben k´esz´ıtettem a Debreceni Egyetem term´eszettudom´anyi doktori (PhD) fokozat´anak elnyer´ese c´elj´ab´ol. Debrecen, 2010. december 1. Jeszenszky P´eter doktorjel¨olt Tan´us´ıtom, hogy Jeszenszky P´eter doktorjel¨olt 2004–2007 k¨oz¨ott a fent megnevezett Doktori Iskola Alkalmazott in- form´aci´otechnol´ogia ´es elm´eleti h´attere programj´anak ke- ret´eben ir´any´ıt´asommal v´egezte munk´aj´at. Az ´ertekez´esben foglalt eredm´enyekhez a jel¨olt ¨on´all´oalkot´otev´ekenys´eg´evel meghat´aroz´oan hozz´aj´arult. Az ´ertekez´es elfogad´as´at javaso- lom. Debrecen, 2010. december 1. Dr. Bogn´ar Katalin t´emavezet˝o Webontol´ogi´ak felhaszn´al´asi lehet˝os´egei Ertekez´es´ a doktori (Ph.D.) fokozat megszerz´ese ´erdek´eben az informatika tudom´any´agban ´Irta: Jeszenszky P´eter okleveles programtervez˝omatematikus K´esz¨ult a Debreceni Egyetem Informatikai Tudom´anyok Doktori Iskol´aja (TODO programja) keret´eben T´emavezet˝o: Dr. Bogn´ar Katalin A doktori szigorlati bizotts´ag: eln¨ok: Dr. ...................... tagok: Dr. ...................... Dr. ...................... A doktori szigorlat id˝opontja: 200... ................ ... Az ´ertekez´es b´ır´al´oi: Dr. ...................... Dr. ...................... Dr. ...................... A b´ır´al´obizotts´ag: eln¨ok: Dr. ...................... tagok: Dr. ...................... Dr. ...................... Dr. ...................... Dr. ...................... Az ´ertekez´es v´ed´es´enek id˝opontja: 200. ................ ... Tartalomjegyz´ek 1. Bevezet´es 1 Irodalomjegyz´ek............................. 5 I. Modellez´es 7 2. List´ak modellez´ese az OWL-ben 9 2.1. Bevezet´es ............................. 9 2.2. List´akmodellez´eseazRDF-ben . 9 2.3. List´ak modellez´ese az OWL-ben . 11 2.3.1. RDF kont´enerek ´es kollekci´ok haszn´alata . .. 11 2.3.2. XMLs´emaalap´umegold´as. 11 2.3.3. List´ak megval´os´ıt´asa saj´at oszt´alyokkal . ...... 12 2.4. Ajavasolttervez´esiminta . 15 2.4.1. Megval´os´ıt´as. 15 2.4.2. Tipiz´alt list´ak l´etrehoz´asa . 15 2.4.3. P´eld´ak a konstrukci´ohaszn´alat´ara . .. 18 2.4.4. Az elemek sz´am´anak korl´atoz´asa . 19 2.4.5. A konstrukci´ojellemz˝oi . 22 2.4.6. Szoftverest´amogat´as . 24 Irodalomjegyz´ek. 27 II. RDF kinyer´es 31 3. RDF kinyer˝okonverzi´os programok 33 3.1. Bevezet´es ............................. 33 3.2. RDFadatforr´asok. 33 3.2.1. Kapcsol´od´ometaadat er˝oforr´as t´ars´ıt´asa . ...... 33 3.2.2. RDFa ........................... 34 3.2.3. GRDDL .......................... 34 3.2.4. RDF kinyer˝okonverzi´os eszk¨oz¨ok . 34 3.2.5. XMP............................ 35 3.3. RDF kinyer´es torrent ´allom´anyokb´ol . .. 36 3.3.1. Bevezet´es ......................... 36 3.3.2. Metainfo´allom´anyok . 36 3.3.3. A kinyer´es megval´os´ıt´asa . 38 3.3.4. Aprogramhaszn´alata . 40 3.4. RDFkinyer´esRPMcsomagokb´ol . 43 3.5. Bevezet´es ............................. 43 3.5.1. A kinyer´es megval´os´ıt´asa . 43 3.5.2. Aprogramhaszn´alata . 48 3.6. Saj´at RDF kinyer˝okeretrendszer megval´os´ıt´asa . ....... 50 3.6.1. Bevezet´es ......................... 50 3.6.2. A keretrendszer bemutat´asa . 50 3.6.3. Hasonl´ol´etez˝orendszerek . 52 Irodalomjegyz´ek. 55 4. XMP kinyer˝ob¨ong´esz˝ofunkci´o 57 4.1. Bevezet´es ............................. 57 4.2. XMP................................ 57 4.3. PiggyBank ............................ 59 4.4. Az ´uj b¨ong´esz˝ofunkci´o . 59 4.5. Megval´os´ıt´as. 60 4.5.1. Felhaszn´al´oi fel¨ulet . 62 4.5.2. XMP kinyer˝owebszolg´altat´as . 62 4.5.3. XMP kinyer˝okeretrendszer . 63 4.6. Altal´anos´ıt´as´ . 66 Irodalomjegyz´ek. 67 III. Csomagkezel´es 69 5. Csomagkezel´es 71 5.1. Bevezet´es ............................. 71 5.2. Acsomagkezel´esalapfogalmai . 73 5.2.1. Szoftvercsomag . 73 5.2.2. Csomagkezel˝orendszer . 74 5.2.3. T´arol´o........................... 74 5.2.4. Csomagokkapcsolatai . 74 5.2.5. Verzi´osz´amok . 75 5.3. Csomagkezel´es oper´aci´os rendszerekben . .... 77 5.3.1. Unix-szer˝uoper´aci´os rendszerek . 78 5.3.2. Platformf¨uggetlen megold´asok . 80 5.3.3. Windows.......................... 82 Irodalomjegyz´ek. 83 6. Linked Data 87 6.1. Adatweb”´ep´ıt´ese . 87 ” 6.2. Nem inform´aci´oer˝oforr´asok azonos´ıt´asa . ....... 88 6.2.1. HashURI-k ........................ 89 6.2.2. 303-as´atir´any´ıt´as . 90 6.3. Kapcsoltadatok”szolg´altat´asa . 90 ” 6.4. LinkedDataadathalmazok. 92 6.5. A szemantikus web megval´osul´asa? . 93 Irodalomjegyz´ek. 95 7. Csomag metaadatok publik´al´asa 101 7.1. Bevezet´es .............................101 7.2. RDF´esszoftvercsomagok . .102 7.2.1. rpmfind.net . .. .. .102 7.2.2. GNUpdate.........................102 7.2.3. XPInstall .........................102 7.2.4. SPDX ...........................102 7.3. RDF kinyer´es egyedi csomagokb´ol . 103 7.4. Csomagokmodellez´ese . .104 7.4.1. A modellez´esi feladat kih´ıv´asai . 104 7.4.2. Csomagokkapcsolatai . .105 7.4.3. Debian...........................106 7.4.4. RPM............................107 7.4.5. Kapcsolatok´abr´azol´asa. 108 7.4.6. Webontol´ogi´ak . .112 7.5. Linked Data szolg´altat´as megval´os´ıt´asa . ......114 7.6. Felhaszn´al´asi lehet˝os´egek . 115 Irodalomjegyz´ek. .119 A. RPM 121 A.1.Bevezet´es .............................121 A.2. RPM csomagok fel´ep´ıt´ese . 122 Irodalomjegyz´ek. .125 B. Er˝oforr´asok azonos´ıt´asa 127 B.1. Er˝oforr´asfogalma . .127 B.2. Egys´eges er˝oforr´as-azonos´ıt´ok . .127 B.3. URI-khaszn´alata . .128 Irodalomjegyz´ek. .129 1. fejezet Bevezet´es Tim Berners-Lee 1989-ben v´azolta elk´epzel´es´et egy olyan glob´alis inform´aci´os rendszerr˝ol, amely egy ´evvel k´es˝obb a World Wide Web nevet kapta a ke- reszts´egben [5]. Maga a megval´os´ıt´as is teljes eg´esz´eben az ¨otletgazd´at´ol sz´armazik, ´ıgy Tim Berners-Lee a tervez˝oje a HTTP, HTML ´es URI n´even k¨ozismert szabv´anyoknak. Szerz˝oje tov´abb´aaz els˝owebszervernek, b¨ong´esz˝o ´es weboldal szerkeszt˝oprogramnak. (A World Wide Web t¨ort´enet´er˝ol l´asd Tim Berners Lee [4] k¨onyv´et.) A elm´ult h´usz ´evben a World Wide Web term´eszetes m´odon ment ´at egy olyan fejl˝od´esen, amelynek kapcs´an szok´as a Web 1.0 ´es Web 2.0 kife- jez´esekkel jellemzett ´eletszakaszokat megk¨ul¨onb¨oztetni. A Web 1.0 elnevez´es a web k´etezres ´evek elej´eig tart´o´eletszakasz´ara haszn´alt. Egy ´atmenet jel- lemzi a statikus webt˝ol egy dinamikus web fel´e: m´ıg a korai webet statikus dokumentumok alkott´ak, a k´etezres ´evek webj´en m´ar mindennapos a dina- mikusan el˝o´all´ıtott weboldalak haszn´alata. A Web 2.0 nem a World Wide Web egy ´uj verzi´oj´at jelenti, hanem egy olyan webet, amelyen kiemelt szerepet kap az inform´aci´ok megoszt´asa, a k¨oz¨oss´egek ´es az egy¨uttm˝uk¨od´es. Olyan inform´aci´os szolg´altat´asok jellem- zik, mint p´eld´aul a blogok, wikik, k¨oz¨oss´egi h´al´ozatok ´es webszolg´altat´asok. A felhaszn´al´ok nem csup´an passz´ıv fogyaszt´oi a Web 2.0 webhelyek k´ın´alta tartalomnak, hanem r´eszt vehetnek annak kialak´ıt´as´aban. A szolg´altat´o feladata sok esetben csup´an az infrastrukt´ura biztos´ıt´asa ´es a teljes tar- talmat egy k¨oz¨oss´eg ´all´ıtja el˝o. R´aad´asul a tartalom l´etrehoz´as´ahoz nem sz¨uks´eges speci´alis szaktud´as sem, gondoljunk csak p´eld´aul a blogokra vagy wikikre! A megval´os´ıt´as oldal´ar´ol a Web 2.0-t olyan komplex technol´ogiai h´att´er haszn´alata jellemzi, amely lehet˝ov´eteszi az asztali alkalmaz´asokra egyre jobban hasonl´ıt´owebes alkalmaz´asok l´etrehoz´as´at. A web term´eszetes evol´uci´oj´anak egy lehets´eges k¨ovetkez˝oszintje a sze- mantikus web, amely az inform´aci´ok automatikus feldolgozhat´os´ag´at he- 1 2 1. FEJEZET. BEVEZETES´ lyezi k¨oz´eppontba. Az elgondol´as Tim Berners-Lee-t˝ol sz´armazik. A fogal- mat a nagyk¨oz¨ons´eg sz´am´ara egy 2001-ben a Scientific American foly´oiratban megjelent cikk [6] tette k¨ozismertt´e. Noha a Web 2.0 egyik alapeszk¨oz´et jelentik a webszolg´altat´asok, amelyek- kel g´epi feldolgoz´asra sz´ant XML form´atumban lehet struktur´alt adatokhoz jutni, a weben el´erhet˝otartalom jelent˝os r´esze ma is emberi fogyaszt´asra sz´ant sz¨oveg. A weboldalak nyelvek´ent szolg´al´oHTML ´es XHTML ugyan jel¨ol˝onyelvek, amelyek lehet˝ov´eteszik bizonyos sz¨ovegr´eszek azonos´ıt´as´at, de alapvet˝oen a dokumentumok megjelen´ıt´es´ehez haszn´altak. Eppen´ ez´ert nagyon neh´ez feladat a weboldalakb´ol a megfelel˝oinform´aci´ok automatikus kinyer´ese. A szemantika hi´anya egy olyan probl´ema, amelyre Tim Berners-Lee m´ar egy 1994-es el˝oad´asban felh´ıvta a figyelmet [3]. A szemantikus web lesz majd az a k¨ornyezet, amelyben az adatok jelent´est nyerhetnek.