Tables Des Matières
Total Page:16
File Type:pdf, Size:1020Kb
République Algérienne Démocratique et Populaire Ministère de l‘enseignement Supérieur et de la Recherche Scientifique Université Abdelhamid Mehri- Constantine 2 Faculté des Nouvelles Technologies de l‘Information et la Communication Département de l‘Informatique Fondamentale et ses Applications Laboratoire MISC-Equipe OSSIG Année : No d‘ordre : Série : THESE Pour l‘obtention du diplôme de Doctorat 3éme cycle LMD Option : Systèmes Complexes Recherche d‘Information Géographique à l‘aide des Ontologies Spatiales de Localisation Présentée par : Feriel ABDELKOUI Soutenue le devant le jury composé de : Pr. ZAROUR Nacer Eddine Président Université Abdelhamid Mehri- Constantine 2 Dr. BELHADEF Hacene Examinateur Université Abdelhamid Mehri- Constantine 2 Pr. CHALAL Rachid Examinateur Ecole nationale supérieure d‘informatique. ESI Alger Pr. BALLA Amar Examinateur Ecole nationale supérieure d‘informatique. ESI Alger Pr. KHOLLADI Mohamed Rapporteur Université Echahid Hamma lakhdar, El-oued khireddine 1 Remerciements Je tiens à remercier toute personne ayant participé, de loin ou de prêt à la réalisation de ce travail. Je suis extrêmement reconnaissante envers Monsieur Mohamed Khireddine KHOLLADI, d’avoir accepté d’être mon Directeur de thèse, Je le remercie pour la confiance qu'il m'a accordée, la patience, la gentillesse et la disponibilité dont il a fait preuve. Qu’il trouve ici l'expression de ma très grande gratitude. Je remercie particulièrement les membres de jury de m’avoir accordé l’honneur d’accepter l’évaluation de ce travail. Je tiens à remercier Mr. ZAROUR Nacer Eddine, Professeur à l'université de Constantine 2, Abdelhamid Mehri, Mr. CHALAL Rachid, Professeur à Ecole nationale supérieure d‘informatique. ESI .Alger, Mr BALLA Amar, Professeur à Ecole nationale supérieure d‘informatique. ESI Alger, et Mr BELHADEF Hacene, Maitre de conférences, à l'université de Constantine 2, Abdelhamid Mehri Je remercie du fond du cœur et avec un grand amour mes parents qui n'ont jamais cessé de croire en moi pendant toutes mes années d'études. Et à toute la famille qui m'ont toujours encouragée. 2 Je dédie cette thèse A ma princesse MARIA RAZANE 3 Résumé La recherche d‘information géographique ou GIR (Geographic Information Retrieval) peut être considérée comme une branche spécialisée de la recherche classique. Mais en plus en met l‘accent sur les notions de l‘indexation spatiale et la recherche géographique. Toutefois, Les moteurs de recherche (Google, Bing, Yahoo…etc.) ne permettent pas d‘atteindre une grande efficacité et les résultats qu‘ils retournent ne correspondent pas toujours aux besoins des utilisateurs. Pour cette raison, Nos travaux de thèse s'inscrivent dans le contexte de la GIR, et du Web sémantique via les ontologies en vue d'une amélioration au processus de la recherche. L‘optique du Web sémantique dans la GIR est d‘expliciter la connaissance contenue dans les différents documents et de la formaliser afin que les agents de recherche d‘information puissent l‘exploiter via des mécanismes d‘inférences et fournir de meilleures réponses au besoin de l‘utilisateur. Nos contributions portent sur deux volets complémentaires : d‘abord l‘amélioration du processus de la GIR par la prise en compte de la sémantique. Puis, la définition des nouvelles approches d‘indexation et d‘extraction d‘informations pour l‘amélioration des performances des systèmes de GIR en langue Arabe. Pour le premier volet, nous proposons un système de récupération d‘information géographique spatio-temporelle basé sur une ontologie d‘application STATO développée. Pour cela, nous proposons également une méthodologie de conception et de création de notre ontologie basée sur l'ontologie BFO et la division administrative Algérienne. Pour le deuxième volet, on propose deux nouvelles approches. Notre première approche s‘inscrit dans le cadre de l‘indexation spatiale, on propose un nouveau prototype système d‘extraction et de combinaison automatique des informations spatio-temporelles à partir des documents textuels Arabes. Afin d‘assurer une continuité dans l‘enchaînement de nos contributions, on propose une deuxième approche spatio-temporelle pour l‘extraction automatique et à temps réel des événements criminels depuis des Tweets Arabes. Ces propositions ont été expérimentées sur différents corpus, évaluées qualitativement et quantitativement et puis comparées. Les résultats obtenus ont prouvé l'efficacité des méthodes proposées. Mots-clés Recherche d‘information géographique, web sémantique, ontologie, information spatio-temporelle, indexation spatiale, la langue Arabe. 4 Abstract Geographic Information Retrieval (GIR) can be considered as a specialized branch of classical research. But in addition emphasizes the notions of spatial indexing and geographical research. However, search engines (Google, Bing, Yahoo ... etc) do not achieve high efficiency and the results they return do not always match the needs of users. For this reason, our thesis is related to the context of GIR, and the semantic Web via ontologies to assist in the retrieval process. The semantic Web perspective in GIR is to clarify the knowledge contained in the various documents and to formalize it so that the information retrieval agents can exploit it via inference mechanisms and provide better answers if necessary to the user. Our contributions focus on two complementary axis: first, the improvement of the GIR process by taking into account the semantics. Then, the definition of new indexing and retrieving approaches to improve the performances of GIR systems in Arabic language. In the first axis, we propose a spatial and temporal information retrieval system based on the developed application ontology STATO. To do this, we also propose a methodology for the design and the creation of our ontology based on the BFO ontology and the Algerian administrative division. In the second axis, two new approaches are proposed. Our first approach is spatial indexing; we propose a new prototype system for automatic extraction and combination of spatio- temporal information from Arabic text documents. To ensure continuity in the flow of our contributions, we propose a second spatio-temporal approach for the automatic and real-time extraction of criminal-related events from Arabic Tweets. These proposals were tested on different corpus, evaluated qualitatively and quantitatively and then compared. The results obtained proved the effectiveness of the proposed approaches. Keywords: geographic information retrieval, semantic web, ontology, spatio-temporal information, spatial indexing, Arabic language. 5 ُيهخص ًٌكٍ اػرثاس اعرشظاع انؼًهٕياخ انعغشافٍح )ظٍش( فشػا يرخصصا نهثؽس انكﻻعٍكً ػٍ انؼًهٕياخ. ٔنكٍ تاﻹضافح إنى رنك ٌؤكذ ػهى يفٕٓيً انفٓشعح انًكاٍَح ٔانثؽس انعغشافً. ٔيغ رنك، فئٌ يؽشكاخ انثؽس )ظٕظم، تُط، ٌإْ ... انخ( ﻻ ذؽمك كفاءج ػانٍح ٔانُرائط اليغرشظؼح ﻻ ذرطاتك دائًا يغ اؼرٍاظاخ انًغرخذيٍٍ. نٓزا انغثة، ٌُذسض ػًم اأطشؼٔرٍ فً عٍاق ظٍش، ٔانٌٕة انذﻻنً ػٍ طشٌك اعرخذاو اأَٔرٕنٕظً نهًغاػذج فً ػًهٍح اﻻعرشظاع. يُظٕس انٌٕة انذﻻنً فً ظٍش ْٕ ذٕضػٍ انؼًشفح انٕاسدج فً يخرهف انٕشائك ٔ انًهفاخ ٔإضفاء انطاتغ انشعًً ػهٍّ تؽٍس ًٌكٍ اعرشظاع انؼًهٕياخ ٔ اعرغﻻنٓا ػٍ طشٌك آنٍاخ اﻻعرذﻻل ٔذمذٌى إظاتاخ أفضم إرا نضو اﻷيش نهًغرخذو. ذشكض يغاًْاذُا ػهى يؽٕسٌٍ يركايهٍٍ: أٔﻻ، ذؽغٍٍ ػًهٍح ظٍش يٍ خﻻل اﻷخز فً اﻻػرثاس انذﻻﻻخ. ٔ كذا ذؼشٌف َضى ظذٌذج لفٓشعح انؼًهٕياخ ٔ اﻻعرشظاع نرؽغٍٍ أداء َظى ظٍش فً انهغح انؼشتٍح. فً انؽًٕس اﻷٔل، َمرشغ َظاو اعرشظاع انؼًهٕياخ انًكاٍَح ٔانضيٍُح اعرُادا إنى ذطثٍك اﻻَٔرٕنٕظٍا 'عراذٕ'. ٔنهمٍاو تزنك، فئَُا َمرشغ أٌضا يُٓعٍح نرصًٍى ٔإَشاء ْذِ اﻷَطٕنٕظٍا ػهى أعاط أَٔرٕنؼٍٕا تفٕ ٔالخلظوي اﻹداسي انعضائشي. ٔفً انؽًٕس انصاًَ، ٌلرشغ َٓعاٌ ظذٌذاٌ. أٔﻻ َٓط يرؼهك بانفٓشعح انًكاٍَح، َمرشغ َظاو ًَٕرض ظذٌذ نﻻعرخشاض انرهمائً ٔانعًغ تٍٍ انؼًهٕياخ انًكاٍَح ٔانضيٍُح يٍ انٕشائك ٔ انًهفاخ انُصٍح انؼشتٍح. ٔنضًاٌ اﻻعرًشاسٌح فً يٕاضٍغ يغاًْاذُا، َمرشغ شاٍَا َٓعا صيٍُا ٔيكاًَ ﻻعرغﻻل آنً ٔفؼهً نﻷؼذاز اﻹظشايٍح يٍ ذغشٌذاخ ذٌٕرش تانهغح انؼشتٍح. ذى اخرثاس ْزِ انًمرشؼاخ ػهى يعػًٕح يخرهفح، ذى ذمًٍٍٓا ػَٕا ٔكًا ٔيٍ شى يماسَرٓا. ٔأشثرد انُرائط انرً ذى انؽصٕل ػهٍٓا فؼانٍح الو اٌْط انًمرشؼح. انكهًبد انًفزبحٍخ . اعرشظاع انؼًهٕياخ انعغشافٍح. انٌٕة انذﻻنً ، اﻷَطٕنٕظٍا. انؼًهٕياخ انًكاٍَح ٔانضياٍَح. انفٓشعح انًكاٍَح. انهغح انؼشتٍح 6 Tables des matières Listes des figures Liste des tableaux Introduction générale I État de l'art 1/ Recherche d’information géographique (GIR) 1. Introduction…………………………………………………………….. 20 2. L‘information géographique……………………………………………. 20 2.1 Les composants d‘une information géographique………………….. 21 2.1.1. Les données spatiales…………………………………………. 21 2.1.2. Les données temporelles………………………........................ 21 2.1.3. Les attributs……………………………………....................... 21 2.2 Caractéristiques des données géographiques……………………….. 22 2.3 Sources de données géographiques……………………………... ….. 23 2.4 Modélisation de l‘information géographique dans des documents 24 textuels…….......................................................................................................... 24 3. Recherche d‘information géographique (GIR) …………………............. 25 3.1 Recherche d‘information spatiale………………............................... 25 3.2 Recherche d‘information temporelle…………………....................... 25 3.3 Processus de la GIR……………………………………………........ 26 4. Extraction et Indexation d‘information dans le but de RIG……………. 27 4.1 Extraction d‘information spatiale…………………………………… 28 4.2 Extraction d‘information temporelle ………………………………... 29 5. RIG en langue Arabe……………………………………………….……. 29 5.1 Particularité de la langue Arabe……………………………………... 29 5.1.1