Tables Des Matières

Total Page:16

File Type:pdf, Size:1020Kb

Tables Des Matières République Algérienne Démocratique et Populaire Ministère de l‘enseignement Supérieur et de la Recherche Scientifique Université Abdelhamid Mehri- Constantine 2 Faculté des Nouvelles Technologies de l‘Information et la Communication Département de l‘Informatique Fondamentale et ses Applications Laboratoire MISC-Equipe OSSIG Année : No d‘ordre : Série : THESE Pour l‘obtention du diplôme de Doctorat 3éme cycle LMD Option : Systèmes Complexes Recherche d‘Information Géographique à l‘aide des Ontologies Spatiales de Localisation Présentée par : Feriel ABDELKOUI Soutenue le devant le jury composé de : Pr. ZAROUR Nacer Eddine Président Université Abdelhamid Mehri- Constantine 2 Dr. BELHADEF Hacene Examinateur Université Abdelhamid Mehri- Constantine 2 Pr. CHALAL Rachid Examinateur Ecole nationale supérieure d‘informatique. ESI Alger Pr. BALLA Amar Examinateur Ecole nationale supérieure d‘informatique. ESI Alger Pr. KHOLLADI Mohamed Rapporteur Université Echahid Hamma lakhdar, El-oued khireddine 1 Remerciements Je tiens à remercier toute personne ayant participé, de loin ou de prêt à la réalisation de ce travail. Je suis extrêmement reconnaissante envers Monsieur Mohamed Khireddine KHOLLADI, d’avoir accepté d’être mon Directeur de thèse, Je le remercie pour la confiance qu'il m'a accordée, la patience, la gentillesse et la disponibilité dont il a fait preuve. Qu’il trouve ici l'expression de ma très grande gratitude. Je remercie particulièrement les membres de jury de m’avoir accordé l’honneur d’accepter l’évaluation de ce travail. Je tiens à remercier Mr. ZAROUR Nacer Eddine, Professeur à l'université de Constantine 2, Abdelhamid Mehri, Mr. CHALAL Rachid, Professeur à Ecole nationale supérieure d‘informatique. ESI .Alger, Mr BALLA Amar, Professeur à Ecole nationale supérieure d‘informatique. ESI Alger, et Mr BELHADEF Hacene, Maitre de conférences, à l'université de Constantine 2, Abdelhamid Mehri Je remercie du fond du cœur et avec un grand amour mes parents qui n'ont jamais cessé de croire en moi pendant toutes mes années d'études. Et à toute la famille qui m'ont toujours encouragée. 2 Je dédie cette thèse A ma princesse MARIA RAZANE 3 Résumé La recherche d‘information géographique ou GIR (Geographic Information Retrieval) peut être considérée comme une branche spécialisée de la recherche classique. Mais en plus en met l‘accent sur les notions de l‘indexation spatiale et la recherche géographique. Toutefois, Les moteurs de recherche (Google, Bing, Yahoo…etc.) ne permettent pas d‘atteindre une grande efficacité et les résultats qu‘ils retournent ne correspondent pas toujours aux besoins des utilisateurs. Pour cette raison, Nos travaux de thèse s'inscrivent dans le contexte de la GIR, et du Web sémantique via les ontologies en vue d'une amélioration au processus de la recherche. L‘optique du Web sémantique dans la GIR est d‘expliciter la connaissance contenue dans les différents documents et de la formaliser afin que les agents de recherche d‘information puissent l‘exploiter via des mécanismes d‘inférences et fournir de meilleures réponses au besoin de l‘utilisateur. Nos contributions portent sur deux volets complémentaires : d‘abord l‘amélioration du processus de la GIR par la prise en compte de la sémantique. Puis, la définition des nouvelles approches d‘indexation et d‘extraction d‘informations pour l‘amélioration des performances des systèmes de GIR en langue Arabe. Pour le premier volet, nous proposons un système de récupération d‘information géographique spatio-temporelle basé sur une ontologie d‘application STATO développée. Pour cela, nous proposons également une méthodologie de conception et de création de notre ontologie basée sur l'ontologie BFO et la division administrative Algérienne. Pour le deuxième volet, on propose deux nouvelles approches. Notre première approche s‘inscrit dans le cadre de l‘indexation spatiale, on propose un nouveau prototype système d‘extraction et de combinaison automatique des informations spatio-temporelles à partir des documents textuels Arabes. Afin d‘assurer une continuité dans l‘enchaînement de nos contributions, on propose une deuxième approche spatio-temporelle pour l‘extraction automatique et à temps réel des événements criminels depuis des Tweets Arabes. Ces propositions ont été expérimentées sur différents corpus, évaluées qualitativement et quantitativement et puis comparées. Les résultats obtenus ont prouvé l'efficacité des méthodes proposées. Mots-clés Recherche d‘information géographique, web sémantique, ontologie, information spatio-temporelle, indexation spatiale, la langue Arabe. 4 Abstract Geographic Information Retrieval (GIR) can be considered as a specialized branch of classical research. But in addition emphasizes the notions of spatial indexing and geographical research. However, search engines (Google, Bing, Yahoo ... etc) do not achieve high efficiency and the results they return do not always match the needs of users. For this reason, our thesis is related to the context of GIR, and the semantic Web via ontologies to assist in the retrieval process. The semantic Web perspective in GIR is to clarify the knowledge contained in the various documents and to formalize it so that the information retrieval agents can exploit it via inference mechanisms and provide better answers if necessary to the user. Our contributions focus on two complementary axis: first, the improvement of the GIR process by taking into account the semantics. Then, the definition of new indexing and retrieving approaches to improve the performances of GIR systems in Arabic language. In the first axis, we propose a spatial and temporal information retrieval system based on the developed application ontology STATO. To do this, we also propose a methodology for the design and the creation of our ontology based on the BFO ontology and the Algerian administrative division. In the second axis, two new approaches are proposed. Our first approach is spatial indexing; we propose a new prototype system for automatic extraction and combination of spatio- temporal information from Arabic text documents. To ensure continuity in the flow of our contributions, we propose a second spatio-temporal approach for the automatic and real-time extraction of criminal-related events from Arabic Tweets. These proposals were tested on different corpus, evaluated qualitatively and quantitatively and then compared. The results obtained proved the effectiveness of the proposed approaches. Keywords: geographic information retrieval, semantic web, ontology, spatio-temporal information, spatial indexing, Arabic language. 5 ُيهخص ًٌكٍ اػرثاس اعرشظاع انؼًهٕياخ انعغشافٍح )ظٍش( فشػا يرخصصا نهثؽس انكﻻعٍكً ػٍ انؼًهٕياخ. ٔنكٍ تاﻹضافح إنى رنك ٌؤكذ ػهى يفٕٓيً انفٓشعح انًكاٍَح ٔانثؽس انعغشافً. ٔيغ رنك، فئٌ يؽشكاخ انثؽس )ظٕظم، تُط، ٌإْ ... انخ( ﻻ ذؽمك كفاءج ػانٍح ٔانُرائط اليغرشظؼح ﻻ ذرطاتك دائًا يغ اؼرٍاظاخ انًغرخذيٍٍ. نٓزا انغثة، ٌُذسض ػًم اأطشؼٔرٍ فً عٍاق ظٍش، ٔانٌٕة انذﻻنً ػٍ طشٌك اعرخذاو اأَٔرٕنٕظً نهًغاػذج فً ػًهٍح اﻻعرشظاع. يُظٕس انٌٕة انذﻻنً فً ظٍش ْٕ ذٕضػٍ انؼًشفح انٕاسدج فً يخرهف انٕشائك ٔ انًهفاخ ٔإضفاء انطاتغ انشعًً ػهٍّ تؽٍس ًٌكٍ اعرشظاع انؼًهٕياخ ٔ اعرغﻻنٓا ػٍ طشٌك آنٍاخ اﻻعرذﻻل ٔذمذٌى إظاتاخ أفضم إرا نضو اﻷيش نهًغرخذو. ذشكض يغاًْاذُا ػهى يؽٕسٌٍ يركايهٍٍ: أٔﻻ، ذؽغٍٍ ػًهٍح ظٍش يٍ خﻻل اﻷخز فً اﻻػرثاس انذﻻﻻخ. ٔ كذا ذؼشٌف َضى ظذٌذج لفٓشعح انؼًهٕياخ ٔ اﻻعرشظاع نرؽغٍٍ أداء َظى ظٍش فً انهغح انؼشتٍح. فً انؽًٕس اﻷٔل، َمرشغ َظاو اعرشظاع انؼًهٕياخ انًكاٍَح ٔانضيٍُح اعرُادا إنى ذطثٍك اﻻَٔرٕنٕظٍا 'عراذٕ'. ٔنهمٍاو تزنك، فئَُا َمرشغ أٌضا يُٓعٍح نرصًٍى ٔإَشاء ْذِ اﻷَطٕنٕظٍا ػهى أعاط أَٔرٕنؼٍٕا تفٕ ٔالخلظوي اﻹداسي انعضائشي. ٔفً انؽًٕس انصاًَ، ٌلرشغ َٓعاٌ ظذٌذاٌ. أٔﻻ َٓط يرؼهك بانفٓشعح انًكاٍَح، َمرشغ َظاو ًَٕرض ظذٌذ نﻻعرخشاض انرهمائً ٔانعًغ تٍٍ انؼًهٕياخ انًكاٍَح ٔانضيٍُح يٍ انٕشائك ٔ انًهفاخ انُصٍح انؼشتٍح. ٔنضًاٌ اﻻعرًشاسٌح فً يٕاضٍغ يغاًْاذُا، َمرشغ شاٍَا َٓعا صيٍُا ٔيكاًَ ﻻعرغﻻل آنً ٔفؼهً نﻷؼذاز اﻹظشايٍح يٍ ذغشٌذاخ ذٌٕرش تانهغح انؼشتٍح. ذى اخرثاس ْزِ انًمرشؼاخ ػهى يعػًٕح يخرهفح، ذى ذمًٍٍٓا ػَٕا ٔكًا ٔيٍ شى يماسَرٓا. ٔأشثرد انُرائط انرً ذى انؽصٕل ػهٍٓا فؼانٍح الو اٌْط انًمرشؼح. انكهًبد انًفزبحٍخ . اعرشظاع انؼًهٕياخ انعغشافٍح. انٌٕة انذﻻنً ، اﻷَطٕنٕظٍا. انؼًهٕياخ انًكاٍَح ٔانضياٍَح. انفٓشعح انًكاٍَح. انهغح انؼشتٍح 6 Tables des matières Listes des figures Liste des tableaux Introduction générale I État de l'art 1/ Recherche d’information géographique (GIR) 1. Introduction…………………………………………………………….. 20 2. L‘information géographique……………………………………………. 20 2.1 Les composants d‘une information géographique………………….. 21 2.1.1. Les données spatiales…………………………………………. 21 2.1.2. Les données temporelles………………………........................ 21 2.1.3. Les attributs……………………………………....................... 21 2.2 Caractéristiques des données géographiques……………………….. 22 2.3 Sources de données géographiques……………………………... ….. 23 2.4 Modélisation de l‘information géographique dans des documents 24 textuels…….......................................................................................................... 24 3. Recherche d‘information géographique (GIR) …………………............. 25 3.1 Recherche d‘information spatiale………………............................... 25 3.2 Recherche d‘information temporelle…………………....................... 25 3.3 Processus de la GIR……………………………………………........ 26 4. Extraction et Indexation d‘information dans le but de RIG……………. 27 4.1 Extraction d‘information spatiale…………………………………… 28 4.2 Extraction d‘information temporelle ………………………………... 29 5. RIG en langue Arabe……………………………………………….……. 29 5.1 Particularité de la langue Arabe……………………………………... 29 5.1.1
Recommended publications
  • D1.3 Deliverable Title: Action Ontology and Object Categories Type
    Deliverable number: D1.3 Deliverable Title: Action ontology and object categories Type (Internal, Restricted, Public): PU Authors: Daiva Vitkute-Adzgauskiene, Jurgita Kapociute, Irena Markievicz, Tomas Krilavicius, Minija Tamosiunaite, Florentin Wörgötter Contributing Partners: UGOE, VMU Project acronym: ACAT Project Type: STREP Project Title: Learning and Execution of Action Categories Contract Number: 600578 Starting Date: 01-03-2013 Ending Date: 30-04-2016 Contractual Date of Delivery to the EC: 31-08-2015 Actual Date of Delivery to the EC: 04-09-2015 Page 1 of 16 Content 1. EXECUTIVE SUMMARY .................................................................................................................... 2 2. INTRODUCTION .............................................................................................................................. 3 3. OVERVIEW OF THE ACAT ONTOLOGY STRUCTURE ............................................................................ 3 4. OBJECT CATEGORIZATION BY THEIR SEMANTIC ROLES IN THE INSTRUCTION SENTENCE .................... 9 5. HIERARCHICAL OBJECT STRUCTURES ............................................................................................. 13 6. MULTI-WORD OBJECT NAME RESOLUTION .................................................................................... 15 7. CONCLUSIONS AND FUTURE WORK ............................................................................................... 16 8. REFERENCES ................................................................................................................................
    [Show full text]
  • Journal Officiel N°2020-5
    N° 05 Mercredi 4 Joumada Ethania 1441 59ème ANNEE Correspondant au 29 janvier 2020 JJOOUURRNNAALL OOFFFFIICCIIEELL DE LA REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE CONVENTIONS ET ACCORDS INTERNATIONAUX - LOIS ET DECRETS ARRETES, DECISIONS, AVIS, COMMUNICATIONS ET ANNONCES (TRADUCTION FRANÇAISE) Algérie ETRANGER DIRECTION ET REDACTION Tunisie SECRETARIAT GENERAL ABONNEMENT Maroc (Pays autres DU GOUVERNEMENT ANNUEL Libye que le Maghreb) WWW.JORADP.DZ Mauritanie Abonnement et publicité: IMPRIMERIE OFFICIELLE 1 An 1 An Les Vergers, Bir-Mourad Raïs, BP 376 ALGER-GARE Tél : 021.54.35..06 à 09 Edition originale................................... 1090,00 D.A 2675,00 D.A Fax : Edition originale et sa traduction.... 2180,00 D.A 5350,00 D.A C.C.P. 3200-50 ALGER TELEX : 65 180 IMPOF DZ (Frais d'expédition en sus) BADR : 060.300.0007 68/KG ETRANGER : (Compte devises) BADR : 060.320.0600 12 Edition originale, le numéro : 14,00 dinars. Edition originale et sa traduction, le numéro : 28,00 dinars. Numéros des années antérieures : suivant barème. Les tables sont fournies gratuitement aux abonnés. Prière de joindre la dernière bande pour renouvellement, réclamation, et changement d'adresse. Tarif des insertions : 60,00 dinars la ligne 2 JOURNAL OFFICIEL DE LA REPUBLIQUE ALGERIENNE N° 05 4 Joumada Ethania 1441 29 janvier 2020 SOMMAIRE DECRETS Décret présidentiel n° 20-07 du 29 Joumada El Oula 1441 correspondant au 25 janvier 2020 fixant les attributions et l’organisation des services de la Présidence de la République............................................................................................................................. 4 Décret exécutif n° 19-391 du 4 Joumada El Oula 1441 correspondant au 31 décembre 2019 modifiant la répartition par secteur des dépenses d’équipement de l’Etat pour 2019........................................................................................................................................
    [Show full text]
  • Journal Officiel = De La Republique Algerienne Democratique Et Populaire Conventions Et Accords Internationaux - Lois Et Decrets
    No 22 ~ Mercredi 14 Moharram 1421 ~ . 39 ANNEE correspondant au 19 avril 2000 Pee nls 43 Ub! sess Sbykelig bte é yr celyly S\,\n JOURNAL OFFICIEL = DE LA REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE CONVENTIONS ET ACCORDS INTERNATIONAUX - LOIS ET DECRETS. ARRETES, DECISIONS, AVIS, COMMUNICATIONS ET ANNONCES (TRADUCTION FRANCAISE) Algérie ; ER DIRECTION ET REDACTION: Tunisie ETRANGER SECRETARIAT GENERAL ABONNEMENT Maroc (Pays autres DU GOUVERNEMENT ANNUEL Libyeye que le Maghreb) ” , Mauritanie Abonnement et publicité: : IMPRIMERIE OFFICIELLE 1 An- 1 An 7,9 et 13 Av. A. Benbarek-ALGER Tél: 65.18.15 a 17 - C.C.P. 3200-50 | Edition originale.....ccccsesseeees 856,00 D.A| 2140,00 D.A _ ALGER Télex: 65 180 IMPOF DZ . BADR: 060.300.0007 68/KG Edition originale et sa traduction}1712,00 D.A|. .4280,00 D.A ETRANGER: (Compte devises): (Frais d'expédition en sus) BADR: 060.320.0600 12 Edition originale, le numéro : 10,00 dinars. Edition originale et sa traduction, le numéro : 20,00 dinars. Numéros des années antérieures : suivant baréme. Les tables sont fournies gratuitement aux abonnés. Priére de joindre la derniére bande pour renouvellement, réclamation, et changement d'adresse. Tarif des insertions : 60,00 dinars la ligne. JOURNAL OFFICIEL DE LA REPUBLIQUE ALGERIENNE N° 22.14 Moharram 1421 19 avril 2000 SOMMAIRE | | ; ARRETES, DECISIONS ET AVIS | MINISTERE DES FINANCES Arrété du 13 Ramadhan 1420 correspondant au 21 décembre 1999 modifiant et complétant l'arrété du 26 Rajab 1416 -correspondant au 19 décembre 1995 portant création des inspections des impéts dans les wilayas relevant de la _,direction régionale des imp6ts de Chlef...
    [Show full text]
  • Journal Officiel De La Republique Algerienne Na
    19 Dhou El Kaada 1434 JOURNAL OFFICIEL DE LA REPUBLIQUE ALGERIENNE N° 47 25 septembre 2013 31 Ressort territorial de l’inspection Wilaya Designation de l’inspection Daira Commune DJELFA Djelfa Djelfa EL IDRISSIA El Idrissia El Idrissia, Douis, Ain Chouhada Charef Charef, El Guedid, , Beni Yacoub HASSI BAHBAH Hassi Bahbah Hassi Bahbah, Zaâfrane, Hassi El Euch, Ain Maabed Dar Chioukh Dar Chioukh, M'liliha, Sidi Baizid AIN OUSSERA Ain Oussera Ain Oussera, Guernini DJELFA Sidi Ladjell Sidi Ladjel, Hassi Fedoul, El Khemis BIRINE Birine Birine, Benhar Had Sahary Had Sahary, Bouira Lahdeb, Ain Feka MESSAAD Messaad Messaad, Guettara, Deldoul, Sed Rahal, Selmana AIN EL IBEL Ain El Ibel Ain El Ibel, Zaccar, Mouadjebar, Tadmit Faidh El Botma Faidh El Botma, Amourah, Oum El Adham JIJEL Jijel Jijel Djimla Djimla, Boudria, Beniyadjis Texenna Texenna, Kaous EL AOUANA El Aouana El Aouana, Selma Ben Ziada Ziamah Mansouriah Ziamah Mansouriah, Erraguene TAHER Taher Taher, Boucif Ouled Askeur, Oudjana, Emir Abdelkader, Chahna JIJEL Chekfa Chekfa, Bordj T'har, Sidi Abdelaziz, El Kennar Nouchfi EL MILIA El Milia El Milia, Ouled Yahia Khadrouche Sidi Marouf Sidi Marouf, Ouled Rabah Settara Settara, Ghebala El Ancer El Ancer, Khier Oued Adjoul, Djemaa Beni Habibi, Bouraoui Belhadef SETIF Sétif Sétif Guidjel Guidjel, Ouled Sabor Ain Arnat Ain Arnat, Ain Abessa, El Ouricia, Mezloug AIN EL KEBIRA Ain El Kebira Ain El Kebira, Dehamcha, Ouled Addouane Babor Babor, Serdj El Ghoul Amoucha Amoucha,Tizi N'bchar, Oued Bared BENI AZIZ Beni Aziz Beni Aziz, Ain Sebt, Maâouia,
    [Show full text]
  • Manallah-Imene.Pdf
    République Algérienne Démocratique et Populaire Ministère de l’Enseignement Supérieur et de la Recherche Scientifique Université Ferhat Abbas–SETIF MÉMOIRE Présenté à la Faculté des Sciences de la Nature et de la Vie Département d’Agronomie Pour l’obtention du diplôme de MAGISTERE Spécialité : Production Animale Option : Amélioration de la Production Animale Par MANALLAH Imene THEME Caractérisation morphologique des caprins dans la région de Sétif. Présenté et soutenu Publiquement le 23/02/2012 Devant le jury : Président : M. HAFSI M Professeur (UFA – Sétif) Rapporteur : M. DEKHILI M Professeur (UFA – Sétif) Examinateur : M. HOUCHER B Professeur (UFA – Sétif) Examinateur : M. BOUNECHADA M Maître de conférences (UFA – Sétif) Remerciements REMERCIEMENTS Je remercie ALLAH le tout puissant qui m’a offert santé, courage, patience et volonté, me permettant de mener à terme ce présent travail. Je voudrais exprimer mes remerciements, ma profonde gratitude et toutes mes reconnaissances à monsieur DEKHILI M (Professeur à l’Université Ferhat Abbas de Sétif) pour m’avoir fait bénéficier de ces compétences scientifiques, ses qualités humaines et sa constante disponibilité. J’exprime ma profonde gratitude à monsieur HAFSI M Professeur à l’université de Sétif, qui a honoré notre travail en acceptant la présidence du jury. Mes remerciements s’adressent également à messieurs les membres du jury : HOUCHER B (Professeur à l’Université Ferhat Abbas de Sétif) et BOUNECHADA M (Maître de conférences à l’Université Ferhat Abbas de Sétif) qui ont apporté tous leurs soins dans l’évaluation de ce travail. Je tiens également à remercier les délégués communaux et les personnels des subdivisions agricoles pour l’aide qu’ils m’ont apporté durant la réalisation de ce travail.
    [Show full text]
  • Collocation Classification with Unsupervised Relation Vectors
    Collocation Classification with Unsupervised Relation Vectors Luis Espinosa-Anke1, Leo Wanner2,3, and Steven Schockaert1 1School of Computer Science, Cardiff University, United Kingdom 2ICREA and 3NLP Group, Universitat Pompeu Fabra, Barcelona, Spain fespinosa-ankel, [email protected] Abstract Morphosyntactic relations have been the focus of work on unsupervised relational similarity, as Lexical relation classification is the task of it has been shown that verb conjugation or nomi- predicting whether a certain relation holds be- nalization patterns are relatively well preserved in tween a given pair of words. In this pa- vector spaces (Mikolov et al., 2013; Pennington per, we explore to which extent the current et al., 2014a). Semantic relations pose a greater distributional landscape based on word em- beddings provides a suitable basis for classi- challenge (Vylomova et al., 2016), however. In fication of collocations, i.e., pairs of words fact, as of today, it is unclear which operation per- between which idiosyncratic lexical relations forms best (and why) for the recognition of indi- hold. First, we introduce a novel dataset with vidual lexico-semantic relations (e.g., hyperonymy collocations categorized according to lexical or meronymy, as opposed to cause, location or ac- functions. Second, we conduct experiments tion). Still, a number of works address this chal- on a subset of this benchmark, comparing it in lenge. For instance, hypernymy has been modeled particular to the well known DiffVec dataset. In these experiments, in addition to simple using vector concatenation (Baroni et al., 2012), word vector arithmetic operations, we also in- vector difference and component-wise squared vestigate the role of unsupervised relation vec- difference (Roller et al., 2014) as input to linear tors as a complementary input.
    [Show full text]
  • Comparative Evaluation of Collocation Extraction Metrics
    Comparative Evaluation of Collocation Extraction Metrics Aristomenis Thanopoulos, Nikos Fakotakis, George Kokkinakis Wire Communications Laboratory Electrical & Computer Engineering Dept., University of Patras 265 00 Rion, Patras, Greece {aristom,fakotaki,gkokkin} Abstract Corpus-based automatic extraction of collocations is typically carried out employing some statistic indicating concurrency in order to identify words that co-occur more often than expected by chance. In this paper we are concerned with some typical measures such as the t-score, Pearson’s χ-square test, log-likelihood ratio, pointwise mutual information and a novel information theoretic measure, namely mutual dependency. Apart from some theoretical discussion about their correlation, we perform comparative evaluation experiments judging performance by their ability to identify lexically associated bigrams. We use two different gold standards: WordNet and lists of named-entities. Besides discovering that a frequency-biased version of mutual dependency performs the best, followed close by likelihood ratio, we point out some implications that usage of available electronic dictionaries such as the WordNet for evaluation of collocation extraction encompasses. dependence, several metrics have been adopted by the 1. Introduction corpus linguistics community. Typical statistics are Collocational information is important not only for the t-score (TSC), Pearson’s χ-square test (χ2), log- second language learning but also for many natural likelihood ratio (LLR) and pointwise mutual language processing tasks. Specifically, in natural information (PMI). However, usually no systematic language generation and machine translation it is comparative evaluation is accomplished. For example, necessary to ensure generation of lexically correct Kita et al. (1993) accomplish partial and intuitive expressions; for example, “strong”, unlike “powerful”, comparisons between metrics, while Smadja (1993) modifies “coffee” but not “computers”.
    [Show full text]
  • Collocation Extraction Using Parallel Corpus
    Collocation Extraction Using Parallel Corpus Kavosh Asadi Atui1 Heshaam Faili1 Kaveh Assadi Atuie2 (1)NLP Laboratory, Electrical and Computer Engineering Dept., University of Tehran, Iran (2)Electrical Engineering Dept., Sharif University of Technology, Iran [email protected],[email protected],[email protected] ABSTRACT This paper presents a novel method to extract the collocations of the Persian language using a parallel corpus. The method is applicable having a parallel corpus between a target language and any other high-resource one. Without the need for an accurate parser for the target side, it aims to parse the sentences to capture long distance collocations and to generate more precise results. A training data built by bootstrapping is also used to rank the candidates with a log-linear model. The method improves the precision and recall of collocation extraction by 5 and 3 percent respectively in comparison with the window-based statistical method in terms of being a Persian multi-word expression. KEYWORDS: Information and Content Extraction, Parallel Corpus, Under-resourced Languages Proceedings of COLING 2012: Posters, pages 93–102, COLING 2012, Mumbai, December 2012. 93 1 Introduction Collocation is usually interpreted as the occurrence of two or more words within a short space in a text (Sinclair, 1987). This definition however is not precise, because it is not possible to define a short space. It also implies the strategy that all traditional models had. They were looking for co- occurrences rather than collocations (Seretan, 2011). Consider the following sentence and its Persian translation1: "Lecturer issued a major and also impossible to solve problem." مدرس یک مشکل بزرگ و غیر قابل حل را عنوان کرد.
    [Show full text]
  • Journal Officiel Algérie
    N° 73 Dimanche Aouel Rabie Ethani 1440 57ème ANNEE Correspondant au 9 décembre 2018 JJOOUURRNNAALL OOFFFFIICCIIEELL DE LA REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE CONVENTIONS ET ACCORDS INTERNATIONAUX - LOIS ET DECRETS ARRETES, DECISIONS, AVIS, COMMUNICATIONS ET ANNONCES (TRADUCTION FRANÇAISE) Algérie ETRANGER DIRECTION ET REDACTION Tunisie SECRETARIAT GENERAL ABONNEMENT Maroc (Pays autres DU GOUVERNEMENT ANNUEL Libye que le Maghreb) WWW.JORADP.DZ Mauritanie Abonnement et publicité: IMPRIMERIE OFFICIELLE 1 An 1 An Les Vergers, Bir-Mourad Raïs, BP 376 ALGER-GARE Tél : 021.54.35..06 à 09 Edition originale................................... 1090,00 D.A 2675,00 D.A Fax : Edition originale et sa traduction.... 2180,00 D.A 5350,00 D.A C.C.P. 3200-50 ALGER TELEX : 65 180 IMPOF DZ (Frais d'expédition en sus) BADR : 060.300.0007 68/KG ETRANGER : (Compte devises) BADR : 060.320.0600 12 Edition originale, le numéro : 14,00 dinars. Edition originale et sa traduction, le numéro : 28,00 dinars. Numéros des années antérieures : suivant barème. Les tables sont fournies gratuitement aux abonnés. Prière de joindre la dernière bande pour renouvellement, réclamation, et changement d'adresse. Tarif des insertions : 60,00 dinars la ligne Aouel Rabie Ethani 1440 2 JOURNAL OFFICIEL DE LA REPUBLIQUE ALGERIENNE N° 73 9 décembre 2018 SOMMAIRE DECRETS Décret présidentiel n° 18-304 du 28 Rabie El Aouel 1440 correspondant au 6 décembre 2018 portant transfert de crédits au budget de fonctionnement du ministère des affaires étrangères....................................................................................................................... 4 Décret présidentiel n° 18-305 du 28 Rabie El Aouel 1440 correspondant au 6 décembre 2018 portant transfert de crédits au budget de fonctionnement du ministère des affaires étrangères.....................................................................................................................
    [Show full text]
  • Mihi Ali.Pdf
    N0 ……../SNV/2012 Département de biologie et écologie végétale MEMOIRE Présenté par : MIHI Ali Pour obtenir le diplôme de Magister Option : Biodiversité et gestion des écosystèmes THEME : La forêt de Zenadia (Haute Plaine Sétifienne) Diagnostic et perspective de protection Soutenu publiquement le 20/06/2012 Devant le jury Président : KAABECHE M . Pr. Université de Sétif Rapporteur : DJIRAR N. M.C.A. Université de Sétif Examinateur : BOUNCHADA M. M.C.A. Université de Sétif Examinateur : BENIA F. M.C.A. Université de Sétif Année universitaire 2011-2012 Dédicaces Je dédie ce modeste travail à ceux qui ont fait de moi ce que je suis et ne cessent de me soutenir et de m’encourager : ma mère et mon père pour tout l’appui et soutien qu’ils m’avaient offert, A mes chers frères et sœurs ; A mes oncles et mes tantes ; A mes cousins et cousines ; A tous mes ami (e)s et collègues ; Et à toutes les personnes qui me tiennent à cœur, merci. Remerciements Au terme de cette étude, je remercie avant tout Dieu le Tout Puissant, de m’avoir donné la foi et le courage et de m’avoir guidé pour l’accomplissement de ce travail. J’ai l’honneur de remercier tous ceux qui ont collaboré de près ou de loin à l’élaboration de ce travail, je cite en premier lieu, mon encadreur le Dr. DJIRAR N. qui a suivi ce travail. Qu’il trouve ici l’expression de ma reconnaissance et mon profond respect pour ses précieux conseils, son aide et sa disponibilité. Je remercie vivement Mr.
    [Show full text]
  • Saint Arnaud
    INFO 687 ST-ARNAUD « Non au 19 mars » SAINT ARNAUD (Devenue EL EULMA à l’indépendance) Dans l’Est algérien, SAINT-ARNAUD est situé dans la partie basse des Hauts Plateaux sétifiens et à 950 mètres d’altitude. Sur la Nationale 5, à 26 km à l’Est de SETIF et à 94 km à l’Ouest de Constantine. GUIDES BLEUS HACHETTE 1955 (D’Alger à Constantine) : « SAINT-ARNAUD, chef lieu d’Arrondissement, à 950 mètres d’altitude. Chemin de fer d’Alger à Constantine – Vin, distilleries, minoteries – Fontaines romaines restaurées. 307 Km SETIF. 314 Km : A droite, embranchement de la route de TINAR à CHASSELOUP-LAUBAT. A 15 Km Sud de CHASSELOUP-LAUBAT, mines du djebel GUETAR, établies à 1 100 mètres d’altitude : minerais de zinc (calamine) et de plomb (sulfure et carte). 333 Km SAINT-ARNAUD (chemin de fer, services automobiles pour SETIF, CONSTANTINE, SILLEGUE et CHEVREUL, PIERRE CURIE, BEÏDA Bordj, RAS EL AÏOUN, DJEMILA ; Hôtel de la Place), petite ville de 13 850 habitants, chef lieu de canton et chef lieu de commune mixte des EULMA de 57 000 habitants. Sur la place, monument aux morts. – Marché important le lundi – Haras national (dépôt d’étalons). » HISTOIRE Dans l’antiquité, SAINT-ARNAUD appartenait à la Numidie ainsi que DJEMILA (ruines romaine classées universelles) à 30 km, alors que SETIF appartenait à la Maurétanie, Maurétanie Césarienne d’abord, capitale CHERCHELL, Maurétanie sétifienne ensuite, capitale SETIF, à la suite de la réforme de l’Empereur Dioclétien, à la fin du 3ème siècle avant Jésus Christ. On trouve dans la région des traces de présence romaine dont une mosaïque transportée à SETIF près de la fontaine dite « Aïn Temouchent » à 4 km à l’Est de Sétif.
    [Show full text]
  • Aba Nombre Circonscriptions Électoralcs Et Composition En Communes De Siéges & Pourvoir
    25ame ANNEE. — N° 44 Mercredi 29 octobre 1986 Ay\j SI AS gal ABAN bic SeMo, ObVel , - TUNIGIE ABONNEMENT ANNUEL ‘ALGERIE MAROC ETRANGER DIRECTION ET REDACTION: MAURITANIE SECRETARIAT GENERAL Abonnements et publicité : Edition originale .. .. .. .. .. 100 D.A. 150 DA. Edition originale IMPRIMERIE OFFICIELLE et satraduction........ .. 200 D.A. 300 DA. 7 9 et 13 Av. A. Benbarek — ALGER (frais d'expédition | tg}, ; 65-18-15 a 17 — C.C.P. 3200-50 ALGER en sus) Edition originale, le numéro : 2,50 dinars ; Edition originale et sa traduction, le numéro : 5 dinars. — Numéros des années antérleures : suivant baréme. Les tables sont fourntes gratul »ment aux abonnés. Priére dé joindre les derniéres bandes . pour renouveliement et réclamation. Changement d'adresse : ajouter 3 dinars. Tarif des insertions : 20 dinars la ligne JOURNAL OFFICIEL DE LA REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE CONVENTIONS ET ACCORDS INTERNATIONAUX LOIS, ORDONNANCES ET DECRETS ARRETES, DECISIONS, CIRCULAIRES, AVIS, COMMUNICATIONS ET ANNONCES (TRADUCTION FRANGAISE) SOMMAIRE DECRETS des ceuvres sociales au ministére de fa protection sociale, p. 1230. Décret n° 86-265 du 28 octobre 1986 déterminant les circonscriptions électorales et le nombre de Décret du 30 septembre 1986 mettant fin aux siéges & pourvoir pour l’élection a l’Assemblée fonctions du directeur des constructions au populaire nationale, p. 1217. , ministére de la formation professionnelle et du travail, p. 1230. DECISIONS INDIVIDUELLES Décret du 30 septembre 1986 mettant fin aux fonctions du directeur général da la planification Décret du 30 septembre 1986 mettant fin aux et de. la gestion industrielle au ministére de fonctions du directeur de la sécurité sociale et lindustrie lourde,.p.
    [Show full text]