TESI-TXOSTENA Euskal Filologian Doktore titulua eskuratzeko aurkeztua Euskal Lokuzioen Tratamendu Konputazionala Egilea Ruben Urizar Enbeita Zuzendariak I~nakiAlegria Juan Carlos Odriozola Donostia, 2012ko maiatza. Esker onak I~nakirieta Txankarri: Arin eta eraz, usoak egiten du hegaz. Tamalez, poliki- -poliki, txoriak egiten du habia. IXA taldeko kide eta kide ohi guztiei: Aurreak erakusten du atzea nola dan- tzatu. Taldeko hizkuntzalari guztiei: Euskara, bestela ez gara. Batez ere, Mikeli, Klarari eta Maxuxi, postposizioak eta haulak lantzen emandako laguntza- gatik: Handik apur, hemendik apur, eultzea bete dugu zuzen edo makur. edbl talderari eta, batez ere, SuperGorkari: `El debel' es lo que esperamos que hagan los dem´as (Oscar Wilde), eta zeuri tokatu zaizu guztia, Gorka! Nereari eta Kikeri: Txapela buruan eta `habil' munduan. Itziar Aldaberi: Non zer behar, han Itziar. Maiteri, besteak beste, Latexekin eta irudiekin laguntzeagatik: Kaiola ede- rrak ez du txoria egiten baina. Zuzenketetan laguntzeagatik, I~nakirieta Txankarri {jakina|, Maxuxi, Itziar Aldaberi, Koldori eta batez ere Mikeli: Oker zuzenik ez. Do, re, mi, hanka oker hori; fa, so, la, zuzendu zaiola. Itziar Adurizi: Urruneko suak ez omen du erretzen. Ez gero? Kortako aberetxo guztiei: Katua mahai azpitik miau, zakurra bortatik gau, ii Esker onak behia kortatik mau. Auzo ona, adiskide ona. Ostegunetako zurruteroei: antes que el deber est´ael beber. Zenbat lan, ezin aipatuzkoari izenak asmatzen! Jan eta edan, eta bakea eman. Eta, batez ere, lehia berean garaitsuan ibili garenoi: Tant treballar per aix`o!! Animo, Gorka, oraingoan, bai! Gymekoei: Jokoa ez da errenta, oiloa hobe erreta. eta Sheridana hotzik! Gernikako lagunei: Zorigabeak eta bideak, egiten adiskideak. Eskerrak bukatu dudala! (Ezeiza, 2002) Ekinak egina dirudi, eginak urre- gorri. Siglak eta akronimoak CG: Constraint Grammar EDBL: Euskararen Datu-Base Lexikala EPEC: Euskararen Prozemanendurako Erreferentzia Corpusa EPG: Ereduzko Prosa Gaur Eustagger: Euskararako Etiketatzaile/Desanbiguatzaile Morfosintaktikoa HP: Hizkuntzaren Prozesamendua MG: Murriztapen Gramatika MORFEUS: Euskararako Analizatzaile Morfologikoa UF: Unitate Fraseologikoa HAD: Hitzen Adiera-Desanbiguazioa iv Siglak eta akronimoak Gaien Aurkibidea Esker onak i Siglak eta akronimoak iii Gaien Aurkibidea v Irudien Zerrenda xi Taulen Zerrenda xv MOTIBAZIOA ETA SARRERA 1 I Proiektuaren nondik norakoak 3 I.1 Sarrera . 3 I.2 Lanaren kokapena . 5 I.3 Helburuak . 8 I.4 Tesi-txostenaren eskema . 11 I.5 Argitalpenak . 14 II Euskararen prozesamendurako baliabideak: abiapuntua 19 II.1 MORFEUS, analizatzaile morfosintaktikoa . 19 II.1.1 Tokenikazioa . 20 II.1.2 Segmentazioa eta analisi morfologikoa . 22 II.1.2.1 Lexikoa . 22 II.1.2.2 Erregela morfofonologikoak . 26 II.1.2.3 Hobekuntzak . 29 II.1.3 Morfosintaxia . 30 II.1.4 EUSTAGGER: lematizatzaile/etiketatzailea . 32 II.2 EDBL: Euskararen Datu-Base Lexikala . 36 vi GAIEN AURKIBIDEA II.3 Murriztapen Gramatika . 37 II.4 Hizkuntza-baliabideak . 38 II.4.1 Hiztegiak . 38 II.4.2 Corpusak . 40 II.5 Laburbilduz . 48 AURREKARIAK ETA UFen EZAUGARRITZEA 51 III Unitate Fraseologikoak 53 III.1 Sarrera . 53 III.2 Unitate fraseologikoen hizkuntza-ezaugarriak . 56 III.2.1 Hitz bat baino gehiagoz osaturiko unitateak . 56 III.2.2 Maiztasuna . 59 III.2.3 Instituzionalizazioa . 60 III.2.4 Egonkortasuna eta bariazioa . 61 III.2.4.1 Finkapena . 61 III.2.4.2 Espezializazio semantikoa edo lexikali- zazioa . 61 III.2.4.3 Aldagarritasuna . 62 III.2.5 Konposizionaltasunik eza . 65 III.2.6 Mailaketa . 67 III.3 Unitate fraseologikoen sailkapena . 68 III.4 Laburbilduz . 71 IV Unitate Fraseologikoen ezaugarritzea 75 IV.1 Euskal fraseologia . 75 IV.2 Enuntziatu fraseologikoak . 84 IV.2.1 Paremiak . 84 IV.2.2 Errutinazko formulak . 85 IV.2.2.1 Formula diskurtsiboak . 85 IV.2.2.2 Formula psiko-sozialak . 87 IV.3 Kolokazioak ......................... 89 IV.3.1 Kolokazioen taxonomia . 98 IV.4 Lokuzioak ..........................100 IV.4.1 Lokuzioen taxonomia . 107 IV.4.2 Lokuzio lexikalak . 108 IV.4.2.1 Izen-lokuzioak . 108 GAIEN AURKIBIDEA vii IV.4.2.2 Aditz-lokuzioak . 117 IV.4.2.3 Adjektibo-lokuzioak . 135 IV.4.2.4 Adberbio-lokuzioak . 139 IV.4.2.5 Interjekzio-lokuzioak . 144 IV.4.3 Lokuzio gramatikalak . 145 IV.4.3.1 Zenbatzaile-lokuzioak . 146 IV.4.3.2 Izenordain-lokuzioak . 149 IV.4.3.3 Lokailu-lokuzioak . 150 IV.4.3.4 Juntagailu-lokuzioak . 155 IV.4.3.5 Menderagailu-lokuzioak . 156 IV.4.3.6 Postposizio-lokuzioak . 159 IV.5 Laburbilduz . 164 V Unitate Fraseologikoak eta Hizkuntzaren Prozesamendua 169 V.1 Sarrera . 169 V.2 Unitate Fraseologikoen erauzketa . 170 V.3 Unitate Fraseologikoen identifikazioa . 173 V.4 Unitate Fraseologikoen interpretazioa . 177 V.4.1 Barne-sintaxiaren interpretazioa . 177 V.4.2 Interpretazio semantikoa . 178 V.5 Unitate Fraseologikoen deskribapena . 180 V.5.1 dela hiztegiak . 183 V.5.2 Frantsesezko hitz-elkarketa Xeroxen sistemarekin 188 V.5.3 idarex ........................192 V.5.4 Turkierazko lokuzioen prozesatzailea . 197 V.5.5 LinGO proiektua . 199 V.5.6 fastr . 202 V.6 Laburpena eta gure hautua . 205 EUSKAL LOKUZIOEN PROZESAMENDU KONPUTAZIONALA 213 Sarrera 215 VI EDBLn landuriko lokuzioen prozesamendua 217 VI.1 Sarrera . 217 VI.2 Lokuzioen zerrenda osatzea . 218 VI.3 Lokuzioak deskribatzeko adierazpidea . 220 viii GAIEN AURKIBIDEA VI.3.1 Sarrera. Kategoria eta azpikategoria . 221 VI.3.2 Barne-osaketa . 221 VI.3.3 Gauzatze-eskema . 222 VI.3.4 Deskripziorako baliabideak . 232 VI.3.5 Adibideak . 233 VI.3.6 Gauzatze-eredurik usuenak . 236 VI.4 Kasu berezien prozesamendua . 255 VI.4.1 Aldaeren prozesamendua . 255 VI.4.2 Marratxoa aukeran duten hitz elkartuak . 260 VI.4.3 Zenbait lokuzioren forma trinkoak . 263 VI.5 HABIL . 265 VI.6 Desanbiguaziorako murriztapen-gramatika . 269 VI.6.1 Gramatikaren garapena . 273 VI.7 Laburbilduz . 278 VII Postposizio-eta menderagailu-lokuzioen prozesamendua 281 VII.1 Postposizio-lokuzioen prozesamendua . 282 VII.1.1 Motibazioa . 282 VII.1.2 Sarrera . 283 VII.1.3 Postposizio-lokuzioen zerrenda osatzea . 285 VII.1.4 Postposizio-lokuzioak ezagutzeko gramatika . 288 VII.1.5 Funtzio sintaktikoak . 290 VII.1.6 Gramatikaren garapena eta ebaluazioa . 291 VII.1.7 Erroreen azterketa . 294 VII.2 Menderagailu-lokuzioen prozesamendua . 295 VII.2.1 Motibazioa eta sarrera . 295 VII.2.2 Menderagailu-lokuzioen zerrenda osatzea . 297 VII.2.3 Menderagailu-lokuzioak ezagutzeko gramatika . 299 VII.2.4 Gramatikaren garapena eta ebaluazioa . 301 VII.3 Laburbilduz . 303 ONDORIOAK ETA AURRERA BEGIRAKOAK 305 VIII Ondorioak eta etorkizuneko lana 307 VIII.1 Ekarpenak . 308 VIII.2 Etorkizuneko lana . 314 GAIEN AURKIBIDEA ix Bibliografia 319 ERANSKINAK 1 A Analisietan erabiltzen diren laburtzapenak 1 A.1 edblko etiketa-sistema . 2 A.1.1 Kategoria lexikalak . 2 A.1.2 Kategoria morfologikoak . 3 A.1.3 Morfologia-ezaugarriak . 3 A.2 Tokenizazioan ezarritako etiketak . 7 A.2.1 Puntuazio-markak . 7 A.2.2 Ortografia . 7 A.3 Funtzio sintaktikoak . 7 B EDBLn landuriko lokuzioak 9 B.1 EDBLn landuriko lokuzioen hiztegia . 10 B.2 EDBLko lokuzio anbiguoak desanbiguatzeko gramatika . 108 C Postposizio-lokuzioak 139 C.1 Postposizio-lokuzioen zerrenda osoa . 139 C.2 Postposizio-gramatika osoa . 146 C.3 Postposizio-lokuzio bakoitzarekin lorturiko emaitzak . 184 D Menderagailu-lokuzioak 189 D.1 Menderagailu-lokuzioen zerrenda osoa . 189 D.2 Menderagailu-lokuzioen gramatika osoa . 195 x GAIEN AURKIBIDEA Irudien Zerrenda II.1 morfeusen eskema orokorra. 20 II.2 Lexikoko informazioarekin sorturiko grafoa. 26 II.3 morfeusen irteera, Zinemako cowboy hark bere etxe handian errezibitu zituen esaldiari dagokiona. 33 II.4 eustagger, lematizatzaile-etiketatzailea. 34 II.5 Zinemako cowboy hark bere etxe handian errezibitu zituen esal- diaren analisia, desanbiguazio morfologikoa aplikatu ondoren. 35 II.6 Bilaketa-galdera aurreratu baten adibidea XX. Mendeko Eus- kararen Corpus Estatistikoan.................... 43 II.7 Bilaketa-galdera bate emaitza, II.6 irudiari dagokiona. 44 II.8 Bilaketa-galdera baten adibidea EPGen. 46 III.1 ufen sailkapena Howarthen (1998) arabera. 69 III.2 Hitz anitzeko esapideen sailkapena Sag et al.en (2002) arabera. 70 III.3 Unitate fraseologikoen sailkapena (Corpas Pastor, 1996). 71 IV.1 Gezurrak buztana labur paremia. 84 IV.2 Paremien taxonomia. 85 IV.3 Errutinazko formulen taxonomia, Corpas Pastorren (1996) sail- kapenari jarraiki. 86 IV.4 Muturrekoa izan vs muturrekoa eman/hartu: `muturreko' hitza- ren bi adiera, aditz agerkidearen arabera. 91 IV.5 stake hitzaren agerpen batzuk kwic eran erakutsiak. 91 IV.6 Corpeusetik ateratako etsai hitzaren zenbait agerpen, kwic eran erakutsiak. 92 IV.7 growth izenaren kolokazioak BBI hiztegian. 95 IV.8 Magn funtzioa haserre eta lagun gako-hitzei aplikatuta bizi eta min balioak lortzen dira, hurrenez hurren. 95 IV.9 Kolokazioen sailkapena, adibidez hornitua. 99 xii IRUDIEN ZERRENDA IV.10 Lokuzioen sailkapena, adibidez hornitua. 109 IV.11 Aditz-lokuzioen sailkapena. 119 IV.12 etxerako postposizio-sintagmaren analisia. 160 V.1 Esapide askoren adiera-bikoiztasunak —figuratiboa eta literala| hitz-joko ugaritarako bide eman dezake: (norbaiten) ahotan egon.174 V.2 walks aditzaren ezaugarri-egituraren matrizea hpsgn. 181 V.3 Phrase motako head-subj-phrase zeinuaren ezaugarri-egitu- raren matrizea hpsgn, zuhaitz moduan adierazia, zeinuen ba- terakuntza irudikatzeko. 183 V.4 cousin germain............................185 V.5 m´emoire vive.............................186 V.6 man eater. .............................186 V.7 attorney general. 186 V.8 majster klepka............................187
Details
-
File Typepdf
-
Upload Time-
-
Content LanguagesEnglish
-
Upload UserAnonymous/Not logged-in
-
File Pages576 Page
-
File Size-