Técnicas de compresión e estruturas de indexación compactas para texto en linguaxe natural e contidos dixitais: aplicacións prácticas Autor: Eduardo Rodríguez López Tese de Doutoramento UDC / 2015 Dirixida por: Ángeles Saavedra Places Antonio Fariña Martínez Técnicas de compresión e estruturas de indexación compactas para texto en linguaxe natural e contidos dixitais: aplicacións prácticas Autor: Eduardo Rodríguez López Tese de Doutoramento UDC / 2015 Dirixida por: Ángeles Saavedra Places Antonio Fariña Martínez Departamento de Computación Tese doutoral dirixida por Ángeles Saavedra Places Departamento de Computación Facultade de Informática Universidade da Coruña 15071 A Coruña (España) Tel: +34 981 167000 ext. 1249 Fax: +34 981 167160
[email protected] Antonio Fariña Martínez Departamento de Computación Facultade de Informática Universidade da Coruña 15071 A Coruña (España) Tel: +34 981 167000 ext. 1352 Fax: +34 981 167160
[email protected] Ángeles Saavedra Places e Antonio Fariña Martínez, como directores, acreditamos que esta tese cumpre os requisitos para optar ao título de doutor e autorizamos o seu depósito e defensa por parte de Eduardo Rodríguez López, de quen se inclúe tamén a sinatura. A Clara Resumo A aplicación dos resultados da investigación ao desenvolvemento software permite crear sistemas innovadores que resolven problemas, organizan procesos ou ofrecen servizos á sociedade dun modo máis eficaz e eficiente. Na primeira parte desta tese preséntanse dúas novas técnicas da área de investigación en compresión e indexación de texto en linguaxe natural. Dunha banda, un autoíndice de palabras que permite obter unha representación comprimida do texto empregando tan só un 35–40 % do seu tamaño orixinal, á vez que realizar buscas moi eficientes dentro del.