Lingüística Computacional Y De Corpus
Total Page:16
File Type:pdf, Size:1020Kb
CONGRESO INTERNACIONAL DE LINGÜÍSTICA COMPUTACIONAL Y DE CORPUS III Congreso Internacional de Lingüística Computacional y de Corpus Una mirada desde las tecnologías del lenguaje y las Humanidades Digitales (CILCC 2020) y V Workshop en Procesamiento Automatizado de Textos y Corpus (WOPATEC_2020) Editores Jorge Mauricio Molina Mejía, Ph.D. Pablo Valdivia Martin, Ph.D. René Alejandro Venegas Velásquez, Ph.D. Universidad de Antioquia / University of Groningen Medellín 2020 Actas III Congreso Internacional de Lingüística Computacional y de Corpus - CILCC 2020 y V Workshop en Procesamiento Automatizado de Textos y Corpus - WoPATeC 2020. Universidad de Antioquia, Medellín, 21-23 octubre de 2020. Agradecimientos El III Congreso Internacional de Lingüística Computacional y de Corpus - CILCC 2020 tuvo lugar del 21 al 23 de octubre de 2020 en la ciudad de Medellín (Colombia). El evento que, en esta ocasión, reunió a las comunidades internacionales de los campos de la Lingüística Computacional, la Lingüística de Corpus y de las Humanidades Digitales nos reunimos con el fin de compartir e intercambiar conocimientos. En esta tercera ocasión, nuestra reunión se vio marcada por un contexto internacional complejo debido a la pandemia conocida bajo el nombre de COVID-19; por lo que el congreso se realizó bajo la modalidad virtual. En este apartado, queremos agradecer a todos aquellos estamentos que hicieron posible que el CILCC 2020 fuera una realidad. En primer lugar, agradecer a las dos universidades organizadoras del evento, es decir, a la alianza de la Universidad de Antioquia y de la University of Groningen. Debemos exaltar la labor de ambos centros de educación superior para convocar y organizar este gran evento internacional en una época tan particular, como la actual. En segundo lugar, infinitas gracias a las entidades patrocinadoras del CILCC 2020, tales como: • La Fundación Universidad de Antioquia. • Las Vicerrectorías de Docencia e Investigación de la Universidad de Antioquia. • El Tecnológico de Antioquia. • El NAACL - The North American Chapter of the Association for Computational Linguistics. Gracias a ellas por el soporte institucional y económico que nos permitió asegurar la participación de los ponentes y asistentes al congreso de manera gratuita. En tercer lugar, un agradecimiento muy especial para las instituciones que nos apoyaron durante la organización y desarrollo del congreso. La lista está conformada por: • La Facultad de Comunicaciones de la Universidad de Antioquia. • Ude@ Educación Virtual. • La Universidad Nacional de Colombia. • El COLAB Laspau (Affiliated with Harvard University). • La Universidad Distrital Francisco José de Caldas. • Converging Horizons - Chile. • La Universidad de Medellín. • La Universidad del Valle. • La Cátedra Pablo Valdivia de Comunicación, Humanidades y Tecnología del Doctorado en Comunicación de la Universidad de la Frontera y la Universidad Austral de Chile. • El Netherlands Research School for Literary Studies. 2 Actas III Congreso Internacional de Lingüística Computacional y de Corpus - CILCC 2020 y V Workshop en Procesamiento Automatizado de Textos y Corpus - WoPATeC 2020. Universidad de Antioquia, Medellín, 21-23 octubre de 2020. • WoPATeC (Workshop de Procesamiento Automático de Textos y Corpus) de la ALTL (Asociación Latinoamericana de Tratamiento del Lenguaje). En cuarto lugar, agradecer a nuestros conferencistas invitados, a los profesores Dra. Malvina Nissim (University of Groningen), Dr. Eric Mazur (Harvard University), Dr. Pablo Valdivia (University of Groningen), Dr. Tony Berber Sardinha (Catholic University of Sao Paulo), Dr. Juan Carlos Tordera Yllescas (Universitat de València), Dr. Alfonso Ureña López (Universidad de Jaén), Dr. Felipe Bravo (Universidad de Chile) y Dra. Bárbara Poblete (Universidad de Chile). Infinitas gracias por compartir con nosotros su experticia y su conocimiento en cada uno de sus campos de investigación. Verdaderamente fue un gran honor para nosotros haber podido contar con ustedes. En quinto lugar, queremos agradecer, muy en el alma, a todo nuestro comité científico que tuvo como tarea evaluar una gran cantidad de propuestas de investigación. A estos colegas, qué, de forma desinteresada, sacrificaron gran parte de su tiempo libre y más aún; no podemos más que decirles que sin su apoyo este congreso no habría sido posible. En sexto lugar, muchas, pero muchas gracias en verdad a todos los colegas que creyeron en este evento y que enviaron sus propuestas para ser evaluadas, y a los que luego de ser aceptadas las presentaron en el CILCC 2020 y en WoPATeC 2020. No podemos más que señalar que sus ponencias le dieron un inmenso nivel científico a nuestros eventos. En séptimo lugar, agradecemos de todo corazón a los miembros del comité de organización, tanto a los profesores como a los estudiantes de la Universidad de Antioquia y de Groningen por todo su trabajo: Andrés Felipe Grajales, Esther Andela, Gabriel Quiroz, Karen Rocha, Laura Quintero, Lirian Ciro, María Adelaida Zapata, María Camila Cardona, María Isabel Marín, María Victoria Delgado, Maribel Betancur, Melisa Rodríguez, Yóselin Uribe y Vanessa Zuleta. Quiero que sepan que sin su labor y apoyo incondicional, el congreso no hubiera sido más que un sueño. Un especial reconocimiento a los estudiantes y profesores, miembros del semillero de investigación Corpus Ex Machina, simple y llanamente ustedes son los mejores. Finalmente, nuestro agradecimiento al público presente en cada una de las jornadas que tuvimos. Gracias, no solamente por estar ahí presentes, sino por su interés e interacción durante las diferentes sesiones o en las conferencias plenarias y talleres. Nos alegra inmensamente saber que muchos de ustedes estuvieron allí en cada una de nuestras ponencias y demás espacios del congreso. 3 Actas III Congreso Internacional de Lingüística Computacional y de Corpus - CILCC 2020 y V Workshop en Procesamiento Automatizado de Textos y Corpus - WoPATeC 2020. Universidad de Antioquia, Medellín, 21-23 octubre de 2020. Contenido Presentación CILCC 2020 .......................................................................................... 10 Comité científico III CILCC 2020 ...................................................................................... 12 Comité de Organización ..................................................................................................... 13 Presentación WoPATeC 2020 ..................................................................................... 14 Comisión organizadora WOPATEC-2020 .......................................................................... 15 Ponencias plenarias / Keynote speakers ...................................................................... 16 Active Learning and Perusall: Sharing Practices for a Successful Learning Engagement .. 17 Análisis de sentimientos ..................................................................................................... 19 Automatizando la extracción de conocimientos desde las redes sociales: ¿cómo generar valor en un mundo incierto? ....................................................................................................... 21 Breve recorrido de las gramáticas formales utilizadas en Lingüística computacional: logros y retos del análisis formal ..................................................................................................... 22 Sesgo en modelos de Word Embeddings ............................................................................ 24 The Power of Weak Signal in NLP ................................................................................... 26 Tracking discourses around the coronavirus pandemic ...................................................... 28 Lingüística Computacional y Procesamiento del Lenguaje Natural .............................. 31 A deep-learning model for discursive segmentation shows high accuracies for sentences classification in biomedical scientific papers ...................................................................... 32 Aplicaciones para el tratamiento informático de un corpus bilingüe de fraseología ........... 35 Applying the Linguistic Economy Principle to Programming Languages .......................... 38 CRF aplicado al POS Tagging para el español .................................................................. 41 Detección y corrección automática en textos especializados: análisis de patrones de errores en un corpus del dominio medico ....................................................................................... 43 El desafío de la lingüística computacional: las lenguas visogestuales ................................. 46 Entrevista por medio de un chatbot con reconocimiento de voz enfocada a un modelo de negocio para la identificación de entidades ........................................................................ 48 Identificación de los posibles fonemas vocálicos de la lengua tanimuka aplicando Machine Learning ............................................................................................................................. 52 Implementación de un sistema de diálogo automático para un dominio específico a partir de un pequeño banco de preguntas y respuestas .................................................................... 53 4 Actas III Congreso Internacional de Lingüística Computacional y de Corpus - CILCC 2020 y V Workshop en Procesamiento Automatizado de Textos y Corpus - WoPATeC 2020. Universidad de Antioquia, Medellín, 21-23 octubre de 2020. La fraseología