Compilación De Un Corpus De Habla Espontánea De Chino Putonghua Para Su Aplicación En La Enseñanza Como Lengua Segunda a Hispanohablantes
Total Page:16
File Type:pdf, Size:1020Kb
Universidad Autónoma de Madrid Departamento de Lingüística General, Lenguas Modernas, Lógica y Filosofía de la Ciencia, Teoría de la Literatura y Literatura Comparada Laboratorio de Lingüística Informática Compilación de un corpus de habla espontánea de chino putonghua para su aplicación en la enseñanza como lengua segunda a hispanohablantes DONG Yang Tesis doctoral dirigida por el Dr. Antonio Moreno Sandoval 2011 Agradecimientos Agradecimientos En primer lugar, quisiera dar las gracias al director de esta tesis, Dr. Antonio Moreno Sandoval, especialmente por aceptarme para realizar esta tesis bajo su dirección. Además, quisiera agradecer la confianza y paciencia que él ha depositado en este trabajo, así como su constante estímulo, sus comentarios y consejos tan valiosos para mi tesis. Gracias a la beca concedida por la Agencia Española de Cooperación Internacional, he podido seguir mis estudios del Programa de Doctorado en la Facultad de Filosofía y Letras de la Universidad Autónoma de Madrid y dedicarme totalmente a la tesis. A la Dra. Taciana Fisac, coordinadora del Programa de Doctorado “España y Latinoamérica Contemporáneas” y catedrática del Centro de Estudios de Asia Oriental de la Universidad Autónoma de Madrid, quiero extenderle un sincero agradecimiento por su disponibilidad, generosidad y ayuda incondicional en todo momento. Fue ella quien organizó y promovió este Programa de Doctorado de la Universidad Autónoma de Madrid, con la colaboración de la Universidad de Lenguas Extranjeras de Beijing. Quisiera agradecer a los miembros del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid por la ayuda que me han ofrecido durante estos años de aprendizaje. Se trata de un soporte profesional muy importante. Muchas gracias por permitirme vivir una experiencia tan inovidable y bonita para mi formación. Muchas gracias al Dr. José María Guirao de la Universidad de Granada que, con su gran profesionalidad en el campo de la informática, siempre me ha prestado ayuda para resolver todos los problemas técnicos. Un agradecimiento especial al Sr. Wang Zhiwei, director de la Oficina de Asuntos Educativos de la Embajada de la República 2 Agradecimientos Popular China en España, por los ánimos y los datos relacionados con la enseñanza de chino en España que me ha facilitado. Tengo la suerte de haber conocido a la familia de Marisol Cerezo y de José Ramón. A esta familia le agradezco especialmente su amabilidad, amistad y ánimo durante mi estancia en España. Los considero como mi familia en España. Con ellos he compartido muchos momentos que siempre llevaré en mi corazón y gracias a los cuales nunca me he sentido sola en España. Estoy profundamente agradecida a todos los participantes del corpus y la Universidad de Estudios Internacionales de Beijing que es mi lugar de trabajo, por su comprensión, colaboración y apoyo a la enseñanza de idiomas. Han contribuido mucho a la elaboración de este corpus de habla espontánea de chino putonghua . Sin ellos, esta tesis no habría podido ver la luz. Finalmente, no me olvido de mis amigos, alumnos y familiares. Muchas gracias por todo. Os quiero a todos. Una mención especial va para mi marido An. Soy afortunada por contar siempre con su amor, comprensión y ánimo que me sirven como fortaleza firme para seguir adelante. 3 Índice general Índice general 1. Introducción ----------------------------------------------------------8 1.1 Motivos del trabajo -------------------------------------------------------------------- 8 1.2 Objetivos de la investigación -------------------------------------------------------10 1.3 Estructura de la tesis -----------------------------------------------------------------11 PARTE PRIMERA -----------------------------------------------------------------------------13 Bases teóricas------------------------------------------------------------------------------------13 2. La Lingüística de Corpus----------------------------------------- 14 2.1 Aspectos generales -------------------------------------------------------------------14 2.2 El corpus C-ORAL-ROM ------------------------------------------------------------29 2.3. La Lingüística de Corpus en China -----------------------------------------------37 3. El uso de corpus en la enseñanza de lenguas ----------------- 41 3.1 Las aplicaciones de corpus en la enseñanza de lenguas ------------------------41 3.2 La experiencia del laboratorio LLI-UAM -----------------------------------------47 4. El chino putonghua ------------------------------------------------ 57 4.1 Visión global --------------------------------------------------------------------------57 4.2 Evolución del idioma chino ---------------------------------------------------------58 4.3 Caracteres chinos ---------------------------------------------------------------------62 4.4 Hanyu pinyin --------------------------------------------------------------------------66 4.5 Dialectos -------------------------------------------------------------------------------69 4.6 Lengua oral y escrita -----------------------------------------------------------------70 4.7 Gramática ------------------------------------------------------------------------------74 4.8 Léxico --------------------------------------------------------------------------------81 4.9 La enseñanza de la lengua china como lengua extranjera en España --------------------------------------------------------------------------------------83 PARTE SEGUNDA ----------------------------------------------------------------------------87 La aplicación ------------------------------------------------------------------------------------87 5. Diseño del corpus -------------------------------------------------- 88 5.1 Aspectos generales -------------------------------------------------------------------88 5.2 Elección de los participantes -------------------------------------------------------91 4 Índice general 5.3 Tres tipos de grabación --------------------------------------------------------------94 5.4 Comparación con el corpus CADCC ----------------------------------------------96 5.5 Diseño final -------------------------------------------------------------------------- 107 6. Metodología --------------------------------------------------------108 6.1 Grabación y digitalización -------------------------------------------------------- 108 6.2 Transcripción ortográfica --------------------------------------------------------- 111 6.3 Alineamiento ------------------------------------------------------------------------- 124 6.4 Transcripción de pinyin ------------------------------------------------------------ 127 6.5 Conversión XML -------------------------------------------------------------------- 127 6.6 Resumen ------------------------------------------------------------------------------ 130 7. Aplicación a la enseñanza de lengua segunda mediante el desarrollo de recursos basados en el corpus: propuestas didácticas -------------------------------------133 7.1 El uso de corpus en la enseñanza del léxico ------------------------------------ 134 7.2 El uso de corpus en la enseñanza de la gramática ---------------------------- 144 7.3 El uso de corpus en la enseñanza de comprensión auditiva ------------------ 172 7.4 El uso de corpus en la enseñanza de fonemas ---------------------------------- 175 8. Conclusión----------------------------------------------------------182 Bibliografía------------------------------------------------------------185 Apéndice A ------------------------------------------------------------193 Apéndice B ------------------------------------------------------------241 Apéndice C ------------------------------------------------------------249 5 Índice de tablas y figuras Índice de tablas y figuras Parte primera Tabla 2.1 Matriz del diseño de C-ORAL-ROM 32 Tabla 2.2 Tabla general del corpus multimedia C-ORAL-ROM 35 Figura 3.1 Aplicaciones de Corpus en la Enseñanza de 42 Lenguas Tabla 3.2 Contenidos gramaticales 49 Tabla 3.3 Nociones y funciones comunicativas 50 Tabla 3.4 Contenidos léxicos 51 Figura 3.5 Herramienta de búsqueda de C-ORAL-ROM 52 Tabla 4.1 Número de caracteres en diccionarios chinos 62 Tabla 4.2 Contabilidad de número de sílabas de la lengua oral 72 y la escrita Tabla 4.3 Contabilidad de número de morfemas de la lengua 72 oral y la escrita Tabla 4.4 Contabilidad de número de significados de la lengua 73 oral y la escrita Tabla 4.5 Contabilidad de palabras que llevan tres sufijos 73 habituales en dialectos, lengua oral y lengua escrita Tabla 4.6 Ejemplos de relaciones entre categorías y elementos 78 sintácticos Parte Segunda Tabla 5.1 Edad de los participantes de C-ORAL-CHINA 92 Tabla 5.2 Parámetros en el diseño del corpus 95 C-ORAL-CHINA Tabla 5.3 Datos básicos del corpus CADCC 97 Tabla 5.4 Distribución de tiempo/tema de cada pareja de 98 interlocutores Tabla 5.5 Velocidad caracteres / segundo del subcorpus 100 Formal en contexto público. Tabla 5.6 Velocidad caracteres / segundo del subcorpus 101 Informal Tabla 5.7 Velocidad caracteres / segundo del subcorpus de 102 6 Índice de tablas y figuras Medios de comunicación Figura 5.8 Ejemplo de transcripción en CADCC 103 Figura 5.9 Ejemplo de transcripción en C-ORAL-CHINA 104 Figura 5.10 Ejemplo de transcripción de pinyin (sin 105 segmentación de palabras) Figura 5.11Ejemplo de transcripción de pinyin (con 105 segmentación de palabras) Tabla 5.12 Convenciones de transcripción de signos 106 paralingüísticos de CADCC Figura 6.1 Modelo de permiso de grabación 109 Figura 6.2 Edición del sonido con Cool Edit