Análisis Y Aplicaciones Sobre Letras Musicales Del R´Io De La Plata
Total Page:16
File Type:pdf, Size:1020Kb
An´alisisy aplicaciones sobre letras musicales del R´ıode la Plata Andr´esFerraro Paolino Tesis de Maestr´ıaen Inform´atica Instituto de Computaci´on(InCo), Facultad de Ingenier´ıa PEDECIBA UdelaR Montevideo { Uruguay Setiembre de 2018 An´alisisy aplicaciones sobre letras musicales del R´ıode la Plata Andr´esFerraro Paolino Tesis de Maestr´ıa en Inform´atica presentada al Programa Maestr´ıa en Inform´aticade PEDECIBA UdelaR, como parte de los requisitos necesarios para la obtenci´ondel t´ıtulo de Mag´ısteren Ingenier´ıaen Inform´atica. Directores de Tesis: Guillermo Moncecchi Pablo Cancela Director Acad´emico: Guillermo Moncecchi Montevideo { Uruguay Setiembre de 2018 Ferraro Paolino, Andr´es An´alisisy aplicaciones sobre letras musicales del R´ıo de la Plata / Andr´es Ferraro Paolino. - Montevideo: Universidad de la Rep´ublica, Facultad de Ingenier´ıa, PEDECIBA Inform´atica,2018. XII, 85 p. 29; 7cm. Directores de Tesis: Guillermo Moncecchi Pablo Cancela Director acad´emico: Guillermo Moncecchi Tesis de Maestr´ıaen Inform´atica{ PEDECIBA UdelaR. Referencias bibliogr´aficas:p. 71{ 78. 1. Procesamiento del Lenguaje Natural, 2. Aprendizaje Autom´atico, 3. Recuperaci´onde Informaci´onMusical, 4. Redes Neuronales Profundas, 5. Representaci´on Distribuida. I. Moncecchi, Guillermo, Cancela, Pablo, . II. PEDECIBA UdelaR, Programa de Maestr´ıa en Inform´atica.III. T´ıtulo. INTEGRANTES DEL TRIBUNAL DE DEFENSA DE TESIS Dr. Horacio Saggion Dra. Lorena Etcheverry Dr. Mart´ınRocamora Montevideo { Uruguay Setiembre de 2018 iv Para Caterina y Agustina... v Agradecimientos Es dif´ıcilresumir aqu´ıtodas las personas que hicieron posible este trabajo. En primer lugar, quisiera agradecer mis tutores: Pablo Cancela y Guillermo Moncecchi, por todos los consejos y la ayuda que me dieron durante estos dos a~nos.Tambi´enquisiera agradecer al tribunal por el valioso aporte, un especial agradecimiento a Mart´ınRocamora por ayudarme en distintos momentos de esta maestr´ıay por estar siempre disponible para darme consejos muy valiosos, sin duda sin su apoyo este trabajo no hubiera sido posible. A Juan Piquinela por su dedicaci´ony su aporte tan importante. Tambi´enquisiera agradecer a Xavier Serrra por darme la oportunidad de trabajar en MTG y al resto de mis compa~nerospor el apoyo durante estos a~nos.Le agradezco a Sergio Oramas por todos los aportes que hizo a este trabajo, sus consejos fueron muy importantes para desarrollar esta tesis, espero en alg´unmomento volver a trabajando jun- tos. Tambi´enle agradezco a Aiala Ros´a,Dina Wonsever y Pablo Zinemanas por los valiosos aportes. A Mar´ıaIn´esSanchez por su constante ayuda en la parte administrativa. Kjell Lemstrom por permitirme realizar la pasant´ıaen Helsinki. Tambi´enle agradezco a mi esposa Agustina por acompa~narmeincon- dicionalmente, por apoyarme en las decisiones m´asdif´ıcilesy por ayudarme en todo momento. Este trabajo no hubiera sido posible sin la ayuda de mi familia. A Fernando, Charo y toda la familia, por apoyarnos siempre. Por ´ultimopero no menos importante gracias a Santiago, Francisco y Mat´ıaspor estar siempre. La investigaci´onque da origen a los resultados presentados en la presente publicaci´onrecibi´ofondos de la Agencia Nacional de Investigaci´one Innovaci´on bajo el c´odigoPOS NAC 2016 1 130162. vi RESUMEN A partir del a~no2015 el consumo de m´usicapor medio de soportes digitales super´oel consumo en medios f´ısicos,en gran parte debido al creciente uso de los servicios de m´usica online. Dado el tama~node las colecciones musicales que manejan estos servicios, es importante contar con sistemas capaces de categorizar y recomendar la m´usicade forma autom´atica.Es por esto que desde hace varios a~nosse viene investigando sobre la clasificaci´ony recomendaci´on autom´aticade canciones en el ´areade la recuperaci´onde informaci´onmusical, ya sea a partir de su contenido o de su contexto. En este trabajo se analizan distintas t´ecnicaspara representar las canciones basadas ´unicamente en sus letras, con el objetivo de encontrar aquella que permita obtener una representaci´onque mantenga la similitud entre las letras de las canciones. Para evaluar el desempe~nose utilizan las representaciones en distintas tareas de clasificaci´on. Una parte importante de esta tesis es la recolecci´ondel corpus de datos utilizados, ya que el trabajo se enfoca en algunos g´enerosmusicales relacio- nados con el R´ıode la Plata que actualmente no cuentan con un conjunto de datos para trabajar (por ejemplo: Tango, Milonga o Candombe). No hay muchos trabajos anteriores que se enfoquen en letras de canciones en espa~nol, por lo tanto, decidimos ofrecer parte del conjunto de datos abiertamente para favorecer la investigaci´onsobre estos g´enerosmusicales. Una vez obtenido el corpus de datos, es explorado mediante algunas t´ecni- cas basadas en aprendizaje no supervisado. Luego, se profundiza en t´ecnicas basadas en redes neuronales recurrentes para obtener las representaciones de las letras. Por ´ultimo,se utilizan las representaciones obtenidas para calcular similitud entre ellas, permitiendo explorar estos resultados a trav´esde una interfaz web. Mediante la misma interfaz, tambi´ense puede navegar por el conjunto de datos recolectado, siendo un aporte para todos las personas que vii deseen conocer m´assobre estos g´eneros musicales. Palabras claves: Procesamiento del Lenguaje Natural, Aprendizaje Autom´atico, Recuperaci´onde Informaci´onMusical, Redes Neuronales Profundas, Representaci´onDistribuida. viii ABSTRACT Since the year 2015 music consumption in digital format surpassed phy- sical formats for the first time, this is primarily because of the increased use of streaming services. Given the size of the music collections that offers this services, is very important to count with systems that allows to automatically categorize and recommend music. This is the reason why a lot of research has been done in the previous years in the field of Music Information Retrieval, re- lated with automatic classification and recommendation based on song content and context. In this work, we analyze different technics for song representation only based on their lyrics, with the goal of identifying the method that allows to keep the most important aspects of the song lyrics. To evaluate the performance we use these representations in multiple classification tasks. An important part of this work is the gatering and clean of the corpus since the focus of this work is in different musical genres from the River Plate, where currently there is not available any dataset of lyrics. Also, not many works focus on lyrics in spanish language, therefore we decided to publicly share part of the corpus in order to favor the research related to these musical genres. First, we explore the corpus using some unsupervised technics. Later, we focus on deep learning technics to genereate representations of lyrics. Finally, we use the representations to calculate the similarity between the songs, we built a web interface that allows exploring this results. Moreover, this interface allows to navigate the collected corpus, we think that this could be a good contribution for the people interested in this music genres. Keywords: Natural Language Processing, Machine Learning, Music Information Retrieval, Deep Neural Networks, Representation Learning. ix Tabla de contenidos 1 Introducci´on1 1.1 Recuperaci´onde informaci´onmusical . .2 1.2 Objetivos del trabajo . .3 1.3 Estructura de la tesis . .4 1.4 Contribuciones principales . .4 2 Trabajos relacionados6 2.1 T´ecnicasb´asicaspara representaci´on vectorial de documentos . .6 2.2 Conjuntos de datos sobre m´usicade Am´ericaLatina . .8 2.3 Clasificaci´onde canciones basadas en las letras . 10 2.3.1 Clasificaci´onbasada en letras de canciones en combina- ci´oncon audio . 13 2.3.2 Agrupamiento no supervisado de letras . 14 2.4 Procesamiento del lenguaje aplicado a otros textos relacionados a la m´usica . 15 2.4.1 Extracci´onde informaci´ony reconocimiento de entidades 16 2.5 Aprendizaje profundo y representaci´ondistribuida aplicada al procesamiento del lenguaje . 18 2.6 Discusi´on . 20 3 Corpus de letras de canciones 22 3.1 Metadatos y letras extra´ıdasde Todotango . 23 3.1.1 Modelo de datos . 23 3.1.2 Cantidad de metadatos obtenidos . 24 3.2 Enriquecimiento del corpus . 25 3.3 Selecci´onde un candidato por fuente . 30 3.4 Corpus de letras final . 30 3.5 Informaci´onde a~node las canciones . 32 x 3.6 An´alisisde repetici´onen letras . 33 3.7 Agrupamiento y visualizaci´onde las letras . 34 3.7.1 Primera representaci´onde letras . 35 3.7.2 Agrupamiento autom´aticode las letras . 35 3.7.3 Visualizaci´onde las letras . 37 3.8 Conclusi´on. 38 4 Modelo generativo basado en redes recurrentes 41 4.1 Redes neuronales recurrentes . 42 4.1.1 Redes LSTM . 43 4.1.2 Funci´onde p´erdida . 44 4.1.3 Representaci´onvectorial a partir de redes LSTM . 44 4.1.4 Generaci´onde nuevas letras . 45 4.2 Conjunto de datos . 45 4.3 Arquitecturas evaluadas . 47 4.3.1 Evaluaci´onde los primeros modelos LSTM . 49 4.3.2 Modelo multiplicative LSTM . 50 4.3.3 Resultados de los modelos . 51 4.4 Conclusiones . 52 5 Evaluaci´on 53 5.1 Grupo de letrista . 54 5.2 Epocas´ . 55 5.3 G´eneros . 56 5.4 Per´ıodo de a~nobinario . 57 5.5 Tango o no tango . 58 5.6 Conclusiones . 59 6 Aplicaci´on 60 6.1 B´usquedade similitud entre las canciones . 60 6.1.1 A~noo ´epoca . 60 6.1.2 Artista . 61 6.1.3 G´enero. 62 6.1.4 Letra . 63 6.1.5 Relaciones entre varios aspectos . 64 6.2 Conclusiones . 67 xi 7 Conclusiones y trabajo a futuro 68 7.1 Trabajo a futuro . 69 Referencias bibliogr´aficas 71 Anexos 79 Anexo 1 Encuesta..................... 80 1.1 Resultados de la encuesta .