Linguistic Expression of Irony in Social Media
Total Page:16
File Type:pdf, Size:1020Kb
Linguistic Expression of Irony in Social Media Kateryna Akhtyrska Dissertação para obtenção do Grau de Mestre em Ciências de Linguagem Trabalho efetuado sob a orientação de: Prof.ª Doutora Paula Carvalho, Universidade Europeia – Laureate International Universities Prof. Doutor Jorge Baptista, Universidade do Algarve 2014 Título do trabalho: Linguistic Expression of Irony in Social Media Declaração de autoria do trabalho: Eu, Kateryna Akhtyrska, declaro ser a autora deste trabalho, que é original e inédito. Autores e trabalhos consultados estão devidamente citados no texto e constam da listagem de referências incluída. Assinatura: © Kateryna Akhtyrska, Universidade do Algarve, 2014: A universidade do Algarve tem o direito, perpétuo e sem limites geográficos, de arquivar e publicitar este trabalho através de exemplares impressos e reproduzidos em papel ou de forma digital, ou por qualquer outro meio conhecido ou que venha a ser inventado, de o divulgar através de repositórios científicos e de admitir a sua cópia ou distribuição com objectivos educacionais ou de investigação, não comerciais, desde que seja dado crédito ao autor e editor. i Для моей семьи, которая вдохновляет и верит… Para a minha família, que inspira e acredita... ii ACKNOWLEDGEMENTS Some years ago when I arrived to Portugal I was not even able to imagine how much my life would change. To be honest, halfway through my research journey, I was losing hope that one day I will be able to write acknowledgments to this Master dissertation. I am very grateful to all the people who supported me during that time and who helped me to overcome all the difficulties and walk the path toward my aim. I would like to express my deep gratitude to my research supervisors, Prof.ª Doutora Paula Carvalho, for confidence she placed on me right from the start, patient guidance, enormous enthusiastic encouragement and useful critiques of this research. To Prof. Doutor Jorge Baptista, whose assistance and suggestions constituted an enormous source of help and who has always been an outstanding example of hard work, responsibility, commitment and dedication to his students. Thus, I am deeply grateful to my research supervisors for willing to share their vast knowledge with me, each one in their own field, enabling me to broaden my perspectives and making a process of writing this dissertation an extraordinary learning experience. I would like to thank the European Community Mobility Programme Erasmus Mundus for a grant and Partnerships Action 2 (EMA2) (ref 2011-2574) for giving me an opportunity to study at the University of Algarve. I also would like to thank my friends, Victoria Verenych for her unconditional friendship and support, Elena Kalinichenko for a great example of hard work and dedication to the job she does, and Cláudia Candelária for her optimistic view of life and enormous positive energy. My great pleasure is to thank my parents as well as my mother-in-law for allowing me time away from my little lovely daughter to work on my dissertation. This research would never be possible without the most important source of inspiration in my life – my family. I would like to thank my husband Carlos Machado for his measureless advice and confidence in my success, enormous source of help and unbelievable encouragement throughout the research. Finally, I am genuinely grateful to my parents, Elena and Victor, for their unwavering support and unconditional trust. Kateryna Akhtyrska, 2014, Faro iii ABSTRACT This research aims to investigate the linguistic expression of irony in social media. Particularly, this study focuses on the analysis and description of the linguistic and rhetoric devices used to express irony about human entities in a specific domain, politics. The study aims at distinguishing the most representative types of irony and classifying them into different subclasses. The research is performed based on a corpus manually created for this purpose, consisting of short messages (tweets) collected from Twitter. These collections composed of 500 tweets, referencing the presidential candidates that ran for the United States Presidential Election campaign 2012. In general, our findings prove that irony could be represented with a help of other figurative devices targeting politicians in social media. The results have shown that the most representative categories are exclamation (21.6%), rhetoric question (14%), antiphrasis (11.2%), and metaphor (12.4%). Inter-annotator agreement (IAA) study has been conducted to answer research questions and surveys were carried out for annotation: (i) to validate the reliability of the manual analysis α = 0.77, the result has shown “highly tentative” value; (ii) linguistic expression of irony in social media, IAA agreement between the groups A, B and C is α = .38; .095; .042; (iii) impact of irony in a political domain of user-generated content has shown the value α = .172 and % agr. 73.7. KEYWORDS: Corpus, irony, figurative language, linguistic devices, linguistic expression of irony, tweet, Twitter. iv RESUMO Esta pesquisa tem como objectivo investigar a expressão linguística da ironia nos media sociais, centrando-se particularmente na análise e descrição dos mecanismos linguísticos e retóricos utilizados para expressar ironia sobre entidades humanas num domínio específico, a política. O estudo visa distinguir as classes mais representativas de ironia e classificá-las em diferentes subclasses. Esta investigação foi realizada com base num corpus manualmente criado para este fim, composto por mensagens breves (tweets) recolhidas a partir do Twitter. Este corpus é centrado especificamente no tema da campanha eleitoral de um candidato para as presidenciais dos Estados Unidos no ano de 2012. Os resultados provam que a ironia poderia ser representada com a ajuda de outros recursos linguísticos e retóricos no que respeita às expressões de cariz politica nas redes sociais. Os resultados mostraram que as categorias mais representativas são as de exclamação (21,6%), perguntas de retórica (14%), antífrases (11,2%) e de metáfora (12,4%). O estudo com base no acordo de Inter-annotator agreement (IAA) foi realizado para fins distintos após a implementação das pesquisas para anotação: (i) para validar a fiabilidade da análise manual, com o valor de α = 0,77 o que demonstra um resultado "altamente experimental"; (ii) para demonstrar as expressões linguísticas de ironia nos Mídia Sociais em concordância com Inter-annotator agreement (IAA), em que obtivemos uma relação de valores entre os grupos A, B e C: α= 0,38; 0,095; 0,042; (iii) e finalmente para avaliar o impacto da ironia no domínio político num conteúdo gerado pelo próprio usuário que mostrou o valor: α = 0,172 e % agr. 73.7. PALAVRAS-CHAVE: Corpus, ironia, dispositivos linguísticos, expressão linguística de ironia, linguagem figurativa, tweet, Twitter. v RESUMO ALARGADO Esta pesquisa tem como objectivo investigar a expressão linguística da ironia nas redes sociais. O estudo analisa os mecanismos linguísticos subjacentes à expressão da ironia em mensagens breves, extraídas do Twitter, tendo como alvo uma entidade humana do domínio político. Como na maioria dos recursos figurativos, a ironia é difícil de ser definida em termos formais. Nesta tese, adoptamos o conceito de ironia tal como é definido por Abrams e Harpham, (2011: 165):“a ironia é uma declaração em que o emissor envia uma mensagem com um sentido nitidamente diferente do significado que é ostensivamente expresso”. Por outras palavras, é um recurso estilístico baseado na oposição entre a mensagem expressa e a mensagem implícita. Em termos práticos, a ironia é utilizada para expressar o contrário daquilo que queremos realmente dizer, como, por exemplo, na mensagem abaixo: Irony: #Many, many GodGunsBible Americans WILL vote for President Obama As expressões "Many, many" e "WILL vote" são figurativamente usadas para expressar um sentimento negativo e contraditório, que significa acentuadamente o oposto do que é ostensivamente expresso. Além disso, a expressão "GodGunsBible" é utilizada para sugerir o contrário do que é veiculado. Assim, a ironia permite a um emissor expressar pontos de vista ricos em sentimento, com brevidade, nitidez e humor. A correta interpretação da ironia está sempre dependente de um conjunto de factores extralinguísticos, da constante mutação do mundo, de questões de ordem social, cultural e vi pragmática. Desta forma, torna-se difícil o seu reconhecimento e a representação do processo, sobretudo do ponto de vista computacional. Este projecto visa analisar os recursos linguísticos e retóricos utilizados na expressão da ironia, em particular nas redes sociais. Tanto quanto sabemos, não existe nenhum estudo sistemático realizado sobre a expressão linguística da ironia nestes meios de comunicações. Este estudo foca-se na identificação de um dos mais relevantes desafios à análise computacional, que envolve a expressão de sentimento sobre alvos humanos, particularmente políticos. A pesquisa é realizada com base num corpus manualmente criado para este fim, composto por mensagens breves (tweets) retiradas do Twitter, uma rede social e um serviço de “microblogging”. A colecção de tweets tem como alvo dois dos principais candidatos que concorreram às eleições presidenciais dos Estados Unidos na campanha eleitoral de 2012. Como tal, os principais objectivos desta pesquisa são: (i) identificar os mecanismos utilizados para expressar ironia e classificá-los em diferentes subclasses, tendo em vista o seu reconhecimento automático;