A Fraseologia Do Futebol: Um Estudo Bilíngue Português-Inglês Direcionado Pelo Corpus
Total Page:16
File Type:pdf, Size:1020Kb
UNIVERSIDADE DE SÃO PAULO FACULDADE DE FILOSOFIA, LETRAS E CIÊNCIAS HUMANAS DEPARTAMENTO DE LETRAS MODERNAS PROGRAMA DE PÓS-GRADUAÇÃO EM ESTUDOS LINGUÍSTICOS E LITERÁRIOS EM INGLÊS SABRINA MATUDA A fraseologia do futebol: um estudo bilíngue português-inglês direcionado pelo corpus São Paulo 2011 UNIVERSIDADE DE SÃO PAULO FACULDADE DE FILOSOFIA, LETRAS E CIÊNCIAS HUMANAS DEPARTAMENTO DE LETRAS MODERNAS PROGRAMA DE PÓS-GRADUAÇÃO E EM ESTUDOS LINGUÍSTICOS E LITERÁRIOS EM INGLÊS A fraseologia do futebol: um estudo bilíngue português-inglês direcionado pelo corpus Sabrina Matuda Dissertação apresentada ao Programa de Pós-Graduação em Estudos Linguísticos e Literários em Inglês do Departamento de Letras Modernas da Faculdade de Filosofia, Letras e Ciências Humanas da Universidade de São Paulo, para a obtenção do título de Mestre em Letras. Orientadora: Profa. Dra. Stella Esther Ortweiler Tagnin São Paulo 2011 AUTORIZO A REPRODUÇÃO TOTAL OU PARCIAL DESTE TRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRÔNICO, PARA FINS DE ESTUDO OU PESQUISA, DESDE QUE CITADA A FONTE. FOLHA DE APROVAÇÃO Sabrina Matuda A fraseologia do futebol: um estudo bilíngue português-inglês direcionado pelo corpus Dissertação submetida ao Programa de Pós-Graduação da Faculdade de Filosofia, Letras e Ciências Humanas, Departamento de Letras Modernas, Área de Estudos Linguísticos e Literários em Inglês, da Universidade de São Paulo, como requisito parcial à obtenção do grau de Mestre em Letras. Aprovada em: ______ / ______ / ______ Banca Examinadora Prof. Dr.: ______________________________________________________________ Instituição: _____________________________ Assinatura: _____________________ Prof. Dr.: ______________________________________________________________ Instituição: _____________________________ Assinatura: _____________________ Prof. Dr.: ______________________________________________________________ Instituição: _____________________________ Assinatura: _____________________ IV Aos meus pais, Hélio e Rita V AGRADECIMENTOS Aos meus pais, Hélio e Rita, que sempre torceram por mim. À minha irmã, Carina, pela amizade e paciência em meus momentos de crise. Um agradecimento especial à minha orientadora, Profª. Stella Tagnin, pelo incentivo constante, pela preciosa orientação e pela confiança em mim depositada. Aos professores John Milton e Ieda Maria Alves, pelas contribuições no exame de qualificação. Aos colegas do Grupo COMET: Cris, Elisa, Rozane, Sandra, Marlene A., Marlene D., Lu Carvalho, Lu Ginezi, Alva, Carla Nejm, Andrea, Helmara, Josi, Danilo e Sérgio pelas discussões sempre proveitosas e, é claro, pelos momentos de descontração. À “Superwise”, também conhecida como Carmen Dyrell, pela ajuda com os testes estatísticos, com o WordSmith Tools e tantas outras coisas. À FAPESP (Fundação de Amparo à Pesquisa do Estado de São Paulo) pela concessão da bolsa de estudos. Aos amigos, pelo incentivo permanente. VI RESUMO Matuda, Sabrina. A fraseologia do futebol: um estudo bilíngue português-inglês direcionado pelo corpus. Dissertação (Mestrado). São Paulo: Faculdade de Filosofia, Letras e Ciências Humanas, Universidade de São Paulo, São Paulo, 2011.304 f. ; il. O objetivo desta pesquisa é estudar a terminologia do futebol em inglês e português por meio do estabelecimento de equivalentes fraseológicos. A escolha de trabalhar com unidades fraseológicas, e não apenas com termos isolados, deve-se ao fato de acreditarmos que um termo raramente ocorre sozinho. Em outras palavras, é muito provável que este venha acompanhado de um colocado, formando uma colocação e, muitas vezes, seja até parte de uma unidade de sentido maior. Para tanto, a fundamentação teórica embasa-se na Linguística de Corpus, na Terminologia Textual, na Tradução Técnica como ato comunicativo sujeito a condicionantes culturais e no conceito forma-representação. O corpus de estudo possui, aproximadamente, um milhão de palavras em cada língua: 917.073 em português e 1.002.897 em inglês. Cada corpus é dividido em quatro subcorpora: regras do jogo, textos jornalísticos sobre resultados de partidas, narrações minuto a minuto e “transmissões sociais”. A análise do corpus foi realizada de maneira semiautomática, utilizando o etiquetador Tree-Tagger para fazer a etiquetagem morfossintática dos textos e o programa WordSmith Tools para explorar o corpus. O estudo nos mostrou que a extração de unidades fraseológicas é uma abordagem promissora para a compilação de um glossário que tenha como objetivo registrar o uso autêntico da terminologia técnica - em nosso caso, do futebol. Ao final do trabalho, apresentamos um modelo de glossário bilíngue português-inglês de fraseologias formadas a partir do termo “gol”, com base na análise realizada. PALAVRAS-CHAVE: Futebol. Linguística de Corpus. Terminologia. Unidade Fraseológica Especializada. Tradução VII ABSTRACT Matuda, Sabrina. Football Phraseology: A bilingual Portuguese-English corpus-driven study. Dissertation. São Paulo: Faculdade de Filosofia, Letras e Ciências Humanas, Universidade de São Paulo, São Paulo, 2011.304 f. ; il. This study investigates football terminology both in English and in Portuguese and attempts to establish phraseological equivalents. Phraseological units were chosen to the detriment of individual terms because these usually occur in a larger context rather than as isolated lexical items living a life of their own. We believe that a term tends to be accompanied by a collocate, making up a collocation, which is frequently part of an extended unit of meaning. Therefore, the study is based on the notions of Corpus Linguistics and Textual Terminology. To explain cultural differences, technical translation is viewed as a communicative act subject to cultural restraints and the concept of “form-representation” is called upon to elucidate such differences. Our corpus consists of approximately two million words - 1.002.897 in English and 917.073 in Portuguese. Each corpus is divided into four subcorpora: laws of the game, newspaper reports on match results, live minute by minute commentaries and live commentaries by sports journalists and by football fans via social media like twitter and facebook. The analysis was carried out semi-automatically on tagged corpora, for which we used Helmut Schmid‟s Tree-Tagger and Mike Scott‟s WordSmith Tools. All in all, the study proved that the extraction of phraseological units is a promising approach to build a glossary which aims at registering the authentic use of specialized language, in this case, the language of football. The study concludes with a model for a bilingual Portuguese-English phraseological glossary with entries made up of the term goal. KEYWORDS: Football. Corpus Linguistics. Terminology. Specialized Phraseological Unit. Translation VIII LISTA DE FIGURAS Figura 1 – Interface do WordSmith Tools 5.0............................................................. - 38 - Figura 2 – Lista de palavras em ordem alfabética ...................................................... - 39 - Figura 3 – Lista de palavras em ordem de frequência ................................................ - 39 - Figura 4 – Tela com as estatísticas do corpus ............................................................ - 40 - Figura 5 – Tela de configuração do idioma ................................................................ - 41 - Figura 6 - Lista de palavras do corpus de estudo (PT) ............................................... - 42 - Figura 7 - Lista de palavras do corpus de referência .................................................. - 42 - Figura 8 – Lista de palavras-chave ............................................................................. - 43 - Figura 9 – Tela de seleção das wordlists .................................................................... - 44 - Figura 10 - Resultado de busca para “falta” na ferramenta Concord ......................... - 45 - Figura 11 - Tela que permite ordenar as linhas de concordância ............................... - 46 - Figura 12 - Resultado de busca para “falta” reordenado pela primeira palavra à esquerda e pela primeira palavra à direita ................................................................................. - 47 - Figura 13 - Contexto expandido de uma das linhas de concordância de “falta” ........ - 48 - Figura 14 – Tela da ferramenta Concord.................................................................... - 49 - Figura 15 - Ajuste dos parâmetros para a extração dos clusters de falta ................... - 50 - Figura 16 – página do jornal O Estado de São Paulo e do Lancenet sobre o resultado da partida entre o Coritiba e o Palmeiras do jogo de ida pelas quartas de finais da Copa do Brasil de 2001 ............................................................................................................. - 94 - Figura 17 - página do site football.uk e do jornal The Guardian sobre o resultado da partida entre o Barcelona e o Real Madrid no segundo jogo das semifinais da Liga dos Campeões de 2011 ...................................................................................................... - 95 - Figura 18 - Exemplo de cabeçalho de texto informativo.......................................... - 108 - Figura 19 - Etiquetas discursivas criadas para os textos jornalísticos ...................... - 111 - Figura 20 - Etiquetas discursivas utilizadas nas transmissões minuto a minuto ...... - 111 - Figura 21 - Etiquetas discursivas utilizadas nas “transmissões sociais” .................. - 112 - Figura 22 - Página inicial do etiquetador