<<

VIII Simpósio Brasileiro de Sistemas Colaborativos

Uma Investigação sobre os ³Assuntos do Momento ´ e a Discussão de Notícias no Serviço de Microblogging Twitter Karen da Silva Figueiredo Ana Cristina Bicharra Garcia Instituto de Computação (IC) Instituto de Computação (IC) Universidade Federal Fluminense (UFF) Universidade Federal Fluminense (UFF) Rio de Janeiro, Brasil Rio de Janeiro, Brasil [email protected] [email protected]

ABSTRACT

Microblogging services like Twitter are a great opportunity of Categorias e Descritores de Assuntos research to study patterns of social interaction, given that, every H.5.3 [ Interfaces de Informação e Apresentação ]: Interfaces de day, those systems reach thousands of users who share and spread Grupo e Organização ± computação colaborativa, interação information through the network. In this paper we present an baseada em web. investigation on the most commented topics on Twitter, called Trend Topics, in order to identify: the real-world events which Termos Gerais these topics are discussing, the composition of the messages about Medição, Fatores Humanos. these topics, and the relationship between these topics and the news from the online news medias. The analysis was performed Palavras-chave on a sample of more than 500 000 tweets, 530 trend topics and Twitter, Microbbloging , Redes sociais online , Difusão de more than 3 900 news collected during one week. Informações, Difusão de notícias, Assuntos do Momento.

Categories and Subject Descriptors 1. INTRODUÇÃO H.5.3 [ Information Interfaces and Presentation ]: Group and Serviços de microblogging e redes sociais elevaram as formas de Organization Interfaces ± collaborative computing, web-based comunicação mediadas por computador a um novo patamar, interaction. tornando-se alvos de pesquisas por oferecem uma excelente oportunidade para estudar padrões sociais de interação tendo em General Terms vista que estes sistemas alcançam milhares de usuários todos os Measurement, Human Factors. dias. Os serviços de microblogging permitem que usuários divulguem e Keywords compartilhem informações sobre as suas atividades, opiniões e Twitter, Microbbloging, Online social network, Information status [1]. Entre vários destes serviços de microblogging talvez o diffusion, News diffusion, Trend Topics. Twitter [2] seja o mais popular atualmente. Além de ser um microblogging que oferece suporte à criação de conteúdos pelo RESUMO usuário (com um limite de 140 caracteres), também constitui uma Serviços de microblogging como o Twitter são excelentes rede social pois permite aos seus usuários seguirem as páginas de oportunidades para pesquisas de padrões sociais de interação, conteúdos de outros usuários (e tenham suas páginas seguidas), tendo em vista que todos os dias estes sistemas alcançam milhares criando vínculos entre estes. de usuários que compartilham e divulgam informações através da Algumas das pesquisas que têm sido desenvolvidas no domínio de rede. O presente trabalho apresenta uma investigação sobre os microblogging , analisam o Twitter a fim de entender como assuntos mais comentados no serviço de microblogging Twitter, ocorrem: (i) a criação de conteúdos pelos usuários [1]; (ii) as GHQRPLQDGRV³$VVXQWRVGR0RPHQWR´DILPGHFRPSUHHQGHUGR relações de amizade na rede [3], [4]; (iii) a formação de conversas que se tratam tais assuntos, i.e. a quais eventos do mundo real e processos colaborativos [3], [5], [6]; e (iv) a propagação de estes assuntos estão relacionados, quais as características das informações dentro da rede [4], [7], [8]. mensagens sobre estes assuntos e qual é a relação entre estes assuntos e as notícias divulgadas online. A realização da análise É sob o viés da propagação de informações na rede que o presente foi executada em uma amostra de mais de 500 mil tweets , 530 trabalho está localizado. O objetivo desta pesquisa é investigar: (i) ³$VVXQWRV GR 0RPHQWR´ H PDLV GH  QRWtFLDV FROHWDGRV quais são os assuntos mais comentados pelos usuários no Twitter; durante uma semana. (ii) a quais eventos do mundo real estes assuntos estão relacionados; (iii) quais as características das mensagens sobre estes assuntos; e (iv) qual é a afinidade entre estes assuntos e as notícias divulgadas online.

- 9 - VIII Simpósio Brasileiro de Sistemas Colaborativos

A partir dessa seção, o restante deste artigo está organizado da 0RPHQWR´ SRGHP VHU hashtags ou uma sequência de seguinte forma: na Seção 2 o Twitter e suas principais palavras iniciadas com letras maiúsculas. Cada termo da lista características são apresentadas; na Seção 3 alguns trabalhos GH ³$VVXQWRV GR 0RPHQWR´ IXQFLRQD FRPR XP  DWDOKR SDUD relacionados são brevemente tratados; na Seção 4 o processo de uma busca que retorna como resultado os últimos tweets de investigação da pesquisa é detalho, nela são descritos a coleta de todos os usuários da rede que contenham aquele termo. dados e os resultados obtidos; e na Seção 5 as conclusões e trabalhos futuros são discutidos. x Busca e operadores de busca: o Twitter oferece uma ferramenta de busca que pode apresentar como resultados para o termo de entrada: últimos tweets , imagens e vídeos 2. O TWITTER E SUAS divulgados através de URLs nos tweets e usuários. Uma série CARACTERÍSTICAS de operadores pode ser usada em conjunto com o termo O Twitter, como dito anteriormente, é tanto um serviço de desejado na entrada para refinar os resultados da busca, tais microblogging , quanto uma rede social. É um sistema como: operadores de localidade, operadores de idioma, colaborativo [6] que oferece suporte à criação de conteúdos pelos operadores temporais, etc. seus usuários quando os mesmos respondem à pergunta exibida na x Operadores de atitudes: compõem um subconjunto dos SiJLQD LQLFLDO GR VLVWHPD ³2 TXH HVWi DFRQWHFHQGR"´ (VWD operadores de busca que refinam os resultados do termo de resposta deve ter no máximo 140 caracteres e é denominada tweet . HQWUDGD 6mR HVWHV RSHUDGRUHV ³ ´ H ³ ´ 2 RSHUDGRU ³ ´ O conjunto de tweets produzidos por um usuário constituem a sua filtra os resultados exibindo apenas tweets com uma atitude linha do tempo que é disponibilizada para todos em sua página, positiva em relação à entrada da busca. De forma oposta, o caso o usuário permita. Usuários podem seguir as páginas de RSHUDGRU³ ´H[LEHRV tweets resultantes que expressem uma outros usuários e, a partir de então, os primeiros começam a atitude negativa em relação à entrada da busca. receber os tweets dos usuários seguidos diretamente na sua página inicial. As características apresentadas tornam a navegação na rede e a comunicação entre os usuários mais dinâmica, motivando o O questionamento constante da pergunta exibida na página inicial compartilhamento de informações e opiniões como já e o limite de 140 caracteres incentivam uma frequência maior de demonstrado em [1] e [4]. O presente trabalho tem como foco a produção de conteúdo pelo usuário e a disponibilidade de uma DQiOLVH GRV ³$VVXQWRV GR 0RPHQWR´ H DV FDUDFWHUtVWLFDV GRV versão mobile do sistema facilita ainda mais o compartilhamento tweets relacionados a estes assuntos: número de menções, número de informações em tempo real. de retweets , número de URLs e quantidade de atitudes positivas e O serviço também possui características peculiares que o tornam negativas. mais atrativo e facilitam a difusão de conteúdo na rede. Algumas destas características são listadas e descritas a seguir: 3. TRABALHOS RELACIONADOS x Menções: um usuário pode citar outro usuário em seu tweet Em [1] o primeiro estudo sobre as propriedades topológicas e através de uma menção. Essa menção é feita utilizando o geográficas do serviço de microblogging Twitter foi executado. símbolo de @ seguido do nome do usuário a ser mencionado. Os autores analisaram as intenções dos usuários e a tendência de A menção pode ser utilizada como uma ferramenta para usuários com intenções similares de se conectarem. E, ainda em chamar a atenção de um usuário para o conteúdo do tweet e [1], os autores classificaram os usuários da rede em três tipos para iniciar conversas entre os usuários na rede [6]. principais: fontes de informações, amigos e buscadores de informações. Esta classificação confirma que os usuários do x Retweets : caso um usuário considere interessante o tweet de Twitter enxergam a rede como um concentrador de informações. outro usuário ele pode utilizar este tipo especial de menção chamado retweet . Através do retweet o usuário compartilha o Outra característica de [1] foi a utilização de um método para conteúdo do tweet de outro usuário com os seus seguidores calcular quais termos eram os mais comentados durante mantendo o crédito do seu produtor. O retweet pode ser determinado dia da VHPDQDDOJRPXLWRVLPLODUDRV³$VVXQWRVGR 0RPHQWR´ 1D pSRFD GD SHVTXLVD >@ DLQGD QmR H[LVWD D realizado de forma automática através da funcionalidade 1 Retweetar do sistema, ou de forma manual caracterizado IXQFLRQDOLGDGH ³$VVXQWRV GR 0RPHQWR´ QR 7ZLWWHU . Uma vez JHUDOPHQWH FRP XP ³57´ QR LQtFLR GD PHQVDJHP VHJXLGR calculados os termos mais comentados, os autores classificaram os pela menção e pelo tweet original do usuário fonte. Outras WHUPRVHPWUrVFDWHJRULDV³3URJUDPDVGH79´³(YHQWRV$WXDLV´ formas de retweets são discutidas em [9]. H³$WLYLGDGHV´ Uma abordagem semelhante a esta categorização do trabalho [1] é realizada neste artigo na Seção 4. x Hashtags : um usuário pode destacar um termo em seu tweet Em [6] o aspecto colaborativo do Twitter foi observado com o prefixando- R FRP R VtPEROR ³´ 7HUPRV GHVWDFDGRV GHVWD forma são conhecidos como hashtags e são utilizados como objetivo de determinar o quanto as suas funcionalidades facilitam uma forma de indicar o teor do conteúdo do tweet . O Twitter a troca de informações entre usuários. No final do trabalho são gera um link para cada hashtag que, ao ser selecionado, leva discutidas modificações de design que tornariam o Twitter uma a uma busca que tem como resultado os últimos tweets de ferramenta melhor para colaboração. Metade destas modificações todos os usuários da rede que contenham o termo da hashtag . apontadas pelos autores de [6] já estão disponíveis na rede atualmente, dentre elas a funcionalidade de busca mencionada na x Assuntos do Momento ( Trend Topics , em inglês): na Seção 2, essencial para a elaboração deste trabalho (veja mais página inicial de cada usuário é exibida uma lista que contém detalhes na Seção 4). os 10 termos mais comentados em todos os tweets ou nos tweets de usuários de determinada região (escolhida pelo XVXiULR  7DLV WHUPRV GHQRPLQDGRV FRPR ³$VVXQWRV GR 1 $IXQFLRQDOLGDGH³$VVXQWRVGR0RPHQWR´VXUJLXHP

- 10 - VIII Simpósio Brasileiro de Sistemas Colaborativos

Kwak et al. [4] também apresenta uma análise das características Durante este período foram coletados mais de 500 mil tweets 4, topológicas do Twitter, porém com enfoque no poder da rede de ³$VVXQWRVGR0RPHQWR´HPDLVGHQRWtFLDV compartilhar informações. O estudo trata do comportamento Devido à grande quantidade de dados coletados, foram analisados WHPSRUDO GRV ³$VVXQWRV GR 0RPHQWR´ H GD SURSDJDomR GH neste estudo somente os 10 informações através de sequências de retweets . Além disso, os ³$VVXQWRVGR0RPHQWR´GHFDGDGLD que permaneceram por mais tempo na lista de assuntos, e seus DXWRUHVFRPSDUDPRVWHUPRVGDOLVWDGH³$VVXQWRVGR0RPHQWR´ respectivos resultados de busca, totalizando 70 com os termos do Google Trend e as manchetes da rede CNN. ³$VVXQWRV GR mais de 306 mil tweets . Entretanto, não são relatados dados referentes à comparação dos 0RPHQWR´H ³$VVXQWRV GR 0RPHQWR´ FRP D &11 D ~QLFD LQIRUPDomR discutida no artigo é a de que a CNN estaria em mais da metade 4.2 Apresentação e Discussão dos Resultados das vezes à frente na divulgação de notícias do que o Twitter. 4.2.1 ,GHQWLILFDomRH&DWHJRUL]DomRGRV³$VVXQWRV Trabalhos sobre a propagação de informações semelhantes a [4] foram executados previamente em outras redes sociais [10] e GR0RPHQWR´ Conforme descrito na Seção 3, em [1] foi utilizado um método serviços de blogging [11]. Entretanto, até onde é do conhecimento para calcular quais termos eram os mais comentados durante dos autores do presente artigo, não existem trabalhos relacionados determinado dia da semana e, após calculados, os termos mais à discussão de notícias nestes sistemas ou no Twitter. comentados foram classificados HPWUrVFDWHJRULDV³3URJUDPDVGH 79´³(YHQWRV$WXDLV´H³$WLYLGDGHV´ 4. O PROCESSO DE INVESTIGAÇÃO Nesta seção o processo de investigação realizado a fim de analisar De forma semelhante ao trabalho [1], nesta seção RV³$VVXQWRVGR foram classificados em categorias descritas a RV³$VVXQWRVGR0RPHQWR´HDGLVFXVVmRGHQRWtFLDVQR7Z itter é 0RPHQWR´FROHWDGRV detalhado. Esta investigação tem como objetivos identificar: (i) seguir a fim de compreender melhor os assuntos que são mais quais são os assuntos mais comentados pelos usuários no Twitter; debatidos no Twitter. Os resultados são apresentados nas Tabelas (ii) quais eventos do mundo real estão relacionados a estes 1 e 2. assuntos; (iii) quais assuntos estão relacionados às notícias x Eventos Atuais: assuntos relacionados a acontecimentos do divulgadas online; (iv) quais as características das mensagens dia. sobre os assuntos mais comentados, especialmente sobre os assuntos identificados no item (iii). x Eventos Passados: assuntos relacionados a acontecimentos de dias anteriores. Na Seção 4.1 o método utilizado para a coleta dos dados é descrito e na Seção 4.2 os resultados obtidos são discutidos. x Eventos Futuros: assuntos relacionados a acontecimentos de dias futuros. 4.1 A Coleta dos Dados x Programas de TV: assuntos relacionados a programas de Para a coleta dos dados foi desenvolvido um web crawler em Java TV do momento. [12] utilizando as bibliotecas Twitter4J [13] para a conexão com o Twitter e ROME [14] para a conexão com centrais de notícias. x Esportes: assuntos relacionados a eventos esportivos do momento. A cada cinco minutos o web crawler copiava a lista dos atuais ³$VVXQWRVGR0RPHQWR´ 2 do Twitter e realizava três buscas para x ³Grassroots ´ o termo não tem uma tradução direta para o cada um desses assuntos, copiando também os seus resultados. português e se refere a movimentos populares que surgem de Foram utilizadas como entradas para os três tipos de busca: (i) o forma natural e espontânea. Classificou-se como grassroots termo do assunto; (ii) o termo do assunto seguido do operador de assuntos relacionados a estes tipos de movimentos populares, atitudes positivas; e (iii) o termo do assunto seguido do operador como brincadeiras (e.g. #followgeral), manifestações (e.g. de atitudes negativas. #euescolhiesperar), etc. Na mesma periodicidade de cinco minutos, foram coletadas 1D 7DEHOD  VmR DSRQWDGRV RV  ³$VVXQWRV GR 0RPHQWR´ GH manchetes e datas de publicação de notícias de três centrais de cada dia da semana analisada que permaneceram por mais tempo 5 notícias online 3. na lista de assuntos . Cada assunto da Tabela 1 foi identificado com uma cor que representa a sua categoria a fim de facilitar a A coleta de dados foi executada entre os dias 18 e 24 de junho de leitura da tabela considerando a quantidade de entradas, por 2011, constituindo um intervalo de sete dias (uma semana). exemplo, a cor laranja indica que um assunto é da categoria ³(VSRUWHV´

2 $OLVWDGH³$VVXQWRVGR0RPHQWR´pGHWHUPLQDGDUHJLRQDOPHQWH pelo Twitter. A lista coletada neste trabalho foi a lista de 4 Como o foco deste artigo não é a detecção de spam, optamos por ³$VVXQWRV GR 0RPHQWR´ GD UHJLmR  ³ Brazil ± adotar a técnica de eliminação de tweets que continham mais do Country ´ que três ³$VVXQWRVGR0RPHQWR´QDPHVPDPHQVDJHP técnica 3As centrais de notícias escolhidas para este trabalho foram G1 também utilizada em [4]. [15], R7 [16] e Google Notícias Brasil [17]. A escolha destas 5 $OLVWDFRPSOHWDGH³$VVXQWRVGR0RPHQWR´FROHWDGRVGXUDQWHD centrais foi determinada pela popularidade das duas primeiras e semana com os seus respectivos tempos de permanência na lista pelo fato da última apresentar uma coletânea das principais de assuntos está disponível em: http://www.ic.uff.br/ centrais do Brasil. ~kfigueiredo/tresearch/assuntos.pdf

- 11 - VIII Simpósio Brasileiro de Sistemas Colaborativos

Tabela 1. Assuntos do Momento e suas Categorias Posição Sexta-feira Legenda: Eventos Atuais Eventos Passados Eventos Futuros 8 Snoop Dog Programas de TV Esportes "Grassroots " 9 IBGE Posição Sábado Domingo 10 #boladay 1 Sonia Braga #chicolatrasday 2 Undisclosed Desires #saojoaodonordeste Tabela 2. Análise Quantitativa das Categorias 3 Deborah Blando Joe & Nick Número de 4 #ufc134 Categoria ³$VVXQWRVGR0RPHQWR´ Percentual 5 #sigavelhostempos Steven Seagal Eventos Atuais 18 25,71% 6 #plantaeraiz Dragonball Evolution Eventos Passados 2 2,86% 7 SNZ #RogerioCeni Eventos Futuros 2 2,86% 8 #ZeGotinha Papai Joel Programas de TV 21 30% 9 Leandra Leal Beto Barbosa Esportes 7 10% 10 #maislegalquetvxuxa Werdum ³Grassroots ´ 14 20% Posição Segunda-feira Terça-feira Não identificada 6 8,57% 1 GAGA WON #euescolhiesperar Total 70 100,00% 2 #bancodeseguidores #twitter3 3 Ryan Dunn Wilza Carla $7DEHODDSRQWDDTXDQWLGDGHGH³$VVXQWRVGR0RPHQWR´ GH 4 Martha Rocha Kelly Kelly cada categoria de acordo com a classificação feita na Tabela 1. Como se pode observar na Tabela 2, os programas de TV são os 5 #cidadedoshomens Skol Sensations assuntos mais comentados no Twitter, ocupando 30% dos 6 Evangeline Lilly Dakota Fanning ³$VVXQWRVGR0RPHQWR´GDVHPDQDDQDOLVDGD(PVHJXLGDHVWmR 7 Falling Skies Moves Like Jagger os eventos atuais (25,71%) e os grassroots (20%). 8 #oprecodeumalicao #herois Os grassroots no Twitter são tão importantes que, se a mesma categorização utilizada neste trabalho for aplicada para as 9 3YearsCampRock Ryan Dunn hashtags retweetadas mais populares apresentadas em [18], o 10 Jackass Carla Diaz percentual de hashtags GDFDWHJRULD³ Grassroots ´FKHJDD Posição Quarta-feira Quinta-feira $SyV FODVVLILFDGR FDGD WHUPR GRV ³$VVXQWRV GR 0RPHQWR´ GD 1 Phineas & Ferb OrgulhoPeLanza Tabela 1 foi buscado entre as 3900 manchetes de notícias. Os ³$VVXQWRV GR 0RPHQWR´ VXEOLQKDGRV QD 7DEHOD  UHIHUHP -se a 2 #feriadao #SantosCampeao assuntos que obtiveram resultados durante esta busca. 3 Garota Infernal Kleber Machado 4 Enrique Iglesias Ferris Bueller Tabela 3. Primeiras Ocorrências dos Assuntos do Momento no 5 Orgulho Hetero #zelove Twitter e nas Centrais de Notícias 6 #followgeral #curtindoavidaadoidado 1ª ocorrência nos 1ª ocorrência 7 Alianza Lima Phineas & Ferb Assunto "Assuntos do Momento" nas Notícias 8 IWannaGodney Uruguaios #feriadao 22/06 às 10:36h 22/06 às 06:00h 9 #dianacionaldovexame Rodrigo Santana #RogerioCeni 19/06 às 16:31h 19/06 às 18:02h 10 Corpus Christi Stella Florence #SantosCampeao 22/06 às 23:57h 23/06 às 08:38h Posição Sexta-feira #ZeGotinha 18/06 às 11:16h 18/06 às 06:00h 1 #palmeirasminhavida Capitão América 23/06 às 21:24h 23/06 às 21:08h 2 Capitão América Corpus Christi 22/06 às 08:48h 22/06 às 06:00h 3 Team Fortress IBGE 24/06 às 08:04h 24/06 às 04:03h 4 OrgulhoPeLanza Jackass 20/06 às 12:15h 21/06 às 11:00h 5 Padre Juarez Orgulho Hetero 22/06 às 12:34h 22/06 às 13:02h 6 #billboardawards Ryan Dunn 20/06 às 11:39h 21/06 às 11:00h 7 #uiquilics Wilza Carla 20/06 às 21:24h 21/06 às 00:20h

- 12 - VIII Simpósio Brasileiro de Sistemas Colaborativos

Comparou-se então a data de publicação da notícia com a data de As taxas de atitudes positivas e atitudes negativas somam 100% DWXDOL]DomR GR 7ZLWWHU GD OLVWD GH ³$VVXQWRV GR 0RPHQWR´ TXH dos tweets coletados. Um tweet é sempre classificado como continha o assunto referido. Os resultados são apresentados na possuindo ou uma atitude positiva ou uma atitude negativa pelo Tabela 3. Twitter. Já as taxas de retweets , menções e URLs não são mutuamente exclusivas e portanto não totalizam 100% dos tweets Nota-se que apenas 15,71% dos assuntos mais comentados no coletados. Um tweet pode ser ao mesmo tempo uma menção, um Twitter aparecem nas notícias, sendo 63,64% sobre eventos atuais retweet e conter uma URL, bem como pode não possuir nenhuma e 18,18% sobre esportes. As ocorrências sublinhadas na Tabela 3 dessas características. destacam a primeira ocorrência geral do assunto. Em média a taxa de menções é de 41,65%, sendo um pouco mais De acordo com as ocorrências sublinhadas na Tabela 3, 54,55% da metade destas do tipo retweet (23,32% do total). Este valor da dos assuntos analisados foram comentados no Twitter antes das taxa de menções é um pouco maior do que valor obtido em [6], notícias serem publicadas, e esse número sobe para 100% em que foi de 30%. No trabalho [6], foram medidas as menções de DVVXQWRVGDFDWHJRULD³(VSRUWHV´8PPRWLYRTXHSRGHMXVWLILFDU todos os tweets , nã R VRPHQWH RVUHODFLRQDGRVDRV³$VVXQWRVGR este resultado é o fato dos eventos esportivos serem MRPHQWR´ R TXH SRGH LQGLFDU TXH RV XVXiULRV WURFDP PDLV acompanhados em tempo real pelos usuários, e assim, serem mensagens com os outros sobre os assuntos mais populares na discutidos na rede enquanto ainda estão acontecendo. rede. Já o valor da média da taxa de URLs é bem próximo ao 2V DVVXQWRV ³5\DQ 'XQQ´ ³-DFNDVV´ H ³:LO]D &DUOD´ WDPEpP valores de 13% e 19% indicados por Java et al. em [1] e Zarella apareceram primeiro no Twitter, estando estes relacionados ao em [19] respectivamente. falecimento de celebridades. Como a vida de celebridades Com relação às médias das taxas de atitudes positivas/negativas, costuma ser acompanhada pelos seus fãs, talvez isso explique as pode-se observar que em sua maioria (65,43%) a atitude positiva primeiras ocorrências desses assuntos no Twitter. GRVXVXiULRVVREUHRV³$ ssuntos d R0RPHQWR´SUHYDOHFH . 4.2.2 ,GHQWLILFDomRH&DWHJRUL]DomRGRV³$VVXQWRV Na Tabela 5 VmRLOXVWUDGRVRVYDORUHVGDVWD[DVSDUDRV³$VVXQWRV GR 0RPHQWR´ que apareceram em notícias, listados previamente GR0RPHQWR´ na Tabela 3. Com o objetivo de analisar as características da composição dos tweets FROHWDGRV QDV EXVFDV GRV ³$VVXQWRV GR 0RPHQWR´ IRUDP calculadas as seguintes taxas para cada assunto 6: Tabela 5. Taxas dos Assuntos do Momento Noticiados x Taxa de Retweets: porcentagem de tweets que são retweets no total de tweets coletado. x Taxa de Menções: porcentagem de tweets que fazem

menções a outros usuários no total de tweets coletado. Assunto Taxa de Retweets Taxa de Menções Taxa de URLs Taxa de Atitudes Positivas Taxa de Atitudes Negativas #feriadao 11,75% 19,12% 3,69% 55,38% 44,62% x Taxa de URLs: porcentagem de tweets que contém URLs no total de tweets coletado. #RogerioCeni 25,71% 35,73% 2,89% 91,10% 8,90% #SantosCampeao 22,96% 40,04% 2,30% 58,57% 41,43% x Taxa de Atitudes Positivas/Negativas: porcentagem de tweets que apresentam uma atitude positiva/negativa no total #ZeGotinha 16,39% 32,59% 3,08% 53,39% 46,61% de tweets coletados através das buscas com operadores de Capitão América 10,80% 24,90% 21,12% 82,11% 17,89% atitudes. Corpus Christi 20,42% 44,03% 20,06% 49,42% 50,58% As médias das taxas calculadas para cada assunto são indicadas na IBGE 22,40% 45,40% 53,77% 85,57% 14,43% Tabela 4. Jackass 40,33% 63,11% 17,03% 50,62% 49,38% Orgulho Hetero 42,49% 54,24% 7,27% 53,93% 46,07% Tabela 4. Média das Taxas dos Assuntos do Momento Ryan Dunn 53,38% 65,16% 13,97% 45,79% 54,21% Taxa Valor Médio Wilza Carla 36,48% 43,14% 35,62% 19,56% 80,44% Taxa de Retweets 23,32% Valor Médio 27,56% 42,50% 16,44% 58,68% 41,32% Taxa de Menções 41,65% Taxa de URLs 12,29% Como pode-se notar o valor médio da taxa de menções para estes assuntos se manteve bem próximo do valor médio geral. Taxa de Atitudes Positivas 65,43% Entretanto, é possível perceber um pequeno aumento com relação Taxa de Atitudes Negativas 34,57% às taxas de retweets (27,56%) e URLs (16,44%). Outros pontos interessantes revelados na Tabela 5, são: (i) os assuntos da categoria ³Esportes ´ têm a menor taxa de URLs, em média 2,59%, provavelmente pelo fato dos eventos esportivos serem acompanhados em tempo real pelos usuários que devem ter 6 A tabela geral contendo todos os assuntos e suas respectivas menor interesse na divulgação de URLs nesse momento; (ii) os taxas está disponível em http://www.ic.uff.br/~kfigueiredo/ assuntos que foram comentados primeiramente no Twitter têm as tresearch/taxasDosAssuntos.pdf maiores taxas de retweets o que pode indicar o intuito dos

- 13 - VIII Simpósio Brasileiro de Sistemas Colaborativos

usuários de propagarem esses assuntos pela rede; e (iii) as notícias [3] Huberman, B., Romero, D. and Wu, F. 2009. Social relacionadas ao falecimento de celebridades têm as maiores taxas networks that matter: Twitter under the microscope. First de atitudes negativas, por motivos óbvios, contrariando a Monday, Volume 14, Number 1 - 5 January, 2009. tendência geral dos assuntos mais comentados de terem uma [4] Kwak, H., Lee, C., Park, H. and Moon, S. 2010. What is maior taxa de atitudes positivas. Twitter, a social network or a news media? In Proceedings of the 19th international conference on World wide web 5. CONCLUSÃO E TRABALHOS (WWW '10). ACM, New York, NY, USA, 591-600. FUTUROS [5] Wu, S., Hofman, J. M., Mason, W. A. and Watts, D. J. 2011. O presente trabalho apresentou uma análise sobre os assuntos Who says what to whom on twitter. In Proceedings of the mais comentados no serviço de microblogging Twitter, 20th international conference on World wide web (WWW GHQRPLQDGRV³$VVXQWRVGR0RPHQWR´DILPGHFRPSUHHQGHUGR '11). ACM, New York, NY, USA, 705-714. que se tratam tais assuntos, i.e. a quais eventos do mundo real [6] Honeycutt, C. and Herring, S. 2009. Beyond Microblogging: estes assuntos estão relacionados. Para tanto, realizou-se uma Conversation and Collaboration via Twitter. Hawaii FDWHJRUL]DomRGRV³$VVXQWRVGR0RPHQWR´HDSDUWLUGHOD , pode- International Conference on System Sciences, pp. 1-10, 42nd se observar que os tópicos que os usuários da rede mais comentam Hawaii International Conference on System Sciences. são os programas de TV e eventos que acontecem no dia, seguidos dos grassroots que são movimentos populares [7] Sakaki, T., Okazaki, M. and Matsuo, Y. 2010. Earthquake geralmente iniciados na própria rede, como brincadeiras, shakes Twitter users: real-time event detection by social manifestações, homenagens, etc. sensors. In Proceedings of the 19th international conference on World wide web (WWW '10). ACM, New York, NY, $OpPGDFDWHJRUL]DomRGRV³$VVXQWRVGR0RPHQWR´RVDVVXQWRV USA, 851-860. coletados também foram comparados com as manchetes de [8] Bakshy, E., Hofman, J. M., Mason, W. A. and Watts. D. J. centrais de notícias online, desta forma foi possível identificar os 2011. Everyone's an influencer: quantifying influence on assuntos mais comentados na rede que estão relacionados a twitter. In Proceedings of the fourth ACM international notícias e, até mesmo, apontar quais dessas notícias se propagam conference on Web search and data mining (WSDM '11). no Twitter antes mesmo se serem publicadas. ACM, New York, NY, USA, 65-74. Outra contribuição deste trabalho foi a elaboração de uma análise [9] Boyd, D., Golder, S., and Lotan, G. 2010. Tweet, da composição dos tweets VREUH RV ³$VVXQWRV GR 0RPHQWR´ Tweet, Retweet: Conversational Aspects of Retweeting on através da medição de taxas de retweets , menções, URLs e Twitter. In Proceegings of +,&66¶ -10. atitudes positivas/negativas das mensagens, discutindo principalmente os resultados associados aos assuntos que estão [10] Cha, M., Mislove, A. and Gummadi, K. P. 2009. A ligados a notícias. measurement-driven analysis of information propagation in the flickr social network. In Proceedings of the 18th Até onde é de conhecimento dos autores deste artigo, este é o international conference on World wide web (WWW '09). primeiro trabalho investigativo sobre o Twitter que explora em ACM, New York, NY, USA, 721-730. sua análise: (i) a discussão de notícias na rede; (ii) a categorização [11] Gruhl, D., Guha, R., Liben-Nowell, D. and Tomkins, A. dos assuntos mais comentados incluindo os grassroots ; e (iii) a 2004. Information diffusion through blogspace. In medição de atitudes positivas/negativas nos tweets sobre os Proceedings of the 13th international conference on World

³$VVXQWRVGR0RPHQWR´ Wide Web (WWW '04). ACM, New York, NY, USA, 491- Este trabalho pode ser o ponto de partida para pesquisas em outras 501. áreas. Entender as características da composição GRV³$VVXQWRVGR [12] The Java Language Specification. Disponível em: 0RPHQWR´ QR 7ZLWWHU p LPSRUWDQWH SDUD D FULDomR GH QRYDV http://java.sun.com/docs/books/jls/, Acesso em: 30 de Junho estratégias de marketing e a análise da sua propagação para de 2011. investigações na área de comunicação. [13] Twitter4J. Disponível em: http://twitter4j.org/en/index.html, Como trabalho futuro pretende-se realizar uma investigação mais Acesso em: 30 de Junho de 2011. profunda, a partir de uma coleta de dados globais no Twitter, com [14] Rome. Disponível em: http://rome.dev.java.net/, Acesso em: uma duração de 30 dias e incluindo mais fontes de centrais de 30 de Junho de 2011. notícias, pois é esperado pelos autores que o número de assuntos discutidos sobre notícias aumente nessas condições. [15] G1 RSS. Disponível em: http://g1.globo.com/dynamo/rss2.xml, Acesso em: 30 de 6. REFERÊNCIAS Junho de 2011. [1] Java, A., Song, X., Finin, T., and Tseng, B. 2007. Why we [16] R7 RSS. Disponível em: twitter: understanding microblogging usage and http://www.r7.com/data/rss/brasil.xml, Acesso em: 30 de communities. In Proceedings of the 9th WebKDD and 1st Junho de 2011. SNA-KDD 2007 workshop on Web mining and social [17] Google News Brasil RSS. Disponível em: network analysis (WebKDD/SNA-KDD '07). ACM, New http://news.google.com.br/news?pz=1&hdlOnly=1&cf=all& York, NY, USA, 56-65. ned=pt-BR_br&hl=pt-BR&topic=h&num=3&output=rss, [2] Twitter. Disponível em: http://twitter.com, Acesso em: 30 Acesso em: 30 de Junho de 2011. de Junho de 2011. [18] Suh, B., Hong, L., Pirolli, P. and Chi, E. H. 2010. Want to be Retweeted? Large Scale Analytics on Factors Impacting

- 14 - VIII Simpósio Brasileiro de Sistemas Colaborativos

Retweet in Twitter Network. In Proceedings of the 2010 [19] Zarrella, D. 2009. Science of Retweets. Disponível em: IEEE Second International Conference on Social Computing http://danzarrella.com/the-science-of-retweets-report.html, (SOCIALCOM '10). IEEE Computer Society, Washington, Acesso em: 30 de Junho de 2011 DC, USA, 177-184.

- 15 -