Rede Automatizada De Spamtraps
Total Page:16
File Type:pdf, Size:1020Kb
Universidade do Minho Escola de Engenharia Pedro Jorge Barros Vasconcelos Guimarães Rede automatizada de spamtraps Outubro de 2011 Universidade do Minho Escola de Engenharia Pedro Jorge Barros Vasconcelos Guimarães Rede automatizada de spamtraps Dissertação de Mestrado Mestrado em Engenharia Informática Trabalho efectuado sob a orientação de Prof. Doutor António Luís Sousa Outubro de 2011 ii Declara¸c~ao Nome: Pedro Jorge Barros Vasconcelos Guimar~aes Endere¸coElectr´onico: [email protected] Telefone: 914486608 Bilhete de identidade: 13261663 T´ıtuloda Tese: Rede automatizada de spamtraps Orientador: Professor Doutor Ant´onioLu´ısSousa Ano de conclus~ao: 2011 Designa¸c~aodo Mestrado: Mestrado em Engenharia Inform´atica E´ AUTORIZADA A REPRODUC¸ AO~ INTEGRAL DESTA TESE APE- NAS PARA EFEITOS DE INVESTIGAC¸ AO,~ MEDIANTE DECLARAC¸ AO~ ESCRITA DO INTERESSADO, QUE A TAL SE COMPROMETE; Universidade do Minho, Maio de 2011 Assinatura: Who has time to manually spam web sites? That can't be very cost effective. Eric Cheng iv Agradecimentos Em primeiro lugar devo agradecer pelos preciosos conhecimentos t´ecnicosque me foram transmitidos pelo Nuno Pais Fernandes ao longo da fase de con- cep¸c~aoe desenvolvimento. As suas ideias e sugest~oesforam de um inestim´avel valor. Bastar´areal¸carque o projecto n~aoo seria sem a sua participa¸c~ao. Ao Professor Ant´onioLu´ısSousa que sempre me apontou o caminho indi- cado em termos acad´emicos,contribuindo com ideias valiosas para o projecto. A` equipa de suporte t´ecnico da Eurotux, em especial ao Duarte Rocha, Paulo Silva e Fernando Gomes, pelo tempo que dedicaram a elucidar-me sobre as mais variadas quest~oest´ecnicasrelacionadas com este projecto. A` administra¸c~aoda Eurotux Inform´aticaS.A. pela facilidade e flexibili- dade hor´ariasoferecidas, bem como pelas excelentes condi¸c~oesde trabalho. Ao Manuel Dias que embarcou no mesmo desafio de realizar a disserta¸c~ao de mestrado na ind´ustriae que sempre me ajudou naquilo que estava ao seu alcance. A` fam´ılia,amigos e em especial a Jos´eDur~aese Cl´audiaMatosa que sem- pre revelaram grande interesse e curiosidade, contribuindo com as preciosas sugest~oes. v vi AGRADECIMENTOS Resumo Spam ´eo termo que define o envio de mensagens n~aosolicitadas por meios electr´onicos. A vertente do fen´omenoassociada ao email ´eum problema que afecta a Internet desde os seus prim´ordios.S~aomuitas e sofisticadas as t´ecnicasadoptadas pelos spammers para espalhar mensagens n~aosolicitadas. Apesar disso, os mecanismos anti-spam t^emvindo a tornar-se cada vez mais eficazes. Uma t´ecnicade combate ao spam que se tem tornado cada vez mais popular ´ea utiliza¸c~aode spamtraps. Tratam-se de normais endere¸cosde email que n~aos~aoutilizados por humanos, tendo apenas como objectivo a captura de mensagens n~aosolicitadas e por isso classificadas como spam. Estes endere¸coss~aocolocados em locais estrat´egicosna Internet para que os spammers os recolham e os utilizem para enviar spam. Neste trabalho ´eproposto um novo modo de combater o spam tendo por base a distribui¸c~aoautom´aticade spamtraps por diversos locais. O projecto de software baseado neste princ´ıpioser´arespons´avel pela recep¸c~aoe enca- minhamento das mensagens recebidas pelas spamtraps. Estas mensagens de spam, futuramente, ser~aoutilizadas para alimentar um sistema de filtragem de spam j´aexistente, de modo a que este esteja sempre actualizado com os conte´udosmais recentes enviados pelos spammers, bem como das mais diversas informa¸c~oesrelativas aos remetentes destas. Palavras-chave: administra¸c~aode sistemas, email, seguran¸ca, redes, internet, spam, spamtrap vii viii RESUMO Abstract Spam is the term that defines the sending of unsolicited messages through electronic means. Since the beginning of the Internet, email spam is conside- red a serious problem. Nowadays, spammers are using increasingly sophisti- cated techniques in order to deliver unsolicited mail. Nevertheless, anti-spam mechanisms are becoming progressively more effective. The use of spamtraps is a technique that is becoming more popular. Spamtraps are unused, but yet valid, email addresses used as traps in order to seize unsolicited email, spam. Such addresses are placed in strategic locations over the Internet so spammers can collect and use them to send spam. The project based on this approach will be able to disseminate email addresses by various sites and then receive and route the generated messages. These messages will be used to feed an existing content based filtering system in a way that it will continuously learn about the most recent spam contents, as well as information concerning the senders. Keywords: systems administration, email, security, networks, internet, spam, spamtrap ix x ABSTRACT Conte´udo Agradecimentos v Resumo vii Abstract ix 1 Introdu¸c~ao 1 1.1 Contexto . .2 1.2 Motiva¸c~ao . .4 1.3 Objectivos . .6 1.4 Estrutura do documento . .7 2 Spam, spamtraps e factos relacionados 9 2.1 M´etodos de spam . .9 2.1.1 Aquisi¸c~aode endere¸cos . 10 2.1.2 Prepara¸c~aode conte´udos. 13 2.1.3 Envio de spam . 14 2.2 Mitiga¸c~ao . 16 2.2.1 Preven¸c~aode recolha de endere¸cos. 17 2.2.2 Filtragem baseada em conte´udos . 19 2.2.3 Filtragem n~ao-baseadaem conte´udos . 20 2.3 Redes de honeypots ........................ 23 2.3.1 Conceito . 24 2.3.2 Exemplos de redes de honeypots ............. 24 2.3.3 Inova¸c~oese diferen¸cas . 26 3 Rede Automatizada de Spamtraps 29 3.1 Arquitectura do sistema . 30 3.1.1 M´odulosde distribui¸c~aode spamtraps . 30 3.1.2 M´odulosauxiliares . 39 3.1.3 Ficheiros de configura¸c~ao. 41 xi xii CONTEUDO´ 3.1.4 Integra¸c~ao. 42 3.1.5 Spam collector ...................... 44 3.2 Base de dados . 46 3.2.1 Esquema relacional . 46 3.3 Servi¸cos . 51 3.3.1 Servidor DNS . 51 3.3.2 Servidor Email . 51 3.3.3 Servidor IMAP . 52 3.3.4 Servidor Web . 52 3.4 M´aquinavirtual . 53 3.4.1 Caracter´ısticasgerais . 53 3.4.2 Caracter´ısticasde rede . 53 3.4.3 Sistema Operativo . 53 4 Distribui¸c~aoautom´aticade spamtraps 55 4.1 Prepara¸c~ao . 55 4.1.1 Cria¸c~aode conte´udos. 56 4.1.2 Levantamento de locais . 56 4.1.3 Sistema . 57 4.2 Distribui¸c~ao . 58 4.2.1 Forums .......................... 59 4.2.2 Newsgroups ........................ 60 4.2.3 Twitter .......................... 62 4.2.4 Websites .......................... 63 5 Resultados 65 5.1 Enquadramento geral . 65 5.1.1 An´alisedo espa¸cotemporal . 66 5.1.2 Destinat´arios . 67 5.2 Spam e spamtraps distribu´ıdas. 68 5.2.1 Forums .......................... 69 5.2.2 Newsgroups ........................ 69 5.2.3 Twitter .......................... 70 5.2.4 Websites .......................... 70 5.3 Spam . 72 5.3.1 Conte´udo . 72 5.3.2 Proveni^encia. 74 6 Conclus~oes 77 6.1 Objectivos e resultados . 77 6.2 Aplica¸c~ao . 79 CONTEUDO´ xiii 6.2.1 Integra¸c~aocom ETMX . 80 6.2.2 Aplica¸c~oescomerciais . 80 6.3 Trabalho futuro . 81 xiv CONTEUDO´ Lista de Algoritmos 3.1 Distribui¸c~aode spamtraps em f´oruns . 32 3.2 Distribui¸c~aode spamtraps em newsgroups ........... 34 3.3 Distribui¸c~aode spamtraps em contas do Twitter ........ 35 3.4 Cria¸c~aode websites com spamtraps . 37 xv xvi LISTA DE ALGORITMOS Lista de Tabelas 1.1 Compara¸c~aode custos entre m´etodos de marketing comuns e spam. .3 2.1 Pa´ısesde origem de pr´aticasde harvesting ........... 10 2.2 Pa´ısescom maior incid^enciade envio de spam . 11 2.3 Principais sistemas operativos de relays de spam . 15 4.1 N´umerode spamtraps colocadas por local . 59 5.1 N´umerode mensagens recebidas por dia da semana . 66 5.2 Mensagens de spam recebidas por local de coloca¸c~aoda spamtrap 69 5.3 Hashtags que acompanharam spamtraps mais bem sucedidas . 71 5.4 Spam recebido por gama de IPs . 74 5.5 Spam recebido por pa´ıs. 75 xvii xviii LISTA DE TABELAS Lista de Figuras 2.1 Processo t´ıpicode harvesting em p´aginasWeb . 12 2.2 Exemplo de cabe¸calhosSMTP Received ............. 21 3.1 Arquitectura do sistema . 31 3.2 Exemplo de coloca¸c~aode uma spamtrap num f´orum phpBB .. 33 3.3 Exemplo de invoca¸c~aoda API do twitter ............ 35 3.4 Exemplo de coloca¸c~aode uma spamtrap numa conta do twitter 36 3.5 Amostra de c´odigoHTML gerado pelo m´odulo websites .... 38 3.6 Amostra de c´odigocom integra¸c~aodo m´oduloDBI . 40 3.7 Amostra de entradas no ficheiro asn.conf ............ 42 3.8 Cabe¸calhosHTTP utilizados pelo m´odulo WWW :: Mechanize 42 3.9 API simplificada das classes desenvolvidas . 44 3.10 Amostra de c´odigofonte do cliente de webservices ....... 45 3.11 Esquema relacional da base de dados . 47 3.12 Entrada t´ıpicana tabela Topics ................. 48 3.13 Amostra da configura¸c~aodo servi¸co dovecot .......... 52 4.1 Distribui¸c~aodi´ariade spamtraps . 58 4.2 Distribui¸c~aodi´ariade spamtraps em f´oruns. 60 4.3 Distribui¸c~aodi´ariade spamtraps em newsgroups ........ 61 4.4 Distribui¸c~aodi´ariade spamtraps em contas do twitter ..... 62 5.1 Recep¸c~aodi´ariade spam . 67 5.2 Percentagem de mensagens por categoria de spam . 74 6.1 Spamtraps colocadas e respectivo spam recebido por local . 78 xix xx LISTA DE FIGURAS Cap´ıtulo1 Introdu¸c~ao Desde o inicio da massifica¸c~aoda Internet que o envio de mensagens in- desej´aveis ou n~aosolicitadas, spam, se tem vindo a revelar um problema que afecta o regular funcionamento da rede global.