Rede Automatizada De Spamtraps

Universidade do Minho Escola de Engenharia Pedro Jorge Barros Vasconcelos Guimarães Rede automatizada de spamtraps Outubro de 2011 Universidade do Minho Escola de Engenharia Pedro Jorge Barros Vasconcelos Guimarães Rede automatizada de spamtraps Dissertação de Mestrado Mestrado em Engenharia Informática Trabalho efectuado sob a orientação de Prof. Doutor António Luís Sousa Outubro de 2011 ii Declara¸c~ao Nome: Pedro Jorge Barros Vasconcelos Guimar~aes Endere¸coElectrónico: [email protected] Telefone: 914486608 Bilhete de identidade: 13261663 T´ıtuloda Tese: Rede automatizada de spamtraps Orientador: Professor Doutor AntónioLu´ısSousa Ano de conclus~ao: 2011 Designa¸c~aodo Mestrado: Mestrado em Engenharia Informática E´ AUTORIZADA A REPRODUÇ AO~ INTEGRAL DESTA TESE APE- NAS PARA EFEITOS DE INVESTIGAÇ AO,~ MEDIANTE DECLARAÇ AO~ ESCRITA DO INTERESSADO, QUE A TAL SE COMPROMETE; Universidade do Minho, Maio de 2011 Assinatura: Who has time to manually spam web sites? That can't be very cost effective. Eric Cheng iv Agradecimentos Em primeiro lugar devo agradecer pelos preciosos conhecimentos técnicosque me foram transmitidos pelo Nuno Pais Fernandes ao longo da fase de con- cep¸c~aoe desenvolvimento. As suas ideias e sugest~oesforam de um inestimável valor. Bastaráreal¸carque o projecto n~aoo seria sem a sua participa¸c~ao. Ao Professor AntónioLu´ısSousa que sempre me apontou o caminho indi- cado em termos académicos,contribuindo com ideias valiosas para o projecto. A` equipa de suporte técnico da Eurotux, em especial ao Duarte Rocha, Paulo Silva e Fernando Gomes, pelo tempo que dedicaram a elucidar-me sobre as mais variadas quest~oestécnicasrelacionadas com este projecto. A` administra¸c~aoda Eurotux InformáticaS.A. pela facilidade e flexibili- dade horáriasoferecidas, bem como pelas excelentes condi¸c~oesde trabalho. Ao Manuel Dias que embarcou no mesmo desafio de realizar a disserta¸c~ao de mestrado na indústriae que sempre me ajudou naquilo que estava ao seu alcance. A` fam´ılia,amigos e em especial a JoséDur~aese CláudiaMatosa que sempre revelaram grande interesse e curiosidade, contribuindo com as preciosas sugest~oes. v vi AGRADECIMENTOS Resumo Spam éo termo que define o envio de mensagens n~aosolicitadas por meios electrónicos. A vertente do fenómenoassociada ao email éum problema que afecta a Internet desde os seus primórdios.S~aomuitas e sofisticadas as técnicasadoptadas pelos spammers para espalhar mensagens n~aosolicitadas. Apesar disso, os mecanismos anti-spam têmvindo a tornar-se cada vez mais eficazes. Uma técnicade combate ao spam que se tem tornado cada vez mais popular éa utiliza¸c~aode spamtraps. Tratam-se de normais endere¸cosde email que n~aos~aoutilizados por humanos, tendo apenas como objectivo a captura de mensagens n~aosolicitadas e por isso classificadas como spam. Estes endere¸coss~aocolocados em locais estratégicosna Internet para que os spammers os recolham e os utilizem para enviar spam. Neste trabalho éproposto um novo modo de combater o spam tendo por base a distribui¸c~aoautomáticade spamtraps por diversos locais. O projecto de software baseado neste princ´ıpioseráresponsável pela recep¸c~aoe enca- minhamento das mensagens recebidas pelas spamtraps. Estas mensagens de spam, futuramente, ser~aoutilizadas para alimentar um sistema de filtragem de spam jáexistente, de modo a que este esteja sempre actualizado com os conteúdosmais recentes enviados pelos spammers, bem como das mais diversas informa¸c~oesrelativas aos remetentes destas. Palavras-chave: administra¸c~aode sistemas, email, seguran¸ca, redes, internet, spam, spamtrap vii viii RESUMO Abstract Spam is the term that defines the sending of unsolicited messages through electronic means. Since the beginning of the Internet, email spam is conside- red a serious problem. Nowadays, spammers are using increasingly sophisti- cated techniques in order to deliver unsolicited mail. Nevertheless, anti-spam mechanisms are becoming progressively more effective. The use of spamtraps is a technique that is becoming more popular. Spamtraps are unused, but yet valid, email addresses used as traps in order to seize unsolicited email, spam. Such addresses are placed in strategic locations over the Internet so spammers can collect and use them to send spam. The project based on this approach will be able to disseminate email addresses by various sites and then receive and route the generated messages. These messages will be used to feed an existing content based filtering system in a way that it will continuously learn about the most recent spam contents, as well as information concerning the senders. Keywords: systems administration, email, security, networks, internet, spam, spamtrap ix x ABSTRACT Conteúdo Agradecimentos v Resumo vii Abstract ix 1 Introdu¸c~ao 1 1.1 Contexto . .2 1.2 Motiva¸c~ao . .4 1.3 Objectivos . .6 1.4 Estrutura do documento . .7 2 Spam, spamtraps e factos relacionados 9 2.1 Métodos de spam . .9 2.1.1 Aquisi¸c~aode endere¸cos . 10 2.1.2 Prepara¸c~aode conteúdos. 13 2.1.3 Envio de spam . 14 2.2 Mitiga¸c~ao . 16 2.2.1 Preven¸c~aode recolha de endere¸cos. 17 2.2.2 Filtragem baseada em conteúdos . 19 2.2.3 Filtragem n~ao-baseadaem conteúdos . 20 2.3 Redes de honeypots ........................ 23 2.3.1 Conceito . 24 2.3.2 Exemplos de redes de honeypots ............. 24 2.3.3 Inova¸c~oese diferen¸cas . 26 3 Rede Automatizada de Spamtraps 29 3.1 Arquitectura do sistema . 30 3.1.1 Módulosde distribui¸c~aode spamtraps . 30 3.1.2 Módulosauxiliares . 39 3.1.3 Ficheiros de configura¸c~ao. 41 xi xii CONTEUDO´ 3.1.4 Integra¸c~ao. 42 3.1.5 Spam collector ...................... 44 3.2 Base de dados . 46 3.2.1 Esquema relacional . 46 3.3 Servi¸cos . 51 3.3.1 Servidor DNS . 51 3.3.2 Servidor Email . 51 3.3.3 Servidor IMAP . 52 3.3.4 Servidor Web . 52 3.4 Máquinavirtual . 53 3.4.1 Caracter´ısticasgerais . 53 3.4.2 Caracter´ısticasde rede . 53 3.4.3 Sistema Operativo . 53 4 Distribui¸c~aoautomáticade spamtraps 55 4.1 Prepara¸c~ao . 55 4.1.1 Cria¸c~aode conteúdos. 56 4.1.2 Levantamento de locais . 56 4.1.3 Sistema . 57 4.2 Distribui¸c~ao . 58 4.2.1 Forums .......................... 59 4.2.2 Newsgroups ........................ 60 4.2.3 Twitter .......................... 62 4.2.4 Websites .......................... 63 5 Resultados 65 5.1 Enquadramento geral . 65 5.1.1 Análisedo espa¸cotemporal . 66 5.1.2 Destinatários . 67 5.2 Spam e spamtraps distribu´ıdas. 68 5.2.1 Forums .......................... 69 5.2.2 Newsgroups ........................ 69 5.2.3 Twitter .......................... 70 5.2.4 Websites .......................... 70 5.3 Spam . 72 5.3.1 Conteúdo . 72 5.3.2 Proveniência. 74 6 Conclus~oes 77 6.1 Objectivos e resultados . 77 6.2 Aplica¸c~ao . 79 CONTEUDO´ xiii 6.2.1 Integra¸c~aocom ETMX . 80 6.2.2 Aplica¸c~oescomerciais . 80 6.3 Trabalho futuro . 81 xiv CONTEUDO´ Lista de Algoritmos 3.1 Distribui¸c~aode spamtraps em fóruns . 32 3.2 Distribui¸c~aode spamtraps em newsgroups ........... 34 3.3 Distribui¸c~aode spamtraps em contas do Twitter ........ 35 3.4 Cria¸c~aode websites com spamtraps . 37 xv xvi LISTA DE ALGORITMOS Lista de Tabelas 1.1 Compara¸c~aode custos entre métodos de marketing comuns e spam. .3 2.1 Pa´ısesde origem de práticasde harvesting ........... 10 2.2 Pa´ısescom maior incidênciade envio de spam . 11 2.3 Principais sistemas operativos de relays de spam . 15 4.1 Númerode spamtraps colocadas por local . 59 5.1 Númerode mensagens recebidas por dia da semana . 66 5.2 Mensagens de spam recebidas por local de coloca¸c~aoda spamtrap 69 5.3 Hashtags que acompanharam spamtraps mais bem sucedidas . 71 5.4 Spam recebido por gama de IPs . 74 5.5 Spam recebido por pa´ıs. 75 xvii xviii LISTA DE TABELAS Lista de Figuras 2.1 Processo t´ıpicode harvesting em páginasWeb . 12 2.2 Exemplo de cabe¸calhosSMTP Received ............. 21 3.1 Arquitectura do sistema . 31 3.2 Exemplo de coloca¸c~aode uma spamtrap num fórum phpBB .. 33 3.3 Exemplo de invoca¸c~aoda API do twitter ............ 35 3.4 Exemplo de coloca¸c~aode uma spamtrap numa conta do twitter 36 3.5 Amostra de códigoHTML gerado pelo módulo websites .... 38 3.6 Amostra de códigocom integra¸c~aodo móduloDBI . 40 3.7 Amostra de entradas no ficheiro asn.conf ............ 42 3.8 Cabe¸calhosHTTP utilizados pelo módulo WWW :: Mechanize 42 3.9 API simplificada das classes desenvolvidas . 44 3.10 Amostra de códigofonte do cliente de webservices ....... 45 3.11 Esquema relacional da base de dados . 47 3.12 Entrada t´ıpicana tabela Topics ................. 48 3.13 Amostra da configura¸c~aodo servi¸co dovecot .......... 52 4.1 Distribui¸c~aodiáriade spamtraps . 58 4.2 Distribui¸c~aodiáriade spamtraps em fóruns. 60 4.3 Distribui¸c~aodiáriade spamtraps em newsgroups ........ 61 4.4 Distribui¸c~aodiáriade spamtraps em contas do twitter ..... 62 5.1 Recep¸c~aodiáriade spam . 67 5.2 Percentagem de mensagens por categoria de spam . 74 6.1 Spamtraps colocadas e respectivo spam recebido por local . 78 xix xx LISTA DE FIGURAS Cap´ıtulo1 Introdu¸c~ao Desde o inicio da massifica¸c~aoda Internet que o envio de mensagens in- desejáveis ou n~aosolicitadas, spam, se tem vindo a revelar um problema que afecta o regular funcionamento da rede global.

Rede Automatizada De Spamtraps

Prospects, Leads, and Subscribers

Presentations Made by Senders

Asian Anti-Spam Guide 1

Taxonomy of Email Reputation Systems (Invited Paper)

Pragmaticperl-Interviews-A4.Pdf

WHITE PAPER Email Deliverability Review

84. Blog Spam Detection Using Intelligent Bayesian Approach

Pilay Sánchez Luis Humberto.Pdf.Part

Studienbriefe-Spam.Pdf

CPA's Guide to Understanding and Controlling Spam Roman H

Mitigating Spam Using Network-Level Features

White & Black Listing: Other Uses Of