Análise Dos Votos Dos Senadores Por Meio De Mineração De Dados
Total Page:16
File Type:pdf, Size:1020Kb
Universidade de Brasília Instituto de Ciências Exatas Departamento de Ciência da Computação Análise dos votos dos senadores por meio de mineração de dados Felipe Ken Hirano Iuri Batista Beserra Monografia apresentada como requisito parcial para conclusão do Curso de Computação — Licenciatura Orientador Prof. Dr. Jan Mendonça Brasília 2018 Universidade de Brasília — UnB Instituto de Ciências Exatas Departamento de Ciência da Computação Curso de Computação — Licenciatura Coordenador: Prof. Dr. Wilson Veneziano Banca examinadora composta por: Prof. Dr. Jan Mendonça (Orientador) — CIC/UnB Prof. Dr. Pedro Rezende — CIC/UnB Prof. Dr. Li Weigang — CIC/UnB CIP — Catalogação Internacional na Publicação Hirano, Felipe Ken. Análise dos votos dos senadores por meio de mineração de dados / Felipe Ken Hirano, Iuri Batista Beserra. Brasília : UnB, 2018. 395 p. : il. ; 29,5 cm. Monografia (Graduação) — Universidade de Brasília, Brasília, 2018. 1. Mineração de Dados, 2. Informação, 3. Dados, 4. Senado, 5. Votações, 6. Proposições, 7. Matérias CDU 004.4 Endereço: Universidade de Brasília Campus Universitário Darcy Ribeiro — Asa Norte CEP 70910-900 Brasília–DF — Brasil Universidade de Brasília Instituto de Ciências Exatas Departamento de Ciência da Computação Análise dos votos dos senadores por meio de mineração de dados Felipe Ken Hirano Iuri Batista Beserra Monografia apresentada como requisito parcial para conclusão do Curso de Computação — Licenciatura Prof. Dr. Jan Mendonça (Orientador) CIC/UnB Prof. Dr. Pedro Rezende Prof. Dr. Li Weigang CIC/UnB CIC/UnB Prof. Dr. Wilson Veneziano Coordenador do Curso de Computação — Licenciatura Brasília, 28 de Novembro de 2018 Dedicatória Dedico aos meus pais que me apoiaram nessa jornada universitária e que, apesar das dificuldades em que passei, eles estiveram ali sempre me incentivando. - Felipe Ken Dedico esse trabalho em memória do meu pai Gilvan Beserra e da minha irmã Letícia Batista. À minha mãe Florisnalba Batista e Maria da Conceição e aos meus irmãos, Éder, Gilmar, Liandra e Nathalia, por todo apoio e carinho ao longo dessa jornada. - Iuri Batista Beserra i Agradecimentos Agradeço primeiramente a Deus, pela vida e por tudo o que ele tem feito por mim. Agradeço aos meus pais por todo o apoio que me deram ao longo dessa jornada, por todo o incentivo que me levaram a chegar até aqui e principalmente por toda a paciência que tiveram comigo. Agradeço ao meu irmão Thiago Yuji e minha irmã Sandra Satie por todo o incentivo que me deram. Agradeço a todos os meus amigos e colegas de UnB, que sempre estiveram comigo me ajudando com os trabalhos, provas, apresentações e pesquisas, em especial ao Giovanni Torres, Mateus Denucci, Tarcísio Junior, Igor Bonomo, Breno Rios e Pedro Coutinho. Agradeço aos meus amigos de fora do curso, Victor Thuin e Gabriel Queiroz, que sempre me motivaram e não deixaram eu desistir em nenhum momento. Agradeço a Julyana Facundes, pois sem ela, provavelmente eu não teria chegado onde cheguei. Foi ela quem sempre levantou a minha cabeça e acreditou em mim mesmo nos momentos em que eu mesmo não acreditei, todo o incentivo dela foi essencial para eu chegar na almejada formatura. Agradeço ao meu colega/amigo Iuri Beserra por ter desenvolvido este trabalho junto comigo e por toda a paciência que teve. E por fim, agradeço a todos os professores do Departamento de Ciência da Computação, em especial ao meu orientador Jan Mendonça por toda orientação e suporte para o desenvolvimento deste trabalho. Todos vocês foram e são importantes para mim, meu muitíssimo obrigado. - Felipe Ken Agradeço primeiramente a Deus, pelo dom da vida e da fé. Agradeço a minha mãe biológica Florisnalba Batista e a minha segunda mãe Maria da Conceição que a vida pôde me proporcionar, que sempre estiveram ao meu lado, com paciência, com amor e muita dedicação em todos os momentos de minha vida. Agradeço aos meus irmãos, Éder Gillian, Gilmar Beserra, Liandra Beserra e Nathalia Barreto, pelo apoio e incentivo prestado na universidade. Agradeço imensamente a Andressa Ribeiro, pela força, companheirismo, ajuda, compreensão e por sempre acreditar em mim ao longo dessa caminhada. Agradeço à todos os meus amigos e colegas de trabalho, em especial ao Moisés Lemos, Rafael Tavares, Ytalo Carvalho, Matheus Souza e Maria Helena, por todo aprendizado, companheirismo e por toda ajuda durante a graduação. Agradeço ao meu ex chefe e amigo, Osvaldo Andrade por ter acreditado e por ter dado a oportunidade de conciliar os estudos com o trabalho, isto para mim foi de grande valia. Agradeço ao meu colega e amigo Felipe Ken pela paciência, pela dedicação e por ter desenvolvido este trabalho comigo. E por fim, agradeço a Universidade de Brasília e aos professores do Departamento de Ciência da Computação, em especial ao Jan Mendonça Correa, pela orientação, pelo empenho dedicado, pelo apoio e confiança. - Iuri Batista Beserra ii Resumo Nos últimos anos, a área de mineração de dados vem sendo muito utilizada em di- versos trabalhos e pesquisas com o intuito de se obter informações que agreguem algum tipo de valor dentro de um grande conjunto de dados. O senado disponibiliza, em seu sítio eletrônico, os dados a respeito das votações que ocorreram em plenário. Porém, estes dados estão em um formato de difícil extração. Dessa forma, extraímos os dados, colocamos em um formato adequado e utilizamos os processos de mineração para melhor compreendê-los, baseado nas informações que conseguimos retirar através dos algoritmos utilizados. Palavras-chave: Mineração de Dados, Informação, Dados, Senado, Votações, Proposi- ções, Matérias iii Abstract In the past few years, the data mining field has been vastly used in various jobs and researches aiming to get information that can aggregate value inside a big set of data. The Senate provides, through its website, data regarding the voting processes that happened in its plenary. However, the data comes in a hard to extract format. Thus, we collected the data, put it in an adequate format and used the data mining processes to better comprehend them, based on the information gathered through the algorithms used. Keywords: Data Mining, Information, Data, Senate, Voting, Proposition, Topics iv Sumário 1 Introdução1 1.1 Motivação....................................1 1.2 Objetivos....................................2 1.2.1 Objetivo Geral.............................2 1.2.2 Objetivos Específicos..........................2 1.3 Metodologia...................................2 1.4 Visão Geral...................................3 2 Política Brasileira5 2.1 A estrutura política e a divisão dos poderes do Estado Brasileiro: O poder no campo político-social............................5 2.2 Organização da política Brasileira.......................5 2.3 Poder Legislativo................................7 2.4 Processo eleitoral................................8 2.5 Câmara dos Deputados.............................8 2.6 Senado Federal.................................9 2.7 Proposições Legislativas............................ 11 2.8 Proposta de Emenda à Constituição Federal................. 12 2.9 Projeto de Lei Ordinária............................ 12 2.10 Modalidades de Votações............................ 13 3 Mineração de dados 15 3.1 Dado, Informação e Conhecimento....................... 15 3.2 Banco de Dados................................. 17 3.3 Sistema Gerenciador de Banco de Dados – SGBD.............. 18 3.4 MySQL..................................... 18 3.5 Data Warehouse (DW)............................. 18 3.6 BI (Business Intelligence)........................... 20 3.7 Extraction, Transformation and Loading – ETL............... 20 3.8 Descrição e conceitos de mineração de dados................. 22 3.8.1 Outras definições de mineração de dados............... 22 3.9 Processo de extração de dados......................... 23 3.10 Técnicas e tarefas de mineração........................ 26 3.10.1 Técnicas de mineração......................... 27 3.10.2 Matriz de Confusão........................... 34 3.11 Pentaho Data Integration – PDI........................ 35 v 3.12 WEKA...................................... 37 3.13 Orange...................................... 41 4 Estudo de caso: Análise dos dados em proposições no Senado entre os anos de 2015 e 2017 43 4.1 Visão Geral................................... 43 4.1.1 Escopo dos Dados............................ 44 4.1.2 Complicações ao extrair dados do WebService do Senado Federal.. 48 4.1.3 Escopo de Ferramentas......................... 49 5 Resultados 66 5.1 Análise Estatística............................... 66 5.1.1 Período Pré-Impeachment....................... 67 5.1.2 Período Pós-Impeachment....................... 70 5.1.3 Quantitativo Votos........................... 73 5.2 Análise dos votos através dos algoritmos de classificação.......... 79 5.2.1 Período Pré-Impeachment....................... 79 5.2.2 Período Pós-Impeachment....................... 86 5.3 Análise dos votos através das regras de associação.............. 92 5.4 Análise dos votos através da clusterização.................. 111 5.4.1 Período Pré-Impeachment....................... 112 5.4.2 Período Pós-Impeachment....................... 118 6 Considerações Finais 124 6.1 Conclusão.................................... 124 6.2 Trabalhos Futuros................................ 126 A Descrição das proposições realizadas no Senado Federal 127 B Querys utilizadas 150 Referências 184 vi Lista de Figuras 3.1 Etapas do processo de ETL (Extraction, Transformation and Load) Base- ado em Daniel [43]...............................