Paulo Sergio Rangel Garcia.Pdf
Total Page:16
File Type:pdf, Size:1020Kb
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP Paulo Sérgio Rangel Garcia Estudo sobre aplicação de web semântica e visualização em dados abertos. Proposta de portal para transparência em séries históricas de indicadores sociais, econômicos e financeiros, públicos na web MESTRADO EM TECNOLOGIAS DA INTELIGÊNCIA E DESIGN DIGITAL SÃO PAULO 2011 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP Paulo Sérgio Rangel Garcia Estudo sobre aplicação de web semântica e visualização em dados abertos Proposta de portal para transparência em séries históricas de indicadores sociais, econômicos e financeiros, públicos na web MESTRADO EM TECNOLOGIAS DA INTELIGÊNCIA E DESIGN DIGITAL Dissertação apresentada à Banca Examinadora da Pontifícia Universidade Católica de São Paulo – PUC- SP, como exigência parcial para obtenção do título de MESTRE em Tecnologias da Inteligência e Design Digital - Processos Cognitivos e Ambientes Digitais, sob a orientação do Professor Doutor Demi Getschko. SÃO PAULO 2011 Banca Examinadora: ------------------------------------------------------------------- ------------------------------------------------------------------- ------------------------------------------------------------------- Esta dissertação é dedicada a minha esposa, Vilma, por seu incentivo e apoio aos meus projetos e acima de tudo pelo que ela representa em minha vida. AGRADECIMENTOS Em primeiro lugar, aos meus pais, Floreal Garcia e Ana Teodora Rangel Garcia, por tudo o que fazem e fizeram na constituição de nossa família, por seus valores pessoais e pelas experiências de vida que compartilham com todos, apoiando a busca do conhecimento. A todos os professores que ao longo de nossas vidas nos beneficiam, compartilhando conhecimentos e experiências que nos permitem chegar cada vez mais longe, representados especialmente pelos professores, Sérgio Basbaum, Alexandre Campos, Ítalo Santiago Vega, Jorge de Albuquerque Vieira, Nélson Brissac e o meu orientador nesta Dissertação, Professor Demi Getschko. E também a todos os nossos amigos e colegas que de forma direta ou não nos apoiaram e incentivaram na superação dos desafios para a realização de trabalhos como este, especialmente representados por Edna Conti, sempre zelosa e prestativa com todos os alunos do TIDD. Por vezes sentimos que aquilo que fazemos não é senão uma gota de água no mar. Mas o mar seria menor se lhe faltasse uma gota. Madre Teresa de Calcutá, Agnes Gonxha Bojaxhiu RESUMO GARCIA, Paulo Sérgio Rangel. Estudo sobre aplicação de web semântica e visualização de dados abertos. 2011. 155f. Dissertação (Mestrado) – Pontifícia Universidade Católica de São Paulo – PUC-SP, São Paulo, 2011. Este trabalho tem como objetivo discutir um modelo para a construção de portal que dê transparência a séries históricas de indicadores sociais, econômicos e financeiros, públicos e disponíveis na web. Para se chegar a esse objetivo, foram realizados estudos em autores como Manuel Castells, Tim Berners-Lee, Vinton Cerf, Karin K. Breitman, Martha Gabriel e Fernanda Viegas entre outros, sobre web semântica, ontologias, otimização em mecanismos de buscas e visualização de dados. A partir do estudo da evolução histórica da Internet, buscou-se compreender como foi possível formar esse contexto de dinamismo não ordenado, com alta produção, criando condições para a alta disponibilidade de dados e informações que existem hoje. Abordando conceitos e tecnologias relacionadas à web semântica, ontologias, web services, agentes de software, visualização de dados e otimização dos mecanismos de buscas, discutiu-se técnicas e metodologias que viabilizem a sua construção de maneira a permitir que tais dados sejam coletados e que estejam disponíveis em formatos compreensíveis para seres humanos e integráveis a outros sistemas computacionais. Foi também analisado o e-Gov atual, especialmente no Brasil, avaliando suas características, tendências e oportunidades de evolução utilizando dados e estudos disponibilizados pelo NIC.BR e W3C BR. Assim, com base nesses estudos e na experiência do autor, esta dissertação tem o objetivo de propor um modelo de portal que permita a interatividade humana e integração com outros sistemas computacionais, das séries históricas públicas coletadas, formatando e disponibilizando-as de maneira estruturada para a sociedade. ` Por fim, é feita a indicação de pesquisas futuras, as quais venham contribuir para a discussão e o desenvolvimento de sites e serviços que apropriem dados abertos públicos. Palavras-chave: web semântica, Ontologias, Metadados, Visualização de dados, Dados abertos. ABSTRACT GARCIA, Paulo Sérgio Rangel Garcia. Study on application of semantic web and viewing in open data. São Paulo, 2011. 2011. 155f. Dissertation (Masters) – Pontifícia Universidade Católica de São Paulo – PUC-SP, São Paulo, 2011. This paper aims to discuss a model for constructing a transparent portal that contains historical trends of public social, economical and financial indicators, preferably if collected at e-Gov websites. In order to reach that objective, we researched extensively within Manuel Castells, Tim Berners-Lee, Vinton Cerf, Karin K. Breitman, Martha Gabriel and Fernanda Viegas’s work, amongst others, about semantic web, ontologies, search engine optimization and data visualization. Starting from a study of the historical evolution of internet, we try to understand how was possible to forge this context of highly productive disorganized dynamics that provided the conditions of the massive availability of information and data that we see today. By utilizing concepts and technologies such as metadata, ontologies, web services, software agents, data visualization and optimization of research mechanisms, we discuss techniques and methodologies that could make collecting data as fast as possible feasible, as well as putting it together in a way that either humans or other computer systems may easily understand. We also analyze the current e-Gov services provided by the Brazilian government by evaluating its characteristics, tendencies and possibilities for evolution and growth by utilizing data and research provided by NIC.BR and W3C BR. Thus, based on research and the author’s own experience, this dissertation will try to propose a model for a portal that allows human interaction and integration with other computer systems for historical trends collected via web and formats and provides this data to society in a structured way. Finally, we indicate future researches that may contribute to the discussion and development of websites and services that apropriate public open data. Keywords: Semantic web, Ontologies, Metadata, Data visualization, Open data. Lista de Figuras Figura 1 - Linha do Tempo da Internet .......................................................................................... 36 Figura 2 - Estrutura do ICANN ...................................................................................................... 37 Figura 3 - Estrutura organizacional do NIC.br e CGI.br .................................................................. 41 Figura 4 - Framework de Warwick ................................................................................................ 58 Figura 5 - Classificação de ontologias. .......................................................................................... 66 Figura 6 - Estrutura interrelacionada de tecnologias da web semântica ....................................... 68 Figura 7 - Camadas da Linguagem OIL .......................................................................................... 71 Figura 8 - Fluxo de trabalho de agente de software ...................................................................... 82 Figura 9 - Modelo de Chi para o fluxo de criação de visualizações .............................................. 101 Figura 10 - Exemplo de visualização de dados no Google Public Data Explorer ........................... 104 Figura 11 - Exemplo de visualização de dados da Bovespa em 2009 ........................................... 105 Figura 12 - Visualização da distribuição de usuários do Facebook no mundo .............................. 106 Figura 13 - Número máximo de serviços e-Gov utilizados ........................................................... 120 Figura 14 - Fatores limitadores ao uso de serviços de e-Gov ....................................................... 123 Figura 15 - Barreiras ao uso de serviços de e-Gov ....................................................................... 125 Figura 16 - Desenho esquemático da proposta do Portal de séries históricas ............................. 136 Figura 17 - Representação gráfica do ciclo de vida da ontologia. ................................................. 142 LISTA DE TABELAS Tabela 1 - Tipos e funções de metadados por Anne Gilliland-Swetland ......................................... 53 Tabela 2 - Classificação de Ontologias segundo seu espectro semântico ...................................... 65 Tabela 3 - Classificação de ontologias quanto à generalidade ....................................................... 65 Tabela 4- Classificação de ontologias quanto ao tipo de informação que representam. ................ 66 Tabela 5- Classes / primitivas do RDF-schema .............................................................................. 69 Tabela 6 - Comparação entre as Linguagens OIL e DAML .............................................................. 73 Tabela 7 - Metodologias, métodos e norma frente às categorias de análise predefinidas ............