Combinatorial Optimization Problems in Cartographic Data Visualization

Universidade Estadual de Campinas Instituto de Computação INSTITUTO DE COMPUTAÇÃO Rafael Ghussn Cano Combinatorial Optimization Problems in Cartographic Data Visualization Problemas de Otimização Combinatória em Visualização de Dados Cartográficos CAMPINAS 2016 Rafael Ghussn Cano Combinatorial Optimization Problems in Cartographic Data Visualization Problemas de Otimização Combinatória em Visualização de Dados Cartográficos Tese apresentada ao Instituto de Computação da Universidade Estadual de Campinas como parte dos requisitos para a obtenção do título de Doutor em Ciência da Computação. Dissertation presented to the Institute of Computing of the University of Campinas in partial fulfillment of the requirements for the degree of Doctor in Computer Science. Supervisor/Orientador: Prof. Dr. Cid Carvalho de Souza Co-supervisor/Coorientador: Prof. Dr. Pedro Jussieu de Rezende Este exemplar corresponde à versão final da Tese defendida por Rafael Ghussn Cano e orientada pelo Prof. Dr. Cid Carvalho de Souza. CAMPINAS 2016 Agência(s) de fomento e nº(s) de processo(s): FAPESP, 2012/00673-2 Ficha catalográfica Universidade Estadual de Campinas Biblioteca do Instituto de Matemática, Estatística e Computação Científica Ana Regina Machado - CRB 8/5467 Cano, Rafael Ghussn, 1989- C165c CanCombinatorial optimization problems in cartographic data visualization / Rafael Ghussn Cano. – Campinas, SP : [s.n.], 2016. CanOrientador: Cid Carvalho de Souza. CanCoorientador: Pedro Jussieu de Rezende. CanTese (doutorado) – Universidade Estadual de Campinas, Instituto de Computação. Can1. Otimização combinatória. 2. Programação inteira. 3. Heurística computacional. 4. Visualização de informação. I. Souza, Cid Carvalho de,1963-. II. Rezende, Pedro Jussieu de,1955-. III. Universidade Estadual de Campinas. Instituto de Computação. IV. Título. Informações para Biblioteca Digital Título em outro idioma: Problemas de otimização combinatória em visualização de dados cartográficos Palavras-chave em inglês: Combinatorial optimization Integer programming Computer heuristics Information visualization Área de concentração: Ciência da Computação Titulação: Doutor em Ciência da Computação Banca examinadora: Cid Carvalho de Souza [Orientador] Yoshiko Wakabayashi Manoel Bezerra Campêlo Neto Carlile Campos Lavor Flávio Keidi Miyazawa Data de defesa: 12-12-2016 Programa de Pós-Graduação: Ciência da Computação Powered by TCPDF (www.tcpdf.org) Universidade Estadual de Campinas Instituto de Computação INSTITUTO DE COMPUTAÇÃO Rafael Ghussn Cano Combinatorial Optimization Problems in Cartographic Data Visualization Problemas de Otimização Combinatória em Visualização de Dados Cartográficos Banca Examinadora: Prof. Dr. Cid Carvalho de Souza • Instituto de Computação – UNICAMP Profa. Dra. Yoshiko Wakabayashi • Instituto de Matemática e Estatística – USP Prof. Dr. Manoel Bezerra Campêlo Neto • Departamento de Estatística e Matemática Aplicada – UFC Prof. Dr. Carlile Campos Lavor • Instituto de Matemática, Estatística e Computação Científica – UNICAMP Prof. Dr. Flávio Keidi Miyazawa • Instituto de Computação – UNICAMP A ata da defesa com as respectivas assinaturas dos membros da banca encontra-se no processo de vida acadêmica do aluno. Campinas, 12 de dezembro de 2016 Acknowledgements I first want to thank my advisors, Cid de Souza and Pedro de Rezende. I am truly grateful to them for taking a chance on me when I was still an undergraduate student. I thank them for all their dedication, patience, commitment and friendship, which were decisive to the success of my doctorate. Many people were important, especially during the beginning of my studies as a grad- uate student. Special thanks go to Guilherme Kunigami, who was already a master’s student when I was still taking basic algorithms courses. I enjoyed working with him and learned a lot by observing his work (I actually learned C++ by reading his code!). I thank Tallys Yunes for his contributions to our projects. His comments and insights have certainly enriched our papers. I also thank Alex Grilo for developing the visualization tool that contributed to many of our theoretical results. I thank Bettina Speckmann and Kevin Buchin for welcoming me during my research internship at the Eindhoven University of Technology (TU/e). I really enjoyed my time there and learned a lot from the experience. Special thanks go to Sander Verdonschot, who promptly helped me whenever I needed something related to rectangular cartograms. I also thank Thom Castermans, Willem Sonke and Astrid Pieterse for the collaboration in the mosaic cartograms project. Their talent and dedication were crucial to the outcome of our papers. I also need to mention my colleagues, both from Campinas and from Eindhoven. I had many good moments with them, talking, laughing and traveling to conferences (and, eventually, even working). I especially thank my childhood friends, Yuri Isayama and Leonardo Oliveira. It is always great to meet and talk to you. Surely, that helped me to relax and to take my mind off research for a while. I am also deeply grateful to my family and I thank them (in Portuguese) for all they have done for me. Obrigado a meus pais, Jonizeli e Arlete, pelo amor, instrução e apoio em todos os aspectos da vida. A minha irmã, Ana Paula, por ser uma melhor amiga dentro de casa, e a minha tia Angel pelos ensinamentos e pelo incentivo. Vocês sempre serão modelos para mim. Agradeço também a minhas avós, Ana e Afife, e a meus tios. Para concluir, registro, ainda, uma nota de agradecimento ao papagaio Lorê, que consciente de minhas obrigações, sempre fez questão de me acordar cedo para o trabalho (inclusive aos finais de semana). Finally, I thank God for all the opportunities that I had in the past few years. None of this would be possible, if not for him. Resumo Conjuntos de dados podem ser representados de muitas maneiras. Tabelas são, prova- velmente, a forma mais simples de apresentação e mostram-se úteis quando se deseja consultar valores associados a objetos específicos. No entanto, se o objetivo é identi- ficar relações entre diferentes objetos, outras formas de representação podem ser mais adequadas. Para este fim, uma visualização em forma esquemática através de imagens e diagramas pode, frequentemente, revelar novos aspectos dos dados. Isto ocorre espe- cialmente em se tratando de dados cartográficos, isto é, dados associados a regiões ou localizações geográficas. Nestes casos, visualizações apropriadas podem evidenciar rela- ções e padrões espaciais anteriormente desconhecidos, possibilitando uma análise mais aprofundada dos fenômenos observados. A construção manual de mapas necessita de cartógrafos experientes e consome muito tempo. Portanto, é interessante o desenvolvimento de algoritmos que permitam a automa- ção desta tarefa. Cada tipo de visualização apresenta restrições e métricas de qualidade específicas. Originam-se, então, diversos problemas de otimização combinatória, os quais são, com frequência, computacionalmente difíceis. Esta tese propõe-se a estudar alguns destes problemas. Foram considerados quatro tipos de visualização para dados cartográ- ficos: mapas de símbolos proporcionais, mapas rotacionáveis, cartogramas em mosaicos e cartogramas retangulares. Mapas de símbolos proporcionais representam dados através de símbolos opacos, que podem se sobrepor. O problema abordado consiste em determinar a ordem na qual os símbolos devem ser desenhados de forma a maximizar sua visibilidade de acordo com métricas estabelecidas na literatura. Nossas contribuições incluem um novo modelo de programação linear inteira e uma análise poliédrica do mesmo, um algoritmo de branch- and-cut com rotinas eficientes de separação de desigualdades e procedimentos de lifting. Mapas rotacionáveis são mapas que permitem ao usuário executar rotações. Nosso estudo teve como objetivo encontrar soluções ótimas para um problema de rotulação. Como em problemas tradicionais, deseja-se colocar rótulos textuais no mapa sem que ocorram sobreposições. Porém, conforme o mapa é rotacionado, todos os rótulos devem permanecer alinhados na direção horizontal, o que pode causar o surgimento de novos conflitos. Em nosso trabalho, provamos várias propriedades de soluções ótimas e mostra- mos como reduzir em centenas de vezes o número de variáveis e restrições de um modelo de programação linear inteira da literatura. Finalmente, cartogramas são mapas usados para representar dados estatísticos sobre regiões (e.g., estados ou países). Cada região tem seu tamanho alterado de forma que sua área seja proporcional ao dado que se deseja retratar. Nós propomos o primeiro algoritmo para construção de cartogramas em mosaicos. Além disso, expandimos um método existente de construção de cartogramas retangulares com uma heurística que cria as chamadas regiões de mar. Abstract Data can be represented in various ways. Tables are likely to be the simplest form of presenting it. Still, they are useful when it is necessary to retrieve data values associated with specific objects. However, if one is interested in identifying relations between different objects, other forms of representation might be more suitable. To that end, a schematic visualization in images and diagrams can often reveal new aspects of the data. This is true especially for cartographic data, i.e., data that is associated with locations or regions of a map. In these cases, appropriate visualizations can exhibit spatial patterns and relations that were previously unknown, enabling a deeper analysis of the observed phenomena. Manually constructing

Combinatorial Optimization Problems in Cartographic Data Visualization

Computer Graphics and Visualization

Math 253: Mathematical Methods for Data Visualization – Course Introduction and Overview (Spring 2020)

Volume Rendering

Graph Visualization and Navigation in Information Visualization 1

From Surface Rendering to Volume

Scalable Exact Visualization of Isocontours in Road Networks Via Minimum-Link Paths∗

Graphics and Visualization (GV)

Tasks, Techniques, and Tools for Genomic Data Visualization

Fast Visualisation and Interactive Design of Deterministic Fractals

User's Guide for Oracle Data Visualization

Using Visualization to Understand the Behavior of Computer Systems

Taxonomies of Visual Programming and Program Visualization