Cartographic Pattern Recognition Based on Semantic Modelling of Geographic Phenomena
Total Page:16
File Type:pdf, Size:1020Kb
Characterising urban space from topographic databases: Cartographic pattern recognition based on semantic modelling of geographic phenomena Dissertation zur Erlangung der naturwissenschaftlichen Doktorwürde (Dr. sc. nat.) vorgelegt der Mathematisch-naturwissenschaftlichen Fakultät der Universität Zürich von Patrick Lüscher von Muhen AG Promotionskomitee Prof. Dr. Robert Weibel (Vorsitz) Prof. Dr. Dirk Burghardt Prof. Dr. Werner Kuhn Zürich, 2011 Summary National Map Agencies and other data producers capture large volumes of topographic data at high detail. As these topographic databases were designed for a broad range of applications, they model geographic reality in terms of single objects such as houses, streets, and lawns. However, many applications require specific higher order geographic phenomena that are not available in these general purpose databases, such as the extent of a city centre. Hence methods are needed to abstract these higher order geographic phenomena from the detailed representations of topographic databases. The ambition of this research is to automate abstractions from the detailed concepts offered by topographic datasets to produce higher order geographic phenomena by means of cartographic pattern recognition. Up to now, cartographic pattern recognition was mainly employed for optimising visual appearance. It can be argued, however, that it is primarily a task of modelling geographical content. The rationale of this research is to develop and evaluate an approach to cartographic pattern recognition that explicitly models semantic assumptions behind higher order geographic phenomena. With respect to this overall rationale, the research pursues the following three objectives: 1) Methods for knowledge acquisition to inform cartographic pattern recognition shall be explored; 2) instruments to model knowledge and compile the data enrichment process from semantically rich descriptions shall be developed; and 3) the role of uncertainty in the proposed approach shall be investigated. The objectives are pursued by means of two case studies: The first case study builds a typology of urban residential house types, formalises English terraced houses in a conceptual model and develops a method to transform the conceptual model directly into a pattern recognition process. The second case study focuses on city centres as an instance of a concept with vague definition and extent. Each case study performs the complete process from knowledge acquisition to evaluation of derived referents for higher level phenomena. i ii Summary The main contribution of the research is a methodology to capture semantics of geographical phenomena in conceptual models and use it to execute cartographic pattern recognition. The second contribution is a method to integrate ontological modelling with Bayesian inference to carry out pattern recognition. The method combines structural knowledge with machine learning to overcome difficulties with the vague nature of terms that describe geographic phenomena. A third contribution is the application of participant experiments to acquire knowledge for cartographic pattern recognition. Two main directions are seen to extend the research presented in this thesis towards an operational system. Firstly, workflow management systems could be integrated to allow efficient, yet flexible execution of complete pattern recognition workflows. Secondly, a comprehensive and operational system for cartographic pattern recognition would require appropriate human user interaction schemes and storage of relations. Zusammenfassung Topographische Datenbanken sind heutzutage in grosser Detailtreue verfügbar. Da diese Datenbanken jedoch für ein breites Spektrum von Anwendungen entworfen wurden, modellieren sie die geographische Realität sehr allgemein in Form von Einzelobjekten wie Häusern, Strassen und Grünflächen. Viele Aufgaben benötigen aber spezifische geographische Objekte mit komplexer Semantik, wie etwa die Ausdehnung des Stadtzentrums. Daher werden Methoden benötigt, um von den detailgetreuen Darstellungen der topographischen Datenbanken komplexe geographische Phänomene zu abstrahieren. Das Bestreben dieser Arbeit ist es, solche Abstraktionen mittels Methoden der kartographischen Mustererkennung zu automatisieren. Bisher wurde kartographische Mustererkennung hauptsächlich eingesetzt, um die Darstellungsqualität während des Kartengeneralisierungsprozesses zu gewährleisten. Geometrische Operationen standen im Vordergrund, während die Semantik von geographischen Objekten wenig Beachtung fand. Die vorliegende Arbeit entwickelt und beurteilt eine Methode für kartographische Mustererkennung, die explizit die semantischen Annahmen berücksichtigt, die geographischen Phänomenen zugrunde liegen. In Bezug auf dieses übergeordnete Thema werden drei Zielsetzungen verfolgt: 1) Methoden, um Wissen für kartographische Mustererkennung zu erlangen werden untersucht; 2) Werkzeuge, um Wissen zu modellieren und den Mustererkennungsprozess von diesen Modellen abzuleiten, sollen entwickelt werden; und 3) die in geographischen Phänomenen inhärenten Unsicherheiten sollen berücksichtigt werden. Diese Zielsetzungen werden in zwei Fallstudien untersucht: Die erste Fallstudie erstellt eine Typologie von englischen städtischen Wohnhäusern, formalisiert den Wohnhaustyp English terraced house in einem konzeptuellen Modell und entwickelt eine Methode, um das konzeptuelle Modell direkt in einen Mustererkennungsprozess zu übertragen. Die zweite Fallstudie widmet sich dem iii iv Zusammenfassung Stadtzentrum als Beispiel eines geographischen Konzepts mit vager Definition und Ausdehnung. Beide Fallstudien führen den gesamten Prozess von der Wissensaneignung bis zur Evaluation der durch die Mustererkennung abgeleiteten Objekte durch. Der massgebliche Beitrag dieser Arbeit ist eine Methodik, um die Semantik geographischer Phänomene in konzeptuellen Modellen zu erfassen und dieses Wissen für die kartographische Mustererkennung zu nutzen. Der zweite wesentliche Beitrag ist ein Ansatz für die kartographische Mustererkennung, der ontologische Modellierung mit Bayes-Inferenz koppelt. Der Ansatz kombiniert strukturelles Wissen mit maschinellem Lernen, um vagen Begriffe zu handhaben, wie sie typischerweise in Beschreibungen von geographischen Phänomenen vorkommen. Ein dritter Beitrag ist die Anwendung von Nutzerbefragungen, um Wissen für die kartographische Mustererkennung zu generieren. Schliesslich werden Wege vorgeschlagen, um die in dieser Arbeit dargelegte Forschung in Richtung eines operationellen Betriebs zu erweitern. Erstens sollen Systeme für workflow management integriert werden, um komplette Mustererkennungsabläufe transparent und flexibel modellieren und ausführen zu können. Zweitens müssen für die Realisierung eines operationellen Systems geeignete Ansätze für Benutzerinteraktionen und für die Speicherung der erzeugten höherwertigen Objekte gefunden werden. Acknowledgments This is the time and place to express my sincere gratitude to all who, in one way or another, have helped me produce this thesis. First and foremost I thank my supervisors Robert Weibel and Dirk Burghardt, who gave me—after having supervised my Diploma thesis already—the opportunity to carry out this research in the GIS unit. I am deeply indebted to Rob and Dirk for their support and patience during the time of my PhD, for proof-reading papers and this thesis, and for their valuable comments. Nicolas Regnauld of Ordnance Survey Research made it possible that the Ordnance Survey of Great Britain funded part of my research and provided me with data. I am deeply indebted for his support. Many thanks to the generalisation team in Ordnance Survey Research for taking time for discussions. William Mackaness was willing to collaborate with me during a three-week visit at the University of Edinburgh in November 2007. William impressed me with his imaginativeness and his enthusiasm for research and helped sharpen my ideas. In the bespoke visit in Edinburgh, I also have become acquainted with Omair Chaudhry, who was then William’s PhD student. Coincidentally, he was later research associate at Ordnance Survey at the time of my collaboration. I would like to thank William and Omair for our conversations. Numerous people at the Department of Geography have made my time as PhD student an inspiring and enjoyable one. I am indebted to Ross Purves and Sara Fabrikant for running the promotion seminar and teaching me how to do research. Despite his many commitments, Ross always took the time and helped me with critical feedback about my work. I am thankful to my fellows for interesting conversations about scientific and non-scientific issues, fun times, consoling words, and just for being friends: Pia Bereuter, Somayeh Dodge, v vi Acknowledgments Alistair Edwardes, Anna-Katharina Lautenschütz, Moritz Neun, Ronald Schmidt, Stefan Steiniger, Ralph Straumann, Martin Tomko and Ramya Venkateswaran. I would like to thank Elisabeth Cottier, who ran the GIS unit’s secretariat for many years, and Annica Mandola, who then replaced Elisabeth, for their support in all matters of administration and for their interest in us PhD students. I am most grateful to my parents for supporting my studies and motivating me to take the next step. And finally, I would like to thank Sonja for always being there, for her patience and understanding during the time of my dissertation. This research was supported by the Swiss State Secretariat for Education and Research (SER) through COST Action C21 (project ORUS,