Analysing Point Motion – Spatio-Temporal Data Mining of Geospatial Lifelines
Total Page:16
File Type:pdf, Size:1020Kb
Analysing Point Motion – Spatio-Temporal Data Mining of Geospatial Lifelines Dissertation zur Erlangung der naturwissenschaftlichen Doktorwurde¨ (Dr. sc. nat.) vorgelegt der Mathematisch-naturwissenschaftlichen Fakultat¨ der Universitat¨ Zurich¨ von Patrick Laube von Bobikon¨ AG Promotionskomitee Prof. Dr. Robert Weibel (Vorsitz) Prof. Dr. Peter F. Fisher Dr. Britta Allgower¨ Dr. Stephan Imfeld (Leitung der Dissertation) Zurich¨ 2005 Summary Mobility is key to contemporary life. In a globalised world people, Motivation goods, data, and ideas move in increasing volumes at increasing speeds over increasing distances and commonly leave digital traces in space-time. Exploring the spatio-temporal process motion is an emerging research area in Geographical Information Science. The rationale of this research is that Geographical Information Thesis rationale Science can centrally contribute to discovering knowledge about the space-time use of individuals and groups in large volumes of tracking data. Whereas is the representation and visualisation of motion quite widespread in GIScience, approaches to actually quantitatively analyse motion are sparse. Hence, this thesis in- tends to contribute to the conceptual and methodological know- ledge of GIScience how to analyse the tracks of moving point ob- jects, being the most basic and commonly used conceptualisation to represent motion in geography. The thesis addresses therefore the following research questions: Research questions Can we identify and formalise a set of generic motion events, so- called motion patterns, that can be found in the tracks of moving point objects? How can we automatically detect such predefined motion patterns? And, finally, how can we evaluate relevance and the meaningfulness of motion patterns? The chosen methodological approach is geographic knowledge Methods discovery, an interactive and iterative process integrating a col- lection of methods from geography, computer science, statistics, and scientific visualisation. Its goal is the extraction of high-level information from low-level data in the context of large geographic datasets. The main contribution of this thesis consists in the conceptu- Constributions alisation, implementation, and evaluation of a geographic know- ledge discovery (GKD) approach. In detail, the thesis proposed as a precondition a family of relative motion (REMO) patterns, with the term relative motion denoting the interrelation of motion attributes of different moving point objects over space and over time. In this thesis motion patterns are referred to as predefined formalised search templates of motion attributes such as speed, change of speed, motion azimuth, or sinuosity. Furthermore, the i Summary thesis developed a knowledge discovery process that allows con- ceptualisation, formal description and detection of motion pat- terns in the tracks of moving point objects. This required the development of a pattern description formalism as well as novel data structures and adapted pattern detection algorithms. Significance and implications for With its methodological approach the thesis contributes to the GIScience discussion about spatio-temporal geographical information science. The thesis points out that the integration of knowledge discovery methods within geographical information science provides a pow- erful means to investigate spatio-temporal phenomena, such as motion. The use of motion patterns that are intrinsically spatio- temporal, do not therefore exist in either space or time alone and, promote the need to adopt in GIScience a dynamic percep- tion of the world. The thesis proposed a separated perception of static aggregation of objects in space and the dynamic spatio- temporal processes leading to that aggregation, for example the strict separation of the process convergence and the final static cluster as its optional outcome. The successful application of intrinsically dynamic patterns such as converging and diverging underpins that overcoming the legacy of the static geographical information systems requires not only data models and structures for dynamic data but also dynamic analysis concepts. Despite recent advances in tracking technology, the availability of motion data of large numbers of concurrently tracked individuals remains limited. With its final evaluation part, the thesis showed the po- tential of generating synthetic motion data to perform numerical experiments. Outlook The concepts and methods proposed in this thesis can be ex- tended in various ways, especially when relaxing its rather strong basic conditions and adopting an increasingly realistic perception of real life motion processes by allowing, for instance, imperfect trajectories, fuzzy motion patterns, object-environment interac- tions, or by including object’s semantics. ii Zusammenfassung Mobilit¨atist ein wesentlicher Bestandteil des modernen Lebens. Motivation In einer globalisierten Welt bewegen sich immer mehr Menschen, G¨uter, Informationen und Ideen immer schneller durch Raum und Zeit. Die Flut mobiler Ger¨atemit Lokalisierungstechnik (GPS) produziert in zunehmendem Masse Information ¨uber die zur¨uck- gelegten Spuren ihrer Tr¨ager. Seien es nun Mobiltelefonierer in der Grosstadt, Hirsche im Schweizerischen Nationalpark oder mit Navigationssystemen ausger¨ustete Fahrzeuge auf dem Strassen- netz, sie alle hinterlassen ihre digitalen Spuren in Raumzeit. Folgerichtig entwickelt sich die Untersuchung raum-zeitlicher Problemstellung Prozesse zunehmend zu einem dr¨angenden Forschungsschwerpunkt der Geographischen Informationswissenschaft. Diese Dissertation sch¨opft ihre Hauptmotivation aus der Uberzeugung,¨ dass die Geo- graphische Informationswissenschaft wesentlich zu einem besser- en Verst¨andnis der Raumzeit-Nutzung sich bewegender Objekte beitragen kann. W¨ahrendsich die Disziplin ausgiebig mit der Re- pr¨asentation und Visualisierung von Bewegung auseinander ge- setzt hat, fehlen Methoden zur quantitativen Analyse von Bewe- gung bisher weitgehend. Die vorliegende Arbeit m¨ochte genau diese L¨ucke schliessen und untersucht daher die Bewegung von Punktobjekten, der einfachsten Repr¨asentation von Objekten im Raum. Die Arbeit untersucht die folgenden Forschungsfragen: Gibt es Forschungsfragen universelle Bewegungsmuster, die sich unabh¨angig der Art des un- tersuchten Bewegungsprozesses in den Spuren von Punktobjekten niederschlagen? Wie ¨aussern sich derartige Bewegungsmuster in den Attributen eines Bewegungspfades, d.h. in Geschwindigkeit, Beschleunigung und Bewegungsrichtung? Wie lassen sich Bewe- gungsmuster formell beschreiben? Wie k¨onnen Bewegungsmuster in grossen Datenmengen algorithmisch aufgesp¨urt werden? Und, wie kann die Relevanz und Aussagekraft derartiger Bewegungs- muster abgesch¨atzt und quantifiziert werden? Die Dissertation pr¨asentiert einen Ansatz der Geographischen Methodik Wissensgenerierung (engl. geographic knowledge discovery, GKD). Diese Methodik versteht sich als spezifisch geographischer Zweig der Wissensgenerierung aus Datenbanken (engl. knowledge dis- covery in databases, KDD), eines interdisziplin¨arenMethodenkat- iii Zusammenfassung alogs, entstanden aus der Verschmelzung von Geographie, Infor- matik, Statistik und wissenschaftlicher Visualisierung. Das Ziel von GKD und KDD ist die Extraktion h¨oherwertigen Wissens aus grossen Mengen von Rohdaten, in diesem Falle geographischen Rohdaten. Beitrage¨ zur Geographischen Der Hauptbeitrag dieser Disseration besteht in der Entwick- Informationswissenschaft lung, Implementation und Evaluation des relative motion (REMO) Ansatzes zur Untersuchung der Bewegung von Punktobjekten. Das namengebende Element des REMO Ansatzes ist eine Gruppe von Bewegungsmuster, die sich als Relationen der Bewegungsat- tribute verschiedener Punktobjekte ergeben. Ein Formalismus zur formalen Beschreibung dieser Bewegungsmuster bildet ein weit- eres zentrales Element des Ansatzes. Eine Reihe aufeinander abgestimmter, spezieller Datenstrukturen und einfacher Muster- erkennungs-Algorithmen erm¨oglichen schliesslich das automatis- che Auffinden derartiger Bewegungsmuster durch Computer. Der gesamte Analyseprozess wurde in einer eigenst¨andigen Java-Proto- typapplikation implementiert. Die erfolgreiche Anwendung der vorgestellten Methoden auf diverse Anwendungsbeispiele unter- streicht das grosse Potenzial welches in der Integration von Geo- graphischer Informationswissenschaft und KDD steckt. Bewegungsmuster, die ausschliesslich in Raumzeit existieren k¨on- nen, unterstreichen die Notwendigkeit einer dynamischen Wahr- nehmung der Welt in der Geographischen Informationswissenschaft. Folgerichtig propagiert die Arbeit eine strikte Trennung des dyn- amischen, zwingend raum-zeitlichen Prozesses der Verdichtung (engl. convergence) und ihres m¨oglichen Resultats der statischen Anh¨aufung (engl. cluster). Die Uberwindung¨ des kartographi- schen Verm¨achtnisses der statischen Schnappschuss-Weltsicht ge- lingt nur, wenn raum-zeitliche Datenmodelle und -strukturen und spezifisch raum-zeitliche Analysemethoden einander zuarbeiten. Der abschliessenden Evaluationsteil illustriert das Potenzial der Generierung synthetischer Bewegungsdaten f¨urdie Evaluation ein- es Wissensgenerierungs-Prozesses wie etwa des REMO Ansatzes. Die Kombination von Monte Carlo Simulationen synthetischer Pfade (constrained random walks) und die gezielten Variation des Mustersuche-Prozesses, erlaubt die Absch¨atzung der Relevanz bes- timmter Bewegungsmuster. Ausblick M¨ogliche Weiterentwicklungen der vorgestellten Konzepte und Methoden