Visualizing Web Sessions: Improving Web Browser History by a Better
Total Page:16
File Type:pdf, Size:1020Kb
ii Visualizing Web Sessions: Improving Web Browser History by a Better Understanding of Web Page Revisitation and a New Session- and Task-Based, Visual Web History Approach Matthias Mayer 2007 University of Hamburg ii Universität Hamburg Department Informatik University of Hamburg Department of Informatics Dissertation zur Erlangung des Grades des Doktors der Naturwissenschaften, eingereicht am Department Informatik der Universität Hamburg. Dissertation in the Department of Informatics submitted to the faculty in partial fulfillment of the requirements for the degree of »Doctor rerum naturalium« at the University of Hamburg. Gutachter | Reviewers: Prof. Dr. Benjamin B. Bederson, University of Maryland, USA Prof. Dr. Horst Oberquelle, Universität Hamburg, Deutschland Prof. Dr. Christopher Habel, Universität Hamburg, Deutschland Tag der Disputation | day of disputation: 12. Dezember 2007 iii Widmung | Dedication Meiner Mutter Esther, meinem Vater Karl, meiner Schwester Gabriele. In großer Dankbarkeit. I am grateful to my mother, Esther, my father, Karl, my sister, Gabriele. iv Zusammenfassung Bei der Benutzung des World Wide Web spielen verschiedene Arten des Wiederbe- suchs von Webseiten (Revisit) eine wesentliche Rolle. Kurzzeit-Revisits entstehen häufig beim Explorieren von Websites und von Suchergebnis-Listen. Mittelfristig entstehen Revisits vorwiegend durch die Wiederbenutzung bevorzugter Werkzeuge und durch das Beobachten von Seiten, deren Inhalt sich häufig ändert. Langzeit- Revisits entstehen vor allem durch das erneute Lesen spezifischen Inhalts nach eini- ger Zeit. Die heute verfügbaren History-Werkzeuge wie der Zurück-Knopf (Back Button), Lesezeichen (Bookmarks), Verlauf (History List) und die automatische Vervollständigung einer Adresse (Auto-Complete) bilden ein heterogenes Umfeld unterschiedlichster Ansätze, die alle ihre eigenen Methoden des Zugriffs auf die persönliche Web-History bieten und mit den verschiedensten Benutzungsschnitt- stellen ausgestattet sind. Jedes dieser Werkzeuge besitzt charakteristische, teilweise erhebliche Schwächen. Bestehende Vorschläge zur verbesserten History-Unter- stützung schaffen teilweise Abhilfe, bringen aber jeweils neue Probleme mit sich. Dies führt zu der gegenwärtigen Situation, in der eine angemessene, integrative History-Unterstützung noch immer fehlt. Die vorliegende Arbeit analysiert den Status Quo des Web bezüglich Naviga- tion und Wiederbesuch. Sie vergleicht Vor- und Nachteile gegenwärtiger und vorge- schlagener History-Werkzeuge. Auf Grundlage dieser Erkenntnisse wird ein neuer Ansatz für ein integrierendes Web-History Werkzeug vorgestellt – der Session- Graphs Ansatz. Dabei wird der Pfad des Benutzers als animierter, interaktiver Graph visualisiert, wodurch eine Verarbeitung vorwiegend auf perzeptueller anstatt auf kognitiver Ebene ermöglicht wird. Das Layout der Graphen wird automatisch be- rechnet, um möglichst charakteristische visuelle Formen zu schaffen, die eine Wie- dererkennbarkeit auf Sitzungsebene aber auch auf Ebene einzelner Knoten gewähr- leisten. Die gesamte History eines Benutzers wird entsprechend einzelner Sitzungen unterteilt, so dass der Umfang einer Visualisierung begrenzt bleibt. Der Benutzer kann das Layout der Graphen manuell nach seiner Vorstellung ändern. Die einzel- nen Sitzungs-Visualisierungen können nach übergeordneten Aufgaben organisiert und archiviert werden. Dadurch berücksichtigt das vorgestellte Verfahren im Gegen- satz zu anderen existierenden und vorgeschlagenen Ansätzen auf konzeptueller E- bene bereits die Skalierbarkeit hinsichtlich wachsender Histories. Eine prototypische Realisierung des Ansatzes in Java, basierend auf dem Jazz-Grafik-Toolkit und dem Scone Framework für Web Erweiterungen, wurde ent- wickelt und in zwei kontrollierten Experimenten und einer Langzeitstudie verwen- det, um wesentliche Aspekte des Ansatzes zu evaluieren. Zusätzlich wurden beste- hende, teilweise überholte Einsichten bezüglich Navigation und Wiederbesuch im Web zusammen mit drei Kollegen in einer Langzeit-Click-Stream-Studie vertieft und auf den neuesten Stand gebracht. Diese Analysen bilden eine solide Grundlage zur Diskussion und weiteren Verbesserung der vorgestellten Konzepte. v Abstract When people use the World Wide Web, they show various forms of web page revisi- tation.1 In the short-term, web pages are revisited during the exploration of various areas of a website and while following different links of a search results list. In the medium term, revisits occur when people reuse their favorite web-based services or when they observe modifications of well-known frequently updated pages. Long- term revisits mainly occur when specific content is reviewed after considerable time. Current history tools such as the back button, bookmarks, history list, and query autocompletion build a heterogeneous mixture of different approaches, all with different kinds of history access and interfaces. Each tool shows unique and often severe shortcomings. Existing suggestions for improving history support overcome some of these shortcomings, but introduce new ones. An appropriate, integrative history support, therefore, is still missing. This dissertation analyzes the current situation of navigation and revisitation on the web. It outlines and compares current and suggested history tools, as well as their advantages and disadvantages. Based on these insights, a new visual approach for an integrative history tool is presented – the SessionGraphs approach. It visual- izes the user's path as an animated, interactive graph, utilizing perceptual abilities and recognition instead of recall. Session borders are used to subdivide the visual history into items of reasonable, manageable size. A session is laid out automatically with the goal of maximizing the recognizability of the entire session's graph, as well as of the single nodes contained within it. The resulting characteristic visual shapes can be manually reshaped on demand. The user can then organize the visualizations according to the tasks he or she is working on. Thus, this approach provides a con- ceptual strategy to scale with growing histories – an important issue, which is not explicitly addressed by other existing and suggested approaches. A prototypical implementation in Java, based on the Jazz Graphics Toolkit and the Scone framework for web enhancements, is used to evaluate the approach in two controlled experiments and a longitudinal case study. Existing and partly out- dated insights about navigation and revisitation behavior on the current web with- out additional history support are updated and deepened in a longitudinal client side clickstream study, executed together with three colleagues. These analyses and evaluations provide a thorough base for the discussion and further improvement of the presented approach. 1 From now on the term web will be used instead of World Wide Web and refers to all objects that can be accessed with a common web browser, as described on page 259. vi Acknowledgements The presented work is the result of productive collaborations and the unremitting scholary and emotional support of great colleagues and friends. My deep gratitude is with all of them. I thank Peter Schefe for motivating me to start this venture, for his support and guidance along the way. I thank Ben Bederson and Ben Shneiderman for their invitation to an extremely fruitful residence at the Human-Computer Interaction Lab (HCIL) at the University of Maryland, for their excellent support, affectionate reception, and encouragement to continue this work. I would like to thank Ben Bederson in particular, for his knowledgeable, thoughtful advice related to pro- gramming, evaluation, and research direction, and his extraordinary hospitality. I thank Horst Oberquelle and Christopher Habel of the Department of In- formatics at the University of Hamburg for their continuous support, including all things organizational, and for supporting me in carrying through. I especially thank my friend and colleague, Harald Weinreich, who read the whole thesis – partly more than once, for his passionate scientific collaboration and precious feedback. My gratitude is also with Hartmut Obendorf and Eelco Herder for their great coopera- tion. I thank my colleagues Ruth Meyer, Björn Gehlsen, Holger Mügge, and Ralf Bachmann for making work and research a joyful experience. I thank all my former students and participants who contributed to this project, especially Volkert Jürgens, Torsten Hass, Frank Wollenweber, and the highly helpful and skilled people at the HCIL, in particular Jesse Grosjean, Lance Good, Harry Hochheiser, Hilary Browne, Anne Rose, and Catherine Plaisant. I appreciate the contributions of Shaun Kaasten and Gene de Lisa, and the discussions with Yuri Engelhardt. I thank the great librarians of the Department of Informatics, the administrative and computer staff, and the service team. Last, but not least, I would like to thank my mother, my father, my sister Gabriele Sperling, and my friends for their deep encouragement, love, and patience through all the years that brought me to this point in time. Especially, I thank Su- sanne Reizlein, Frank Misiak, Jan Heise, Inga Wellmann, Nina Hansen, Luise Pal- ace, the people @ futuretank, and Ursula McKnight for her great corrections. I thank the people at Haus 73, Pony Bar, and Unter den Linden for the wonderful environments they create, their smiles, and their vital soya latte. Thank you! vii Figure 2-1: “Depicting the Mesh” – web visualization by the author,