Management of Polyglot Persistent Environments for Low Latency Data Access in Big Data

Beheer van heterogene opslagtechnologieën voor snelle datatoegang in 'Big Data'-omgevingen Management of Polyglot Persistent Environments for Low Latency Data Access in Big Data Thomas Vanhove Promotoren: prof. dr. ir. F. De Turck, dr. G. Van Seghbroeck Proefschrift ingediend tot het behalen van de graad van Doctor in de ingenieurswetenschappen: computerwetenschappen Vakgroep Informatietechnologie Voorzitter: prof. dr. ir. B. Dhoedt Faculteit Ingenieurswetenschappen en Architectuur Academiejaar 2017 - 2018 ISBN 978-94-6355-084-0 NUR 988, 995 Wettelijk depot: D/2018/10.500/2 QoE-beheer van HTTP-gebaseerde adaptieve videodiensten QoE Management of HTTP Adaptive Streaming Services Niels Bouten Promotoren: prof. dr. ir. F. De Turck, prof. dr. S. Latré Proefschrift ingediend tot het behalen van de graden van Doctor in de ingenieurswetenschappen: computerwetenschappen (Universiteit Gent) en Doctor in de wetenschappen: informatica (Universiteit Antwerpen) Universiteit Gent Faculteit IngenieurswetenschappenVakgroep Informatietechnologie en Architectuur Voorzitter: prof. dr. ir. D. De Zutter Faculteit IngenieurswetenschappenVakgroep Informatietechnologie en Architectuur Departement Wiskunde en Informatica Voorzitter: prof. dr. C. Blondia Leden van de examencommissie: Faculteit Wetenschappen prof. dr. ir. Filip De Turck (promotor) Universiteit Gent - imec Academiejaar 2016 - 2017 dr. Gregory Van Seghbroeck (promotor) Universiteit Gent - imec prof. dr. ir. Daniel¨ De Zutter (voorzitter) Universiteit Gent prof. dr. ir. Frank Gielen Universiteit Gent prof. dr. Guy De Tre´ Universiteit Gent prof. dr. ing. Erik Mannens Universiteit Gent - imec ir. Werner Van Leekwijck Universiteit Antwerpen dr. Anthony Liekens IO Lab Proefschrift tot het behalen van de graad van Doctor in de ingenieurswetenschappen: Computerwetenschappen Academiejaar 2017-2018 Dankwoord Je zou denken dat 5,5 jaar een lange tijd is, maar nu ik hier de laatste woorden van dit boek neerschrijf, lijkt het alsof augustus 2012 toch niet zo veraf is. Ik ben dankbaar dat ik dit hoofdstuk mag afsluiten, maar tegelijk betekent dat ook dat ik afscheid moet nemen van mensen die ik in de voorbije jaren mocht leren kennen. Alvorens ik dat doe, wil ik iedereen bedanken die in mindere of meerdere mate een invloed gehad heeft op dit boek of op mijn leven in het algemeen gedurende mijn tijd aan de Universiteit Gent. Daarnaast zijn er een paar mensen die ik uitdrukkelijk wens te bedanken: De eerste personen die ik wil bedanken zijn mijn promotoren Filip De Turck en Gregory Van Seghbroeck. Filip, bedankt om mij de mogelijkheid te geven om aan een doctoraat te beginnen. Bedankt om keer op keer weer beschikbaar te zijn voor een gesprek of feedback en om mij de flexibiliteit te geven om dit doctoraat tot een goed einde te brengen. Gregory, bedankt om samen met mij vorm te geven aan mijn doctoraat en om een klankbord te zijn voor mijn ideeen.¨ Ik denk dat het maar zelden voorkomt dat je ook samen met eén´ van je promotoren een spin- off kan oprichten en leiden. Bedankt om dit avontuur met mij te willen aangaan en ik kijk uit naar wat de komende jaren met Qrama zullen brengen. Naast mijn promotoren zijn er ook nog een paar mensen die niet kunnen ontbreken omdat zonder hun dit werk en de voorbije 5 jaren er heel anders hadden uitgezien: Tim Wauters en Bruno Volckaert. Bedankt om vanaf dag eén´ klaar te staan voor mij, om papers na te lezen, en mij tot op vandaag te ondersteunen. Mijn woordenschat is te beperkt om uit te drukken hoe dankbaar ik ben voor jullie steun. Bruno, jouw bizarre humor en de talrijke verhalen tijdens de autoritten van en naar Leuven zijn legendarisch. Ik hoop er nog veel te mogen horen. En sorry voor de San Francisco fietstocht! Er zijn ook nog een paar iconen die op zich een vermelding verdienen. Onze vakgroep Informatietechnologie en onderzoeksgroep IDLab Gent worden gerund door de bewonderenswaardige Bart Dhoedt en Piet Demeester. Zij zijn de drijf- veer die zorgen voor de constante vooruitgang en groei die onze groepen kennen. Daarnaast zit je als doctoraatsstudent vaak met praktische vragen, zeker in die eerste en laatste maanden van het doctoraat, maar ik kan mijn hand ervoor in het vuur steken dat je het antwoord steeds bij Martine en Davinia kan vinden. Ik vraag mij ten zeerste af wat iedereen zou doen moesten jullie niet elke dag paraat staan voor iedereen met een kleine of grote vraag. Bedankt! Zonder een technisch team is een internettechnologie-onderzoeksgroep maar weinig waard, dus ook veel dank gaat uit naar Brecht, Joeri, Bert, Vicent en Simon van het A-team. Thanks guys! ii Bedankt aan Bernadette en Joke van de financiele¨ administratie en, last but not least, Sabrina om steeds onze werkplek proper te houden en voor de spontane ge- sprekken in de wandelgangen. Een dankwoord is niet compleet zonder de schijnwerper even op de bureaus 2.21 en 200.012 te zetten. Bram, Jerico, Jeroen, Kristof, Laurens, Leandro, Maxim, Merlijn, Niels, Olivier, Philip, Piet, Sander, Stefano, Steven B, Steven VC, Thijs, Tim en Wim ... dankjewel! Bedankt om het waard te maken om elke dag, goed of slecht, naar de bureau te komen. Ik zal nog lang met een lach terugkijken op de vele fijne bureau-momenten en de lunches waarbij we de een of andere existentiele¨ levensvraag van Merlijn in onze richting geslingerd kregen. Like, is this even real life? Het is ook fijn om jouw thesisbegeleiders als collegas te leren kennen. Be- dankt Femke en Femke voor jullie begeleiding in dat laatste masterjaar en voor de verschillende gezellige board game momenten daarna. Soms was het noodzakelijk om ook eens weg te stappen van de bureau en het is dan leuk om collega’s te hebben waarbij je stoom kan aflaten bij het koffiemachien. Bedankt hiervoor Thomas en Wannes. Bedankt ook aan alle andere collega’s om deze ervaring zo uniek te maken! Als we het dan toch over unieke ervaringen hebben, dan moet ik even stilstaan bij het Tengu verhaal. Tengu is in de loop van mijn doctoraat zijn eigen leven gaan leiden en dat is allemaal dankzij het Tengu-team en zijn supporters. Gregory, Jeroen, Merlijn, Sander, Leandro, Tim, Bruno, Filip, bedankt om Tengu te maken tot wat het vandaag al geworden is. Sinds oktober 2016 hebben ook Sebastien, Mathijs, Dixan en Michiel hun steentje bijgedragen via Qrama. Bedankt om deel uit te maken van dit avontuur en bedankt voor de schitterende sfeer die jullie elke dag weer opnieuw maken. Het is een voorrecht om samen met jullie in de tech start-up wereld aan Tengu te bouwen. Soms was het gemakkelijk om te vergeten dat er nog een leven was buiten het doctoraat en Qrama, maar gelukkig zijn er vrienden waar je beroep op kan doen om alles eventjes achter te laten. Bros (Nicolas, Thibaut, Lino en Ewout), bedankt voor de maandelijkse hangouts, jaarlijkse oudejaarsavonden en vele andere momenten die we mochten delen met of zonder onze wederhelften (Teresa, Elke, Inne en Inge). De talrijke ontmaskeringen van wannabe dictators, het bestrijden van virussen op wereldschaal en UNO met punten zijn ook momenten uit de vele board game nights (aka REDACTED) die ik koester dankzij vrienden zoals Bart, Melissa, Nicolas en Teresa. Allemaal heel oprecht bedankt! Ik voeg hier graag een speciale vermelding voor Maxim toe, want het is buitengewoon om een collega een vriend te kunnen noemen. Ik heb je leren kennen als de grappenmaker van de bureau, maar daarachter schuilt iemand waar je echt op kan rekenen en die voor zijn vrienden door het vuur zou gaan. Bedankt voor de Tomorrowlands, het door- sturen van de templates voor vanalles en nog wat en alle schitterende momenten die we mochten beleven. Zonder mijn familie had dit verhaal waarschijnlijk ook een andere wending gekend. Bedankt mama en papa om mij te stimuleren in alles wat ik onderneem en om er te zijn als het soms niet volledig uitdraait zoals ik gedacht had. Ik kijk enorm op naar jullie en alles wat jullie gerealiseerd hebben en kan alleen maar hopen om iii daar ooit een fractie van te bereiken. Nic, ik denk niet dat je beseft wat jij voor mij betekend hebt in deze laatste jaren en ik denk ook niet dat ik het ooit in woorden zal kunnen uitdrukken. Ik ben heel dankbaar om een broer en beste vriend zoals jou te hebben. Bedankt ook aan Filip, Sabine, Mem´ e,´ Michiel en An-Sofie voor de zovele gezellige momenten. Tot slot wil ik nog een heel speciaal iemand in mijn leven bedanken: Stephanie. Bollie, ik prijs mijzelf gelukkig dat ik jou al bijna 10 jaar in mijn leven heb. Dit laatste jaar heeft veel van mijn tijd ingenomen, maar zonder klagen of zagen was je er steeds om mij te ondersteunen in de moeilijke momenten en zo veel stress van mij weg te nemen. Bedankt om mijn leven in deze voorbije 10 jaar beter te maken en ik kan al niet wachten op wat de rest van ons leven in petto heeft. Ik hou van jou! Gent, januari 2018 Thomas Vanhove Table of Contents Dankwoordi Samenvatting xxi Summary xxv 1 Introduction1 1.1 The Impact of Big Data.......................1 1.2 Problem Statement.........................5 1.3 Research Contributions.......................6 1.4 Dissertation Outline.........................8 1.5 Publications............................. 10 1.5.1 A1: Journal publications indexed by the ISI Web of Sci- ence “Science Citation Index Expanded”......... 10 1.5.2 P1: Proceedings included in the ISI Web of Science “Con- ference Proceedings Citation Index - Science”....... 11 1.5.3 C1: Other publications in international conferences.... 12 1.6 Spin-offs............................... 12 References................................. 13 2 Managing the Synchronization in the Lambda Architecture for Opti- mized Big Data Analysis 15 2.1 Introduction............................. 16 2.2 Lambda architecture: overview and challenges........... 17 2.3 Synchronization..........................

Management of Polyglot Persistent Environments for Low Latency Data Access in Big Data

Nosql Distilled: a Brief Guide to the Emerging World of Polyglot Persistence

Polyglot Persistency an Adaptive Data Layer for Digital Systems Table of Contents

Multi-Model Database Management Systems - a Look Forward Zhen Hua Liu 1 , Jiaheng Lu2, Dieter Gawlick1, Heli Helskyaho2,3

Noxperanto: Crowdsourced Polyglot Persistence Antonio Maccioni, Orlando Cassano, Yongming Luo, Juan Castrejón, Genoveva Vargas-Solar

PDDM: a Database Design Method for Polyglot Persistence

A Big Data Roadmap for the DB2 Professional

Multi-Model Databases: a New Journey to Handle the Variety of Data

Nosql Distilled: a Brief Guide to the Emerging World of Polyglot

Polyglot Persistence: Handling Multiple Datastores

Polyglot Database Architectures = Polyglot Challenges

POLYGLOT PERSISTENCE for ADDRESSING DATA MANAGEMENT on the CLOUD Genoveva Vargas-Solar, CNRS, LIG-LAFMIA, Juan Carlos Castrejon, U

An Approach for Modeling Polyglot Persistence