Towards Performance and Dependability Benchmarking of Distributed Fault Tolerance Protocols Divya

Towards Performance and Dependability Benchmarking of Distributed Fault Tolerance Protocols Divya. Gupta To cite this version: Divya. Gupta. Towards Performance and Dependability Benchmarking of Distributed Fault Tol- erance Protocols. Systems and Control [cs.SY]. Université Grenoble Alpes, 2016. English. NNT : 2016GREAM005. tel-01376741 HAL Id: tel-01376741 https://tel.archives-ouvertes.fr/tel-01376741 Submitted on 5 Oct 2016 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. THÈSE Pour obtenir le grade de DOCTEUR DE L’UNIVERSITÉ GRENOBLE ALPES Spécialité : Informatique Arrêté ministériel : Arrêté no Présentée par Divya GUPTA Thèse dirigée par Pr. Sara Bouchenak préparée au sein Laboratoire d’Informatique de Grenoble et de École Doctorale Mathématiques, Sciences et Technologies de l’Information, Informatique Performance et fiabilité des protocoles de tolérance aux fautes Thèse soutenue publiquement le Mars 18, 2016, devant le jury composé de : Pr. Noel De Palma Grenoble Université Alpes, LIG, Président Asc. Pr. Eddy Caron Ecole Normale Superieure de Lyon, Rapporteur Pr. Gilles Grimaud Université de Lille 1, Rapporteur Asc. Pr. Luciana Arantes Université Pierre et Marie Curie, LIP6, Examinatrice Pr. Sara Bouchenak INSA Lyon, LIRIS, Directrice de thèse ii This thesis is dedicated to my beloved parents and grandparents. For their endless love, support and encouragement iii Acknowledgments I would like to take this opportunity, to express my sincere gratitude to the people for inspiring me to embark on my PhD candidature. My deepest appreciation to my supervisor who guided me throughout on this vast research area, Professor Sara Bouchenak. I am particularly thankful to her for giving me the opportunity to pursue this research under her guidance. My immeasurable appreciation for her time, emotional support, tremendous encouragement and for sharing an invaluable experience. I thank her for generously guiding me through all the phases of my PhD with enormous patience. I would like to ex- tend my gratitude to the jury members, Eddy Caron and Gilles Grimaud, for accepting to evaluate my work and provide their valuable comments, Luciana Arantes, for accepting to be the examiner, and Noel De Palma, for chairing the jury committee. I am obliged to thank Vivien Quéma, for occasional conversations on my research topic; his strong theoretical and technical skills greatly helped in structuring the solution for the complex problem of Byzantine. I am also grateful to Vania Marangozova-Martin, for giving her time to review my contributions and manuscript. I am thankful to Damian Serrano for his profitable discussions and advice on my work, and also guiding me through the initial phases of a PhD student. My sincere thanks to Lucas Perronne, for critiquing dispassionately about various aspects of the problems for understanding them better and improving the research approaches. I am fortunate to have wonderful colleagues in my team, ERODS. They have been very generous friends, supporting and motivating me throughout my work. My very special thanks to Raquel Oliveira, for being there by my side like a guiding light, helping me carve my path with immense patience. I am greatly indebted to her for encouraging and comfort- ing me during all my tough times. I acknowledge the help and support from Ecole Doctorale: Zilora Zouaoui, Pierre Tchounikine, Florence Maraninchi, Pierre Geneves and Brigitte Nonque for kindly helping me with professional and French bureaucratic problems. I am also grateful to the administration staff at LIG: Pascal Poulet, Laurence Schimicci, Muriel Paturel and Amelie Vazquez for assisting me with the complicated, time consuming administrative formalities. This dissertation would not have been possible without the unconditional love and constant encouragement from my parents, sister, brother and other family members. My grandfather taught me to work hard and value time. My parents always motivated me to achieve the impossible and go beyond the limits. Even though we are miles apart, but their positive thoughts and energy iv could be felt all the time. I am lucky to have my sister, Somya, who has been like a teacher, motivating me in the worse times. She stood firm like a pillar, giving me the strength to face all the difficulties. How can I forget, Nimit, my brother, his great discussions, reviews, comments and advice, throughout my PhD career. He made sure that I smiled every day, no matter what. I am fortunate to have two best friends, Shipra and Sushma, for their cheering and sharing my life experiences. I would like to express my warm thanks to all my friends across the globe and in France, for being supportive, encouraging, and believing in me, during my PhD journey. v Résumé A l’ère de l’informatique omniprésente et àla demande, oùles applications et les services sont déployés sur des infrastructures bien gérées et approvision- nées par des grands groupes de fournisseurs d’informatique en nuage (Cloud Computing), tels Amazon, Google, Microsoft, Oracle, etc., la performance et la fiabilitéde ces systèmes sont devenues des objectifs primordiaux. Cette informatique a rendu particulièrement nécessaire la prise en compte des facteurs de la Qualitéde Service (QoS pour Quality of Service), telles que la disponibil- ité, la fiabilité, la vivacité, la suretéet la sécurité, dans la définition complète d’un système. En effet, les systèmes informatiques doivent être résistants aussi bien aux défaillances qu’aux attaques et ce, afin d’éviter qu’ils ne deviennent inaccessibles, entrainent des couts de maintenance importants et la perte de parts de marché. L’augmentation de la taille et la complexitédes systèmes en nuage rend de plus en plus commun les défauts, augmentant la fréquence des pannes, et n’offrant donc plus la Garantie de Service visée. Les fournisseurs d’informatique en nuage font ainsi face épisodiquement à des fautes arbitraires, dites Byzantines, durant lesquelles les systèmes ont des comportements im- prévisibles comme, par exemple, des réponses incorrectes aux requêtes d’un client, l’envoi de messages corrompus, la temporisation intentionnelle dans l’échange de messages, le refus d’honorer des requêtes, etc. Ce constat a amenéles chercheurs às’intéresser de plus en plus àla tolérance aux fautes byzantines (BFT pour Byzantine Fault Tolerance) et à proposer de nombreux prototypes de protocoles et logiciels. Ces solutions de BFT visent non seulement àfournir des services cohérents et continus malgré des défaillances arbitraires, mais cherchent aussi àréduire le coût et l’impact sur les performances des systèmes sous-jacents. Néanmoins les prototypes BFT ont étéévalués le plus souvent dans des contextes ad-hoc, soit dans des conditions idéales, soit en limitant les scénarios de fautes. C’est pourquoi ces protocoles de BFT n’ont pas réussi àconvaincre les professionnels des sys- tèmes distribués de les adopter. Tandis que certains considèrent les protocoles de BFT trop coûteux et complexes àmettre en place pour contrer des défail- lances arbitraires, d’autres sont tout simplement sceptiques quant àl’utilité de ces techniques. Cette thèse entend répondre àce problème en proposant un environnement complet de banc d’essai dont le but est de faciliter la créa- tion de scénarios d’exécution utilisables pour aussi bien analyser que comparer l’efficacitéet la robustesse des propositions BFT existantes. Dans ce contexte, les contributions de cette thèse sont les suivantes : • Nous introduisons une architecture générique pour analyser des protocoles distribués. Cette architecture comprend des composants réutilis- vi ables permettant la mise en œuvre d’outils de mesure des performances et d’analyse de la fiabilitédes protocoles distribués. Cette architecture permet de définir la charge de travail, de défaillance, et l’injection de ces dernières. Elle fournit aussi des statistiques de performance, de fiabilité du système de bas niveau et du réseau. En outre, cette thèse présente les bénéfices d’une architecture générale. • Nous présentons BFT-Bench, le premier système de banc d’essai de la BFT, pour l’analyse et la comparaison d’un panel de protocoles BFT utilisés dans des situations identiques. BFT-Bench permet aux utilisateurs d’évaluer des implémentations différentes pour lesquels ils définis- sent des comportements défaillants avec différentes charges de travail. Il permet de déployer automatiquement les protocoles BFT étudiés dans un environnement distribuéet offre la possibilitéde suivre et de ren- dre compte des aspects performance et fiabilité. Parmi nos résultats, nous présentons une comparaison de certains protocoles BFT actuels, réalisée avec BFT-Bench, en définissant différentes charges de travail et différents scénarii de fautes. Cette réelle application de BFT-Bench en démontre l’efficacité. Globalement, cette thèse vise àfaciliter l’analyse de performance et de fia- bilitéde la BFT afin d’en encourager l’utilisation aussi bien par les développeurs des protocoles BFT que ses utilisateurs finaux. Le logiciel BFT-Bench a été con¸cu en ce sens pour aider les utilisateurs àcomparer efficacement différentes implémentations de BFT et apporter des solutions effectives aux lacunes iden- tifiées des prototypes BFT.

Load more