Mechanized Verification of the Correctness and Asymptotic Complexity of Programs

Universitéde Paris Ecole´ doctorale 386 | Sciences Mathématiquesde Paris Centre Doctorat d'Informatique Mechanized Verification of the Correctness and Asymptotic Complexity of Programs The Right Answer at the Right Time ArmaëlGuéneau Thèse dirigéepar Fran¸coisPottier et Arthur Charguéraud et soutenue le 16 décembre 2019 devant le jury composéde : Jan Hoffmann Assistant Professor, Carnegie Mellon University Rapporteur Yves Bertot Directeur de Recherche, Inria Rapporteur Georges Gonthier Directeur de Recherche, Inria Examinateur Sylvie Boldo Directrice de Recherche, Inria Examinatrice Mihaela Sighireanu Ma^ıtrede Conférences, Universitéde Paris Examinatrice Fran¸coisPottier Directeur de Recherche, Inria Directeur Arthur Charguéraud Chargéde Recherche, Inria Co-directeur Abstract This dissertation is concerned with the question of formally verifying that the implementation of an algorithm is not only functionally correct (it always returns the right result), but also has the right asymptotic complexity (it reliably computes the result in the expected amount of time). In the algorithms literature, it is standard practice to characterize the performance of an algorithm by indicating its asymptotic time complexity, typically using Landau's \big-O" notation. We first argue informally that asymptotic complexity bounds are equally useful as formal specifications, because they enable modular reasoning: a O bound abstracts over the concrete cost expression of a program, and therefore abstracts over the specifics of its implementation. We illustrate|with the help of small illustrative examples|a number of challenges with the use of the O notation, in particular in the multivariate case, that might be overlooked when reasoning informally. We put these considerations into practice by formalizing the O notation in the Coq proof assistant, and by extending an existing program verification framework, CFML, with support for a methodology enabling robust and modular proofs of asymptotic complexity bounds. We extend the existing framework of Separation Logic with Time Credits, which allows to reason at the same time about correctness and time complexity, and introduce negative time credits. Negative time credits increase the expressiveness of the logic, and enable convenient reasoning principles as well as elegant specifications. At the level of specifications, we show how asymptotic complexity specifications using O can be integrated and composed within Separation Logic with Time Credits. Then, in order to establish such specifications, we develop a methodology that allows proofs of complexity in Separation Logic to be robust and carried out at a relatively high level of abstraction, by relying on two key elements: a mechanism for collecting and deferring constraints during the proof, and a mechanism for semi-automatically synthesizing cost expressions without loss of generality. We demonstrate the usefulness and practicality of our approach on a number of increasingly challenging case studies. These include algorithms whose complexity analysis is relatively simple (such as binary search, which is nonetheless out of the scope of many automated complexity analysis tools) and data structures (such as Okasaki's binary random access lists). In our most challenging case study, we establish the correctness and amortized complexity of a state-of-the-art incremental cycle detection algorithm: our methodology scales up to highly non-trivial algorithms whose complexity analysis intimately depends on subtle functional invariants, and furthermore makes it possible to formally verify OCaml code which can then actually be used as part of real world programs. Keywords Formal verification, Algorithms, Asymptotic Complexity, Interactive Proofs, Proof assistants, Program logics, Separation Logic, Resource analysis Résumé Cette thèses'intéresseàla question de démontrer rigoureusement que l'implantation d'un algorithme donnéest non seulement correcte (elle renvoie bien le bon résultatdans tous les cas possibles), mais aussi possèdela bonne complexitéasymptotique (elle calcule toujours ce résultaten le temps attendu). Pour les chercheurs en algorithmique, caractériserla performance d'un algorithme se fait généralement en indiquant sa complexitéasymptotique, notamment àl'aide de la notation \grand O" due àLandau. Nous détaillons,tout d'abord informellement, pourquoi de telles bornes de complexitéasymptotiques sont également utiles en tant que spécificationsformelles. La raison est que celles-ci permettent de raisonner de fa¸conmodulaire àpropos du coûtd'un programme : une borne en O s'abstrait de l'expression exacte du coût du programme, et par làdes divers détailsd'implantation. Par ailleurs, nous illustrons, àl'aide d'exemples simples, un certain nombre de difficultés liéesàl'utilisation rigoureuse de la notation O, et qu'il est facile de négligerlors d'un raisonnement informel. Ces considérationssont mises en pratique en formalisant d'une part la notation O dans l'assistant de preuve Coq, et d'autre part en étendant CFML, un outil existant dédiéàla vérificationde programmes, afin de permettre àl'utilisateur d'élaborer des démonstrationsrobustes et modulaires établissant des bornes de complexitéasymptotiques. Nous étendons la logique de séparation avec créditstemps|qui permet de raisonner àla fois sur des propriétésde correction et de complexitéen temps|avec la notion de crédits temps négatifs.Ces derniers augmentent l'expressivitéde la logique, donnent accèsàdes principes de raisonnement commodes et permettent d'exprimer certaines spécifications de manièreplus élégante. Au niveau des spécifications,nous montrons comment des bornes de complexitéasymptotique avec O s'expriment en logique de séparationavec créditstemps. Afin d'êtrecapable d'établirde telles spécifications, nous développons une méthodologie qui permet àl'utilisateur de développer des démonstrationsqui soient à la fois robustes et menéesàun niveau d'abstraction satisfaisant. Celle-ci s'appuie sur deux principes clefs : d'une part, un mécanismepermettant de collecter et remettre à plus tard certaines contraintes durant une démonstrationinteractive, et par ailleurs, un mécanismepermettant de synthétisersemi-automatiquement une expression de coût,et ce sans perte de généralité. Nous démontrons l'utilitéet l’efficacitéde notre approche en nous attaquant àun certain nombre d'étudesde cas. Celles-ci comprennent des algorithmes dont l'analyse de complexitéest relativement simple (par exemple, une recherche dichotomique, déjà hors de portéede la plupart des approches automatisées)et des structures de données (comme les \binary random access lists" d'Okasaki). Dans notre étudede cas la plus significative, nous établissonsla correction et la complexitéasymptotique d'un algorithme incrémental de détectionde cycles publiérécemment. Nous démontrons ainsi que notre méthodologie passe àl'échelle, permet de traiter des algorithmes complexes, donc l'analyse de complexités'appuie sur des invariants fonctionnels subtils, et peut vérifierdu code qu'il est au final possible d'utiliser au sein de programmes réellement utiles et utilisés. Mots-clefs Preuves formelles, Algorithmes, Complexitéasymptotique, Preuves inter- actives, Assistants de preuve, Logiques de programme, Logique de séparation Remerciements Mes premiers remerciements vont àmes encadrants, Arthur et Fran¸cois,qui ont su m'accueillir et m'accompagner tout au long de cette thèse.Fran¸coisa étécelui qui m'a initiéàla recherche, lors de mon tout premier stage de six semaines, avec les (heureuses) conséquencesque l'on sait. Toujours disponible, Fran¸coiscombine une grande curiosité intellectuelle et ouverture d'esprit avec une rigueur scientifique sans faille, deux qualités inestimables. Merci àArthur, tout d'abord pour son implication malgréla distance géographique,et ensuite pour son optimisme et enthousiasme indéfectible. Arthur a toujours étéprésent pour me remonter le moral et m'aider dans les moments difficiles. I would like to thank Jan Hoffmann and Yves Bertot for their meticulous proofreading and many comments on my manuscript. Je remercie également Georges Gonthier, Sylvie Boldo et Mihaela Sighireanu d'avoir acceptéd'êtremembres de mon jury ; leur présence m'honore. Merci àceux qui ont contribuéàce qui est racontédans ce manuscrit. Merci à Jacques-Henri Jourdan, dont la sagacitéa étécruciale pour le succèsde la vérification de l'algorithme de détectionde cycles ; et merci àGlen Mével pour les discussions productives au sujet des O àplusieurs variables. Cette thèses'est nourrie des quelques annéespasséesàl'Inria ; merci àtous ceux qui ont contribuéàen faire un cadre de travail enrichissant. Merci àtous ceux de la \famille Gallium" étendue,aux conversations au coin cafédiverses et toujours intéressantes. Merci àJonathan et Tahina pour m'avoir donnéun aper¸cude la belle vie le long de la côtenord-ouest des Etats-Unis.´ And thank you to my friendly German colleagues, Max, Simon and Manuel, for your enthusiasm, the time in Munich, and all the interesting discussions. Pour finir, merci au personnel administratif, assistants et assistantes d'équipe qui nous fournissent une précieusetranquillitéd'esprit. Merci àceux qui, en aval, ont permis que cette thèseadvienne un jour. Merci àmes enseignants. Et merci plus particulièrement àGabriel Scherer, de qui j'ai appris|alors lycéen|qu'il étaitpossible de faire

Mechanized Verification of the Correctness and Asymptotic Complexity of Programs

Amortized Analysis

Lecture Notes of CSCI5610 Advanced Data Structures

Fundamental Data Structures Contents

Introduction to Algorithms, 3Rd

Draft Version 2020-10-11

Amortizedanalysis-2X

Amortized Analysis & Splay Trees

Purely Functional Data Structures

Amortized Analysis

Analysis of Algorithms

8 Priority Queues 8 Priority Queues Dijkstra's Shortest Path Algorithm

Scribe Notes