Doctorat De L'université De Toulouse
Total Page:16
File Type:pdf, Size:1020Kb
THESETHESE En vue de l'obtention du DOCTORAT DE L’UNIVERSITÉ DE TOULOUSE Délivré par l'Université Toulouse III - Paul Sabatier Discipline ou spécialité : Chimie Quantique et Computationnelle Présentée et soutenue par Marco Verdicchio Le 17/12/2012 Titre : Molecular simulations as test beds for bridging High Throughput and High Performance computing JURY Prof. Laganà Antonio Prof. Evangelisti Stefano Prof. Coletti Cecilia Prof. Alikhani Emsail Ecole doctorale : Ecole Doctorale Sciences de la Matiere Unité de recherche : Laboratoire de Chimie et Physique Quantiques - UMR5626 Directeur(s) de Thèse : Laganà Antonio, Evangelisti Stefano, Thierry Leininger Rapporteurs : Contents French summary 1 Introduction 21 1 Molecular Simulators 25 1.1 The general Schrodinger¨ equation . 25 1.2 The electronic structure . 26 1.3 The nuclei dynamics . 30 1.4 The chemical kinetics systems . 32 1.5 GEMS the GRID simulator . 35 1.6 The kinetics version of the workflow . 38 1.7 Bridging HTC to HPC . 39 2 Code interoperability in Quantum chemistry and Dynamics 45 2.1 Data of Ab initio Quantum Chemistry . 46 2.2 Data of Quantum Dynamics . 48 2.3 The data model: Q5cost . 49 2.4 The D5cost data model . 52 2.5 The Library . 53 2.6 Tools and Wrappers . 54 2.7 Performance and benchmarks . 57 3 High level ab initio calculations of small systems 61 3.1 Coupled-Cluster study: the electronic wavefunction of tetra- hedral clusters . 61 3.2 Geometry optimizations of the tetrahedral clusters . 68 iii CONTENTS 3.3 No-pair bonding: Cu4 basis sets and correlated orbitals . 75 3.4 The no-pair bond state . 76 3.5 The BeH− anion: a Full CI investigation . 80 3.6 The FCI computational strategy . 82 3.7 Dissociation energy and equilibrium distance . 84 3.8 Analysis of the Charge Distribution . 87 4 HPTC for a Dynamical problem 95 4.1 The coordinate system and the investigated arrangements . 96 4.2 The lower level of theory calculations . 99 4.3 The supercomputer based higher-level of theory calculations 101 4.4 The fit of the ab initio potential energy values . 106 4.5 The CCSD(T) Potential Energy Surface . 108 4.6 The multi reference representation of the PES . 110 5 HPTC for a Kinetic problem 117 5.1 Model the kinetic of combustion reactions . 118 5.2 Low temperature oxidation of alkanes . 120 5.3 Ab initio study of an elementary process . 121 5.4 The evaluation of kinetic and thermochemical data . 127 Bibliography 137 iv French summary Introduction Les avanc´eesdans les sciences informatiques permettent au- jourd’hui l’´etude`apriori de syst`emeschimiques complexes et permettent l’´evaluationd´etaill´eedes propri´et´esmacroscopiques de la mati`ere sans recourir `ades consid´erationsempiriques ou a un m´elangedes ´el´ementsd’information provenant de diff´erentes sources (h´et´erog`eneset parfois contradictoires). Cela a ´et´erendu possible par les progr`esde la chimie th´eorique(qui a produit une grande vari´et´ede m´ethodeset de techniques qui permettant la simulation des processus des syst`emesr´eelssur la base du premier principe) et l’´evolutiondes plate-formes informatiques en r´eseau(qui de plus en plus permet l’utilisation combin´ee d’une grande quantit´ede ressources informatiques distribu´ees et h´et´erog`enes).La forte d´ependancede la chimie computation- nelle aux technologies informatiques est la force et la faiblesse des simulations mol´eculaires. En effet, dan le but de r´ealiser des ´etudesde ce type (mˆemepour le syst`emescontenant un pe- tit nombre d’atomes), il faut d’abord proc´edera des calculs de structure ´electronique de haut niveau. Ces calculs n´ecessitentg´en´eralementdes nœuds (ou cluster de nœuds) ´equip´esde m´emoires de grande taille (de l’ordre de plu- sieurs Go) et de processeurs performants (au niveau de plu- sieurs Gigaflops). Cette puissance est n´ecessaire parce que toute 1 FRENCH SUMMARY la surface d’´energie potentielle (PES) qui r´egitle mouvement nucl´eaire doit en g´en´eralˆetre ´elabor´eepr´ealablement. Sur les plateformes High Performance Computing (HPC) avec des capacit´esparall`eles am´elior´ees,nous pouvons ex´ecutersi- multan´ementles calculs d’un grand nombre de valeurs d’´energie potentielle n´ecessaires pour d´ecrire la PES explor´eelors d’une r´eactionchimique. Le goulot d’´etranglementdans la r´ealisation d’une telle campagne de calculs r´esidedans la disponibilit´ed’une plateforme informatique ayant des capacit´esde calcul appro- pri´eesen terme de temps de calcul et de m´emoire physique. Les capacit´esinformatiques (limit´ees)g´en´eralement mises `ala dis- position de la communaut´escientifique ont en fait toujours fix´e des limites s´ev`eres `al’´elaborationde simulations a priori de pro- cessus mol´eculaires. Heureusement, les technologies informatiques innovantes al- liant simultan´eit´eet mise en r´eseau(calcul distribu´e,labora- toires virtuels, supercalculateurs, Grid computing) ouvrent des perspectives nouvelles quant aux possibilit´esd’obtenir d´ebitde calcul importante et, par cons´equent,de d´evelopperdes simula- tions mol´eculaires a priori de syst`emesr´eels. Dans plusieurs domaines scientifiques, les chercheurs ont be- soin de plateformes donnant acc`es`ades machines HPC et HTC permettant la mod´elisationde syst`emesr´eelset la simulation de r´ealit´evirtuelle fond´essur des approches multi-physiques et multi-´echelles.Dans le cadre des activit´esmen´eespar la Che- mistry and Molecular & Material Sciences and Technology Com- munities (CMMST), COMPCHEM (l’Organisation Virtuelle (VO) pour la chimie computationnelle de l’infrastructure de la grille de calcul europ´eenne(EGI)) est engag´eedans la concep- tion et la mise en œuvre des applications de CMMST multi- ´echellescomme GEMS (the Grid Empowered Molecular Simu- lator). GEMS n´ecessite l’expertise compl´ementaire et l’utilisation de 2 diff´erentes plateformes de calcul HPC et HTC pour ex´ecuterdes packages dont les performances peuvent varier de plateforme en plateforme. L’utilisation de e-infrastructures HPC et HTC et l’interaction des grandes applications informatiques permet- tra non seulement de surpasser la situation actuelle, mais elle permettra ´egalementune optimisation de l’utilisation des res- sources informatiques en r´eservantl’approche HPC aux tˆaches de calcul ´etroitement coupl´eeset en limitant le concept HTC aux tˆachesr´eparties, ´evitantainsi de perdre une grande quan- tit´ede temps dans le transfert de donn´ees.Une coordination de ces deux types de plateformes pour interagir via un seul work- flow et une gestion appropri´eedes diff´erentes composants sur le plus appropri´edes deux syst`emes,permettra une optimisation de l’utilisation des diff´erentes ressources informatiques tout en offrant aux utilisateurs les meilleurs niveaux de performance possible. Simulateur Moleculaire´ D`esle d´ebut,les bases de la chimie ont ´et´econstruites sur les concepts d’atomes et de mol´ecules.La chimie th´eoriqueet com- putationnelle, dont l’unit´ede r´ef´erence et de l’ordre de fractions de nanom`etre (typiquement le rayon de Bohr), est bas´eesur les lois physiques au niveau atomique. Par cons´equent,tous les ph´enom`eneset propri´et´esphysiques sont reconduites jusqu’`a ce niveau atomique et mol´eculaire et n´ecessitentainsi une ap- proche multi-´echelle. La construction de simulateurs mol´eculaires ab initio est donc le bloc de d´epartde toute rationalisation du comportement des 3 FRENCH SUMMARY syst`emesphysiques. Un simulateur mol´eculaire est un ensemble de programmes et d’outils conduisant l’utilisateur `apartir des premiers principes jusqu’aux aux observables `atravers le cal- cul pr´ecisde quantit´es´el´ementaires et de la moyenne de pa- ram`etres non observables d’un syst`emephysique. Un syst`eme physique caract´eris´epar un ensemble de coordonn´eesnucl´eaires spatiales (R), de coordonn´ees´electroniques (r) et par une co- ordonn´eede temps t est enti`erement repr´esent´epar une fonc- tion ? (R, r, t), appel´eefonction d’onde du syst`eme,d´ecrivantla distribution spatiale et temporelle du syst`eme.L’´equationde la m´ecaniquequantique r´egissantla dynamique du syst`eme,c’est `adire l’´evolutiondu syst`emeavec le temps, est l’´equationde Schr¨odingerd´ependantdu temps (TD) : ∂ ih¯ Y(R, r, t)=Hˆ Y(R, r, t) ∂t o`uH est le hamiltonien, qui pour un syst`emede N-particules se compose d’une partie cin´etique(T) et d’un terme d’´energie po- tentielle (V). Afin de calculer les solutions num´eriquesadapt´ees, on peut envisager d’adopter diff´erents sch´emasde d´ecouplage et/ou de simplification. Une premi`ere simplification est l’ap- proximation de Born-Oppenheimer (BO).En effet, comme les noyaux sont beaucoup plus lourds que les ´electrons et leurs vi- tesses beaucoup plus faibles, l’´equationde Schr¨odingerpeut ˆetre divis´eeen deux parties : une partie qui d´ecritla fonction d’onde ´electronique pour une valeur fixe de R (g´eom´etrienucl´eaire) et une autre partie pour la fonction d’onde nucl´eaire, dans la- quelle l’´energie ´electronique se pr´esentesous la forme d’une fonction de R, V (R). La fonction V(R) est la PES sur laquelle les noyaux se d´eplacentsous l’effet combin´edes gradients et de l’op´erateurcin´etique.L’observable physique mesur´eetradition- nellement pour les processus r´eactifsest la constantes de vitesse thermique k(T). Nous pouvons utiliser deux techniques pour r´esoudre le probl`emequantique : les m´ethoded´ependantesdu 4 temps (TD) et les m´ethodeind´ependantesdu temps (TI). Une diff´erence fondamentale entre les deux approches est que dans le premier cas, on r´esoutles ´equationsr´egissantle mouvement des noyaux en utilisant le temps comme variable de continuit´e alors que, dans le second cas, une nouvelle variable de conti- nuit´edoit ˆetre ´elabor´ee.