Doctorat De L'université De Toulouse

THESETHESE En vue de l'obtention du DOCTORAT DE L’UNIVERSITÉ DE TOULOUSE Délivré par l'Université Toulouse III - Paul Sabatier Discipline ou spécialité : Chimie Quantique et Computationnelle Présentée et soutenue par Marco Verdicchio Le 17/12/2012 Titre : Molecular simulations as test beds for bridging High Throughput and High Performance computing JURY Prof. Laganà Antonio Prof. Evangelisti Stefano Prof. Coletti Cecilia Prof. Alikhani Emsail Ecole doctorale : Ecole Doctorale Sciences de la Matiere Unité de recherche : Laboratoire de Chimie et Physique Quantiques - UMR5626 Directeur(s) de Thèse : Laganà Antonio, Evangelisti Stefano, Thierry Leininger Rapporteurs : Contents French summary 1 Introduction 21 1 Molecular Simulators 25 1.1 The general Schrodinger¨ equation . 25 1.2 The electronic structure . 26 1.3 The nuclei dynamics . 30 1.4 The chemical kinetics systems . 32 1.5 GEMS the GRID simulator . 35 1.6 The kinetics version of the workflow . 38 1.7 Bridging HTC to HPC . 39 2 Code interoperability in Quantum chemistry and Dynamics 45 2.1 Data of Ab initio Quantum Chemistry . 46 2.2 Data of Quantum Dynamics . 48 2.3 The data model: Q5cost . 49 2.4 The D5cost data model . 52 2.5 The Library . 53 2.6 Tools and Wrappers . 54 2.7 Performance and benchmarks . 57 3 High level ab initio calculations of small systems 61 3.1 Coupled-Cluster study: the electronic wavefunction of tetrahedral clusters . 61 3.2 Geometry optimizations of the tetrahedral clusters . 68 iii CONTENTS 3.3 No-pair bonding: Cu4 basis sets and correlated orbitals . 75 3.4 The no-pair bond state . 76 3.5 The BeH− anion: a Full CI investigation . 80 3.6 The FCI computational strategy . 82 3.7 Dissociation energy and equilibrium distance . 84 3.8 Analysis of the Charge Distribution . 87 4 HPTC for a Dynamical problem 95 4.1 The coordinate system and the investigated arrangements . 96 4.2 The lower level of theory calculations . 99 4.3 The supercomputer based higher-level of theory calculations 101 4.4 The fit of the ab initio potential energy values . 106 4.5 The CCSD(T) Potential Energy Surface . 108 4.6 The multi reference representation of the PES . 110 5 HPTC for a Kinetic problem 117 5.1 Model the kinetic of combustion reactions . 118 5.2 Low temperature oxidation of alkanes . 120 5.3 Ab initio study of an elementary process . 121 5.4 The evaluation of kinetic and thermochemical data . 127 Bibliography 137 iv French summary Introduction Les avancéesdans les sciences informatiques permettent au- jourd’hui l’étudeàpriori de systèmeschimiques complexes et permettent l’évaluationdétailléedes propriétésmacroscopiques de la matière sans recourir àdes considérationsempiriques ou a un mélangedes élémentsd’information provenant de différentes sources (hétérogèneset parfois contradictoires). Cela a étérendu possible par les progrèsde la chimie théorique(qui a produit une grande variétéde méthodeset de techniques qui permettant la simulation des processus des systèmesréelssur la base du premier principe) et l’évolutiondes plate-formes informatiques en réseau(qui de plus en plus permet l’utilisation combinée d’une grande quantitéde ressources informatiques distribuées et hétérogènes).La forte dépendancede la chimie computationnelle aux technologies informatiques est la force et la faiblesse des simulations moléculaires. En effet, dan le but de réaliser des étudesde ce type (mêmepour le systèmescontenant un pe- tit nombre d’atomes), il faut d’abord procédera des calculs de structure électronique de haut niveau. Ces calculs nécessitentgénéralementdes nœuds (ou cluster de nœuds) équipésde mémoires de grande taille (de l’ordre de plusieurs Go) et de processeurs performants (au niveau de plusieurs Gigaflops). Cette puissance est nécessaire parce que toute 1 FRENCH SUMMARY la surface d’énergie potentielle (PES) qui régitle mouvement nucléaire doit en généralêtre élaboréepréalablement. Sur les plateformes High Performance Computing (HPC) avec des capacitésparallèles améliorées,nous pouvons exécutersi- multanémentles calculs d’un grand nombre de valeurs d’énergie potentielle nécessaires pour décrire la PES exploréelors d’une réactionchimique. Le goulot d’étranglementdans la réalisation d’une telle campagne de calculs résidedans la disponibilitéd’une plateforme informatique ayant des capacitésde calcul appro- priéesen terme de temps de calcul et de mémoire physique. Les capacitésinformatiques (limitées)généralement mises àla dis- position de la communautéscientifique ont en fait toujours fixé des limites sévères àl’élaborationde simulations a priori de processus moléculaires. Heureusement, les technologies informatiques innovantes al- liant simultanéitéet mise en réseau(calcul distribué,labora- toires virtuels, supercalculateurs, Grid computing) ouvrent des perspectives nouvelles quant aux possibilitésd’obtenir débitde calcul importante et, par conséquent,de développerdes simulations moléculaires a priori de systèmesréels. Dans plusieurs domaines scientifiques, les chercheurs ont be- soin de plateformes donnant accèsàdes machines HPC et HTC permettant la modélisationde systèmesréelset la simulation de réalitévirtuelle fondéssur des approches multi-physiques et multi-échelles.Dans le cadre des activitésmenéespar la Che- mistry and Molecular & Material Sciences and Technology Com- munities (CMMST), COMPCHEM (l’Organisation Virtuelle (VO) pour la chimie computationnelle de l’infrastructure de la grille de calcul européenne(EGI)) est engagéedans la concep- tion et la mise en œuvre des applications de CMMST multi- échellescomme GEMS (the Grid Empowered Molecular Simu- lator). GEMS nécessite l’expertise complémentaire et l’utilisation de 2 différentes plateformes de calcul HPC et HTC pour exécuterdes packages dont les performances peuvent varier de plateforme en plateforme. L’utilisation de e-infrastructures HPC et HTC et l’interaction des grandes applications informatiques permettra non seulement de surpasser la situation actuelle, mais elle permettra égalementune optimisation de l’utilisation des ressources informatiques en réservantl’approche HPC aux tâches de calcul étroitement coupléeset en limitant le concept HTC aux tâchesréparties, évitantainsi de perdre une grande quan- titéde temps dans le transfert de données.Une coordination de ces deux types de plateformes pour interagir via un seul workflow et une gestion appropriéedes différentes composants sur le plus appropriédes deux systèmes,permettra une optimisation de l’utilisation des différentes ressources informatiques tout en offrant aux utilisateurs les meilleurs niveaux de performance possible. Simulateur Moleculaire´ Dèsle début,les bases de la chimie ont étéconstruites sur les concepts d’atomes et de molécules.La chimie théoriqueet computationnelle, dont l’unitéde référence et de l’ordre de fractions de nanomètre (typiquement le rayon de Bohr), est baséesur les lois physiques au niveau atomique. Par conséquent,tous les phénomèneset propriétésphysiques sont reconduites jusqu’à ce niveau atomique et moléculaire et nécessitentainsi une approche multi-échelle. La construction de simulateurs moléculaires ab initio est donc le bloc de départde toute rationalisation du comportement des 3 FRENCH SUMMARY systèmesphysiques. Un simulateur moléculaire est un ensemble de programmes et d’outils conduisant l’utilisateur àpartir des premiers principes jusqu’aux aux observables àtravers le calcul précisde quantitésélémentaires et de la moyenne de pa- ramètres non observables d’un systèmephysique. Un système physique caractérisépar un ensemble de coordonnéesnucléaires spatiales (R), de coordonnéesélectroniques (r) et par une co- ordonnéede temps t est entièrement représentépar une fonction ? (R, r, t), appeléefonction d’onde du système,décrivantla distribution spatiale et temporelle du système.L’équationde la mécaniquequantique régissantla dynamique du système,c’est àdire l’évolutiondu systèmeavec le temps, est l’équationde Schrödingerdépendantdu temps (TD) : ∂ ih¯ Y(R, r, t)=Hˆ Y(R, r, t) ∂t oùH est le hamiltonien, qui pour un systèmede N-particules se compose d’une partie cinétique(T) et d’un terme d’énergie potentielle (V). Afin de calculer les solutions numériquesadaptées, on peut envisager d’adopter différents schémasde découplage et/ou de simplification. Une première simplification est l’ap- proximation de Born-Oppenheimer (BO).En effet, comme les noyaux sont beaucoup plus lourds que les électrons et leurs vi- tesses beaucoup plus faibles, l’équationde Schrödingerpeut être diviséeen deux parties : une partie qui décritla fonction d’onde électronique pour une valeur fixe de R (géométrienucléaire) et une autre partie pour la fonction d’onde nucléaire, dans laquelle l’énergie électronique se présentesous la forme d’une fonction de R, V (R). La fonction V(R) est la PES sur laquelle les noyaux se déplacentsous l’effet combinédes gradients et de l’opérateurcinétique.L’observable physique mesuréetradition- nellement pour les processus réactifsest la constantes de vitesse thermique k(T). Nous pouvons utiliser deux techniques pour résoudre le problèmequantique : les méthodedépendantesdu 4 temps (TD) et les méthodeindépendantesdu temps (TI). Une différence fondamentale entre les deux approches est que dans le premier cas, on résoutles équationsrégissantle mouvement des noyaux en utilisant le temps comme variable de continuité alors que, dans le second cas, une nouvelle variable de conti- nuitédoit être élaborée.

Doctorat De L'université De Toulouse

Package Name Software Description Project

RMG-Py and Cantherm Documentation ⇌Release 2.0.0

Pyjac: Analytical Jacobian Generator for Chemical Kinetics

An Open-Source, Extensible Software Suite for CVD Process Simulation D

BIOVIA MATERIALS STUDIO OVERVIEW Datasheet

Quick Navigation Mechanical Engineering Department Facilities

A Partial Glossary of Spanish Geological Terms Exclusive of Most Cognates

BIOVIA Materials Studio CANTERA

Sustained Petascale in Action: Enabling Transformative Research 2019 Annual Report Sustained Petascale in Action: Enabling Transformative Research 2019 Annual Report

Construction, Analysis, and Modeling of Complex Reaction Systems Using

Easybuild Documentation Release 20170109.01

CANTERA Tutorials