Energy Characterization and Savings in Single and Multiprocessor

Energy Characterization and Savings in Single and Multiprocessor Systems : Understanding how much can be saved and how to achieve it in modern systems Nicolas Triquenaux To cite this version: Nicolas Triquenaux. Energy Characterization and Savings in Single and Multiprocessor Systems : Understanding how much can be saved and how to achieve it in modern systems . Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Versailles Saint-Quentin-en-Yvelines, 2015. English. tel-01295567 HAL Id: tel-01295567 https://hal.archives-ouvertes.fr/tel-01295567 Submitted on 26 May 2016 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. Université de Versailles Saint-Quentin-en-Yvelines École Doctorale "STV" Étude et sauvegarde de la consommation énergétique dans un environnement simple et multi processeurs : Comprendre combien peut être sauvegardé et comment y arriver sur des systèmes modernes Energy Characterization and Savings in Single and Multiprocessor Systems : Understanding how much can be saved and how to achieve it in modern systems THÈSE présentée et soutenue publiquement le 18 Septembre 2015 pour l’obtention du Doctorat de l’université de Versailles Saint-Quentin-en-Yvelines (spécialité informatique) par Nicolas Triquenaux Composition du jury Directeur de thèse : William JALBY - Professeur, Université de Versailles Président : Claude TIMSIT - Professeur Emérite, Université de Versailles Rapporteurs : Christine EISENBEIS - Directeur de Recherche, INRIA Philippe CLAUSS - Professeur, Université de Strasbourg Examinateurs : Pierre VIGNERAS - Ingénieur de Recherche, ATOS Jean-Christophe BEYLER - Ingénieur de Recherche, Intel Remerciements Comme le dira chaque doctorant, il est facile de savoir quand une thèse commence mais beaucoup moins quand elle va finir et quel chemin elle va nous faire emprunter. Me voilà au bout du chemin. « Et heureux qui comme Ulysse, a fait un beau voyage », je tiens à remercier tous ceux qui ont jalonné ce périple de leurs présences, conseils et bonne humeur. Je tiens tout d’abord à remercier mon directeur de thèse, William Jalby, pour la confiance et la liberté qu’il m’a accordé tout au long de mes travaux de recherche. Je remercie ensuite M. Jean-Christophe Beyler de m’avoir proposé de faire une thèse, certes de manière quelque peu insistante dès le début de mon stage de fin d’étude. Je ne regrette en rien d’avoir décidé de le faire. Ceci m’a permis de voir jusqu’où je pouvais aller. Je le remercie aussi de m’avoir poussé dans mes moments de doutes. Un très grand merci à l’équipe énergie qui est née et morte avec moi. Sans eux, je me serais trouvé bien seul face à cette mer capricieuse et changeante qu’est la thèse. Je remercie Benoit Pradelle pour avoir repris le flambeau quand Jean-Christophe est parti découvrir de nouveaux horizons. Je remercie Amina Germouche pour son expertise en programmation linéaire et pour son entreprise d’import export de pâtisserie algérienne soignant tout vague à l’âme. Jean Philipe Halimi pour avoir partagé parfois des problèmes communs quand il a fallu étudier les processeurs xeon- phi d’Intel. Alexandre Laurent pour m’avoir aidé à concevoir les premières briques d’UtoPeak. Et à tous, pour avoir partagé de bon moments gastronomiques. Je remercie les rapporteurs pour avoir eu la patience de relire ma thèse juste avant leurs vacances. Je suis reconnaissant à Claude Timsit d’avoir su me donner goût à la recherche au cours de mes années d’étude et de m’avoir introduit au vaste monde du calcul scientifique. Enfin je remercie Pierre Vigneras de m’avoir laissé le temps de lui présenter mes travaux autour d’un café et d’avoir accepté de faire parti du jury. Je remercie Jean Thomas Acquaviva qui, bien que ne faisant plus partie du laboratoire, m’a aidé dans la constitution du jury de thèse et m’a poussé un peu lorsque je laissais le travail fourni chez DataDirect Networks prendre le pas sur la rédaction de ce présent manuscrit. Je remercie aussi Vincent Palomares, compagnon d’infortune, avec qui j’ai partagé une traversé du Styx mouvementé durant de longues nuits après avoir payé à Charon notre droit de passage en formulaire administratif. Je remercie aussi mon épouse d’avoir fait preuve d’une grande patience sur la fin de la rédaction. La thèse est une amante qui ne souffre d’être délaissée et « l’enfer n’a pas de furie comme une femme dédaignée » – William Congreve. Enfin je remercie ma belle-mère pour avoir fourni une expertise sans faille tout au long de la rédaction retirant en bien des endroits mes maladresses orthographiques et syntaxiques. Et je remercie aussi mes parents qui ont permis que je ne sois qu’a 15 minutes de marche de la faculté de Versailles. ii À l’optimisme iii Résumé: Bien que la consommation énergétique des processeurs a considérablement diminué, la demande pour des techniques visant à la réduire n’a jamais été aussi forte. En effet, la consommation énergétique des machines haute performance a crû proportionnellement à leurs accroissements en taille. Elle a atteint un tel niveau qu’elle doit être minimisée par tous les moyens. Les processeurs actuels peuvent changer au vol leurs fréquences d’exécution. Utiliser une fréquence plus faible peut mener à une réduction de leurs consomma- tions énergétiques. Cette thèse recherche jusqu’à quel point cette fonctionnalité, appelé DVFS, peut favoriser cette réduction. Dans un premier temps, une analyse d’une machine simple est effectuée pour une meilleure compréhension des différents éléments consommateurs afin de focaliser les optimisations sur ces derniers. La consommation d’un processeur dépend de l’application qui est exécutée. Une analyse des applications est donc effectuée pour mieux comprendre leurs impacts sur cette dernière. Basés sur cette étude, plusieurs outils visant à réduire cette consommation ont été créés. REST, adapte la fréquence d’exécution au regard du comportement de l’application. Le second, UtoPeak, calcule la réduction maximum que l’on peut attendre grâce au DVFS. Le dernier, FoREST, est créé pour cor- riger les défauts de REST et obtenir cette réduction maximum de la consommation énergétique. Enfin, les applications scientifiques actuelles utilisent généralement plus d’un processeur pour leurs exécutions. Cette thèse présente aussi une première tentative de découverte de la borne inférieure sur la consommation énergétique dans ce nouvel environnement d’exécution. Mots cléfs: Caractérisation de puissance, Caractérisation d’énergie, Contrôle des ventilateurs, Contrôle dynamique de fréquences, Profilage dynamique, Applications parallèles, Consommation énergétique minimale iv Abstract: Over the past decade, processors have drastically reduced their power consumption. With each new processor generation, new features enhancing the processor energy efficiency are added. However, the demand for energy reduction techniques has never been so high. Indeed, with the increasing size of high performance machines, their power and energy consumptions have grown accordingly. They have reached a point where they have to be reduced by all possible means. Current processors allow an interesting feature, they can change their operating frequency at run-time. As granted by transistor physics, lower frequency means lower power consumption and hopefully, lower energy consumption. This thesis investigates to which extent this processor feature, called DVFS, can be used to save energy. First, a simple machine is analyzed to have a complete understanding of the dif- ferent power consumers and where optimizations can be focused. It will be demon- strated that only fans and processors allow run-time energy optimizations. Between the two, the processor shows the highest consumption, therefore potentially exposing the higher potential for energy savings. Second, the power consumption of a processor depends on the applications being executed. However, there are as many applications as problems to solve. The focus is then put on applications to understand their impacts on energy consumption. Based on the gathered insights, multiple tools targeting energy savings on a single processor are created. REST, the most naive, tries to adapt the processor state to the stress generated by the application, hoping for energy reduction. The second, UtoPeak, computes the maximum energy reduction one can expect for any tool using DVFS. It allows to evaluate the efficiency of such systems. The last one, FoREST, was created in order to correct all the flaws of REST and target maximum energy reduction. Last, scientific applications generally need more than one processor to be executed in a decent time. The thesis also presents a first attempt to compute a lower bound in energy reduction when considering this new execution context. Keywords: Power characterization, Energy characterization, Fan control, Dynamic frequency scaling, Dynamic profiling, Parallel applications, Lowest energy consumption Contents 1 Introduction 1 I Power and Energy Popularization 5 2 Introduction 7 3 Metrics 9 3.1 Single Machine .............................. 9 3.2 Parallel Systems And

Energy Characterization and Savings in Single and Multiprocessor

Enea® Linux 4.0 Release Information

Linux Kernel and Driver Development Training Slides

Fixing USB Autosuspend Serge Y

Powerkap - a Tool for Improving Energy Transparency for Software Developers on GNU/Linux (X86) Platforms

SUSE Linux Enterprise Server 12 SP4 System Analysis and Tuning Guide System Analysis and Tuning Guide SUSE Linux Enterprise Server 12 SP4

Controlling Processor C-State Usage in Linux

Oracle Solaris Operating System: Optimized for Sun X86 Systems in the Enterprise

Profiling Energy Profilers

Dell Poweredge Systems Red Hat Enterprise Linux 5(X86 64, X86) Installation Instructions and Important Information

The Yocto Project Accelerating Embedded Product Development

Power Management Guide

Project 1: Boot Process of an Embedded System, Its BSP and Development Environment