Génération Automatique D'extensions De Jeux D'instructions De Processeurs

Génération automatique d’extensions de jeux d’instructions de processeurs Kevin Martin To cite this version: Kevin Martin. Génération automatique d’extensions de jeux d’instructions de processeurs. Génie logiciel [cs.SE]. Université Rennes 1, 2010. Français. tel-00526133 HAL Id: tel-00526133 https://tel.archives-ouvertes.fr/tel-00526133 Submitted on 13 Oct 2010 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. No d’ordre : 4150 ANNEE´ 2010 THESE` / UNIVERSITE´ DE RENNES 1 sous le sceau de l’UniversitéEuropéennede Bretagne pour le grade de DOCTEUR DE L’UNIVERSITE´ DE RENNES 1 Mention : Informatique Ecole´ doctorale MATISSE présentée par Kevin´ MARTIN préparéeàl’unitéde recherche UMR 6074 – Irisa Institut de Recherche en Informatique et Systèmes Aléatoires IFSIC Thèse soutenue àRennes le 7 septembre 2010 Gen´ eration´ devant le jury composéde : automatique Olivier DEFORGES´ Professeur INSA Rennes / président Daniel ETIEMBLE d’extensions Professeur UniversitéParis Sud 11 / rapporteur de jeux Fred´ eric´ PETROT´ Professeur ENSIMAG / rapporteur Philippe COUSSY d’instructions Maˆıtrede conférencesUniversitéBretagne Sud / examinateur de processeurs Christophe WOLINSKI Professeur Universitéde Rennes 1 / directeur de thèse François CHAROT Chargéde recherche INRIA / co-directeur de thèse Le temps est assassin et emporte avec lui les rires des enfants Mistral Gagnant Renaud Remerciements Je remercie Olivier Déforgesqui me fait l’honneur de présiderce jury. Je remercie Daniel Etiemble et FrédéricPétrotd’avoir acceptéla charge de rapporteur. Je remercie Philipppe Coussy qui a bien voulu juger ce travail. Je remercie bien sûrmon directeur de thèse,Christope Wolinski, et mon co-directeur de thèseFran¸coisCharot. Je remercie également le professeur Kuchcinski pour sa collaboration qui a fortement contribuéàla réussitede ces travaux. Je remercie toute l’équipe projet INRIA Cairn, en particulier Antoine Floc’h, Erwan Raffin, Steven Derrien, Florent Berthelot, Georges Adouko (en espérant qu’il soutienne sa thèseun jour), Laurent Perraudeau, Charles Wagner, Patrice Quinton, Pasha et Naeem, sans oublier les lannionais Emmanuel Casseau, Daniel Ménard,Daniel Chillet, Sébastien Pillement, Arnaud Tisserand, et le chef de projet Olivier Sentieys. Un grand merci également aux assistantes de projet qui m’ont aidéadministrativement, Céline,Isabelle, Elise et Nadia. Enfin, je remercie ma famille et mes amis qui m’ont toujours soutenu, mêmesi ils ne comprenaient rien àmes travaux. Et surtout, un grand merci àma femme Laouratou qui a mis au monde notre petit gar¸conN’ma¨ıLamine et qui s’en est largement occupéle temps que je finisse cette thèse. Merci àtous. Table des matieres` Introduction 1 1 Conception d’ASIP : méthodologies et outils 13 1.1 Conception complèted’ASIP . 14 1.1.1 Exemple du langage LISA . 14 1.1.2 Méthodologie . 18 1.2 Conception partielle d’ASIP . 21 1.2.1 Exemple . 21 1.2.2 Architecture des processeurs extensibles . 24 1.2.3 Méthodologie . 30 1.2.4 Compilation . 32 1.3 Synthèse. 36 2 L’extension de jeu d’instructions 39 2.1 Quels sont les problèmes àrésoudre? . 40 2.1.1 Motifs générésvs motifs prédéfinis . 40 2.1.2 Générationd’instructions . 41 2.1.3 Limites architecturales et technologiques . 44 2.1.4 Sélectiond’instructions . 46 2.1.5 Isomorphisme de graphes et de sous-graphes . 47 2.1.6 Exploitation des nouvelles instructions . 49 2.2 Quand les résoudre? . 50 2.2.1 A` la conception . 50 2.2.2 A` la volée . 51 2.3 Comment les résoudre? . 51 2.3.1 Recherche Tabou . 52 2.3.2 Recuit simulé. 52 2.3.3 Algorithme génétique . 53 2.3.4 Algorithme de colonies de fourmis . 54 2.3.5 Programmation dynamique . 54 2.3.6 Algorithmes gloutons . 55 2.3.7 Heuristiques . 56 v 2.3.8 Séparationet évaluation . 57 2.3.9 Programmation linéairepar nombres entiers . 58 2.3.10 Programmation par contraintes . 59 2.3.11 Comparaison des approches . 60 2.4 Synthèse. 62 3 L’identification d’instructions 65 3.1 Définitions. 65 3.2 Algorithme de générationde motifs . 66 3.2.1 Expansion d’un motif àpartir d’un nœud graine . 66 3.2.2 Limitation du nombre de motifs : Smart filtering . 67 3.2.3 La contrainte GraphMatch ........................ 68 3.3 Contraintes technologiques et architecturales . 69 3.4 Formalisation pour la programmation par contraintes . 70 3.4.1 Contrainte de connexité . 70 3.4.2 Contrainte sur le nombre d’entréeset de sorties . 74 3.4.3 Contrainte sur le chemin critique . 76 3.4.4 Contrainte de ressources . 77 3.4.5 Contrainte d’énergie . 77 3.5 Résultatsd’expérimentations . 78 3.5.1 Le processeur cible . 78 3.5.2 Environnement d’exécution . 78 3.5.3 Benchmarks . 78 3.5.4 Couverture maximale . 79 3.5.5 Discussion . 80 3.6 Conclusion . 82 4 Sélectiond’instructions et ordonnancement 83 4.1 Sélectiond’instructions . 83 4.1.1 Définitiond’une occurrence . 83 4.1.2 Définitiondu problèmede sélectiond’instructions . 84 4.1.3 Modélisationdu temps d’exécutiond’une occurrence . 90 4.1.4 Résultatsd’expérimentation . 93 4.2 Ordonnancement . 96 4.2.1 Placement . 97 4.2.2 Ordonnanceur . 97 4.2.3 Ordonnancement avec recalage d’instructions . 99 4.2.4 Optimisation sur les transferts de données. 101 4.2.5 Résultatsd’expérimentation . 104 4.3 Conclusion . 106 5 Générationd’architecture et adaptation du code 107 5.1 Architecture de l’extension . 109 5.1.1 Différents types d’instructions spécialisées . 109 5.1.2 Modèlesd’architecture . 110 5.2 Allocation de registres . 112 5.2.1 Contrainte Diff2 .............................113 5.2.2 Allocation de registres appliquéeau modèle A . 114 5.2.3 Allocation de registres appliquéeau modèle B . 118 5.3 Générationdes codes d’opérationet de la description de l’architecture . 133 5.3.1 Générationdes codes d’opérations . 133 5.3.2 Générationdu bloc logique spécialisé. 133 5.3.3 Générationdu chemin de donnéedes instructions spécialisées . 134 5.3.4 Fusion du chemin de données . 134 5.4 Générationdu code source modifié . 135 5.5 Générationpour la simulation SystemC . 135 5.5.1 SystemC . 135 5.5.2 SoCLib . 136 5.5.3 Générationdes instructions spécialiséespour le modèledu NiosII . 136 5.6 Conclusion . 136 6 Déroulement du flot appliquéàl’algorithme GOST 139 6.1 Le flot de conception DURASE . 139 6.1.1 Gecos . 141 6.2 L’algorithme de chiffrement GOST . 143 6.3 Déroulement du flot étape par étape appliquéàl’algorithme de chiffrement GOST . 143 6.3.1 Paramètresd’entrée . 144 6.3.2 Partie frontale . 144 6.3.3 Créationd’une extension . 147 6.3.4 Générationd’architecture . 158 6.3.5 Adaptation du code . 161 6.3.6 Validation par simulation avec SoCLib . 162 6.3.7 Résumé . 164 6.4 Proposition d’architecture . 164 6.5 Conclusion . 165 Conclusion 167 Publications 171 Bibliographie 173 Glossaire ALU Arithmetic Logic Unit ASIC Application Specific Integrated Circuit ASIP Application Specific Instruction-set Processor CDFG Control Data Flow Graph CFG Control Flow Graph CIS Composant Instruction Spécialisée CPLD Complex Programmable Logic Device DAG Directed Acyclic Graph DFT Data Flow Tree DSP Digital Signal Processor FPGA Field Programmable Gate Array GHDC Graphe Hiérarchiséaux Dépendances Conditionnées GPP General Purpose Processor HCDG Hierarchical Conditional Dependency Graph ILP Integer Linear Programming IP Intellectual Property ISA Instruction Set Architecture LE Logic Element LUT Look-Up Table MIMD Multiple Instruction Multiple Data MISD Multiple Instruction Single Data MMU Memory Management Unit RISC Reduced Instruction Set Processor RPU Reconfigurable Processing Unit RTL Register Transfer Level SHA Secure Hash Algorithm SIMD Single Instruction Multiple Data SISD Single Instruction Single Data UAL UnitéArithmétiqueet Logique VHDL VHSIC Hardware Description Language VHSIC Very High Speed Integrated Circuit VLIW Very Long Instruction Word ix Introduction Les systèmesembarquésont aujourd’hui envahi notre quotidien par le lot de services qu’ils apportent : téléphoniemobile, navigation automobile, multimédia(photo, vidéo,musique), assistants électroniques,entre autres. Un processeur embarqué,simple et peu cher àmettre en œuvre, est la solution idéalepour de tels systèmes.Mais pour faire face aux demandes exigeantes en termes de performance, de surface de silicium et de consommation d’énergie,ces systèmess’appuient sur des solutions matériellesadaptées aux besoins des applications. Une stratégietrèsrépanduelors de leur conception consiste alors àassocier des circuits intégrésspécialisésàun processeur généralisteàbas coût. Par exemple, de nombreux produits commerciaux associent un processeur ARM [22] avec des circuits spécialisés: téléphonemobile (Nokia N97), lecteurs multimédia(Archos 604), GPS (Mio Moov 500).

Load more