Estudio Comparativo De Frameworks De Instrumentación Dinámica De

Escuelade Ingenieríay Arquitectura Proyecto Fin de Carrera de Ingenier´ıa en Informática Estudio Comparativo de Frameworks de Instrumentación Dinámica de Ejecutables Juan Antonio Artal Lozano Director: Ricardo J. Rodr´ıguez Fernández Ponente: JoséJavier Merseguer Hernáiz Departamento de Informática e Ingenier´ıa de Sistemas Escuela de Ingenier´ıa y Arquitectura Universidad de Zaragoza Abril de 2012 Curso 2011/2012 A mi mujer, Conchita. Those types are not ’abstract’; they are as real as int and float. Doug McIlroy Agradecimientos A mis padres, hermanos y abuela. A todos mis compañeros de promoción. A Ricardo y su paciencia conmigo. A JoséMerseguer. A mis compañeros de trabajo. GRACIAS. Estudio comparativo de frameworks de Instrumentación Dinámica de Ejecutables RESUMEN La Instrumentación Dinámica de Ejecutables (Dynamic Binary Instrumentation, DBI) es una técnica muy potente que permite analizar el comportamiento, en tiempo de ejecución, de cualquier aplicación. DBI se puede usar, por ejemplo, para contar el número de instrucciones que ejecuta o contar todas las transferencias (lectura y/o escritura) a memoria que realiza un determinado programa. DBI tiene diferentes usos según sea el perfil de la persona que lo use. Por ejemplo, para un programador, DBI ayudaráa identificar las partes cr´ıticas del código; para un desarrollador de un procesador nuevo, DBI simularáesta nueva arquitectura; y para un programador de compiladores en una nueva arquitectura, DBI ayudaráa la colo- cación de las instrucciones para mejorar el paralelismo o cómo preparar profile-guided optimizacions (PGO). Un framework de DBI es una plataforma software que incluye programas, librer´ıas, do- cumentación y una API para manipulación de instrucciones en tiempo de ejecución. Exis- ten diferentes frameworks de DBI (p.e., Pin, Valgrind, DynamoRIO, Paradyn/Dyninst), que proporcionan APIs muy extensas para que cada ingeniero pueda desarrollar sus pro- pias herramientas de análisis dinámico, llamadas herramientas DBA (Dynamic Binary Analysis). Las herramientas DBA permiten analizar, generar optimizaciones y monito- rizar el comportamiento de programas. El objetivo de este PFC es realizar un estudio comparativo centrado a nivel de impacto en rendimiento (performance) de diferentes frameworks de DBI. Es decir, se com- probaráel rendimiento de una aplicación ejecutada de forma nativa, sin instrumentar, y se compararácon esta misma aplicación instrumentada por herramientas programadas bajo diferentes frameworks de DBI. De esta forma se obtiene el impacto en rendimiento de cada uno de los frameworks. Para poder llevar a cabo este estudio, se han seleccio- nado un conjunto de aplicaciones para crear un benchmark, que nos daráinformación de rendimiento de cada framework de DBI. Además, se pretende comparar cada framework de DBI atendiendo a las siguientes caracter´ısticas: plataformas y tipos de ejecutables que aceptan, necesidad de disponer del código fuente, API proporcionada, facilidad de programación de herramientas DBA, licencia/coste y la posibilidad de vincular a un proceso en ejecución. ii Índice 1. Introducción 1 1.1. Objetivo..................................... 2 1.2. Motivación ................................... 2 1.3. Organización del documento . .... 3 2. Conocimientos previos 5 2.1. GranularidadenDBI. .. .. .. .. .. .. .. .. .. 6 2.2. OrigendeDBI ................................. 7 3. Frameworks de DBI 9 3.1. Pin........................................ 10 3.2. Valgrind..................................... 11 3.3. DynamoRIO .................................. 11 3.4. Similitudes y diferencias entre estos frameworks . ........... 12 4. Trabajo relacionado 15 5. Creación de benchmark 17 5.1. Alternativas estudiadas . 17 5.2. Definicióndebenchmark. 17 5.3. Descripcióndelbenchmark . 20 5.4. Herramientasparaelbenchmark . 21 5.5. Medicionesenelbenchmark. 21 5.5.1. Tiempo ................................. 21 5.5.2. Memoria................................. 22 6. Experimentos 23 6.1. Entornodepruebas............................... 24 6.2. Resultados.................................... 24 7. Conclusiones y trabajo futuro 29 A. Fases de Desarrollo 35 A.1. Diagrama de Gantt ............................... 35 iii ÍNDICE ÍNDICE B. Problemas encontrados 37 B.1. Cuentadeinstrucciones . 37 B.2. Falloenejecución. 40 C. Aplicaciones usadas en el benchmark 43 C.1.bzip2....................................... 43 C.2.GNUgo ..................................... 44 C.3.hmmer...................................... 44 C.4.libquantum ................................... 44 C.5.h264ref...................................... 45 C.6.ripemd...................................... 45 C.7.aes........................................ 46 C.8.whirlpool .................................... 46 C.9.memtester.................................... 46 C.10.ffmpeg...................................... 47 C.11.milc ....................................... 47 C.12.povray...................................... 48 C.13.mlucas...................................... 48 C.14.namd ...................................... 48 C.15.linpack...................................... 49 D. Resultados del benchmark 51 D.1.bzip2....................................... 52 D.2.GNUgo ..................................... 53 D.3.hmmer...................................... 54 D.4.libquantum ................................... 55 D.5.h264ref...................................... 56 D.6.ripemd...................................... 57 D.7.aes........................................ 58 D.8.whirlpool .................................... 59 D.9.memtester.................................... 60 D.10.ffmpeg...................................... 61 D.11.milc ....................................... 62 D.12.povray...................................... 63 D.13.mlucas...................................... 64 D.14.namd ...................................... 65 D.15.linpack...................................... 66 D.16.Tiempo de ejecución de los benchmarks . ...... 67 E. Código fuente aplicaciones usadas en el benchmark 69 E.1. Instrumentación por instrucciones . ....... 69 E.1.1. Pin.................................... 69 E.1.2. DynamoRIO .............................. 70 E.1.3. Valgrind................................. 71 iv ÍNDICE ÍNDICE E.2. Instrumentación por bloques básicos . ........ 73 E.2.1. Pin.................................... 73 E.2.2. DynamoRIO .............................. 73 E.2.3. Valgrind................................. 74 v Indice de figuras 6.1. Tiempo de ejecución de la aplicación h264ref con instrumentación por instrucciones y optimizaciones. 25 6.2. Slowdown en el benchmark de ffmpeg con instrumentación por instruc- cionesyoptimizaciones. .. .. .. .. .. .. .. .. 25 6.3. Slowdown medio en el benchmark usando instrumentación por instrucciones. 26 6.4. Consumo medio de memoria de las aplicaciones. ....... 27 6.5. Slowdown en instrumentación por instrucciones y por bloques básicos por frameworksyoptimizaciones. 28 A.1.Diagramadegantt................................ 35 A.2.Horasdedicadas. ................................ 36 vii Indice de tablas 3.1. S.O./Arquitecturas soportadas por framework. ......... 12 3.2. Granularidades soportadas por framework. ........ 14 3.3. Similitudes y diferencias entre frameworks. .......... 14 5.1. Aplicaciones de cálculo entero. ...... 19 5.2. Aplicaciones de cálculo real. ...... 19 5.3. Aplicaciones con gran demanda de entrada/salida. ......... 19 5.4. Aplicaciones de acceso a memoria. 20 6.1. Hardware utilizado en las pruebas. ..... 23 6.2. Software utilizado en las pruebas. ...... 23 6.3. ConsumomediodememoriaporFramework. 27 6.4. Slowdown relativo entre instrucciones y bloques básicos. 28 A.1.Horasdedicadas. ................................ 36 B.1. Instrucciones contadas por framework de DBI. ....... 37 B.2. Instrucciones contadas para las aplicaciones whirlpool y memtester . 39 ix Cap´ıtulo 1 Introducción El término de instrumentación se refiere a la inserción de código adicional sobre un determinado software. Principalmente, hay dos tipos de instrumentación: de código fuente, cuando el programador añade l´ıneas de código antes de la compilación; y de ejecutable, si hay otra aplicación que modifica el programa una vez compilado. La instrumentación permite incorporar al programa desarrollado código adicional para recoger información en tiempo de ejecución, que principalmente tiene dos usos diferentes: para estudio de arquitecturas, donde se puede hacer modelado de cachés y simulación de instrucciones nuevas de procesadores; y para análisis de código, donde se puede generar información para análisis de rendimiento, p.e., para averiguar cuándo, dónde y por quénuestro código tarda tanto en ejecutar cierta tarea. Hay diferentes tipos de instrumentación, como la manual, en la que el programador añade directamente las l´ıneas de código que le interesan; como por ejemplo, para calcular tiempos de ejecución, contar eventos o llamadas a una interfaz de programación de aplicaciones (API). Hay herramientas tipo automated source level que modifican el código fuente para añadir instrumentación de acuerdo a una determinada configuración. Existen otros tipos de instrumentación como la asistida por el compilador, que es añadida en tiempo de compilación, y binary translation, donde se modifica el software con llamadas a una API de instrumentación para que la propia aplicación genere información en tiempo

Load more