Métodos De Aprendizaje Automático Aplicados a Problemas
Total Page:16
File Type:pdf, Size:1020Kb
UNIVERSIDAD NACIONAL DE CORDOBA´ Facultad de Matematica,´ Astronom´ıa y F´ısica TESIS DE DOCTORADO EN ASTRONOM´IA METODOS´ DE APRENDIZAJE AUTOMATICO´ APLICADOS A PROBLEMAS COSMOLOGICOS´ . AUTOR:LIC.MART´IN EMILIO DE LOS RIOS DIRECTORES:DR.MARIANO JAVIER DOM´INGUEZ Metodos´ de aprendizaje automatico´ aplicados a Problemas Cosmologicos´ por Mart´ın Emilio de los Rios se distribuye bajo una Licencia Creative Commons Atribucion´ 4.0 Internacional. I II 0.1. Palabras claves. Materia Oscura Cumulos´ de galaxias. Cosmolog´ıa. Aprendizaje Automatico.´ 0.2. Clasificaciones 02.70.Rr General statistical methods. 98.65.Cw Galaxy Clusters. 98.80.Es Observational cosmology. 95.35.+d Dark matter (stellar, interstellar, galactic, and cosmological). 95.36.+x Dark energy. III IV Los vicios de la humanidad demuestran lo poco que soy. Agradecimientos A mis viejos, Monica´ y Jorge por el apoyo incondicional. A mis hermanos, Macarena y Diego, porque sin saberlo me ensenan˜ cada d´ıa algo nuevo. A mis sobrinos, Valentina, Juan Lucas, Pietro, Teodelina y Felipe, por alegrar cada instante con sus sonrisas. A mis amigos, por hacer que el d´ıa a d´ıa no sea rutina. A mi director, Mariano Dominguez,´ por el buen humor, las ganas, la paciencia y, so- bretodo, uno que otro pick-and-roll. A mi abuela ‘nani’y mi amiga ‘tito’, por que aunque no las vea me ayudan a continuar. A todos mis colegas del IATE, por brindarme su ayuda y apoyo en todo momento y hacer de este instituto un hermoso lugar de trabajo. V VI Resumen. En este trabajo presentaremos el estudio de diferentes problemas cosmologicos´ me- diante la implementacion´ de tecnicas´ de aprendizaje automatico.´ En la primera parte de la tesis se presenta el marco teorico´ necesario para estudiar los diferentes problemas cos- mologicos´ que abordamos durante la tesis. Mientras que en el Cap´ıtulo1 se presenta una introduccion´ general sobre el modelo cosmologico´ estandar,´ en el Cap´ıtulo2 se detallan los principales algoritmos de aprendizaje automatico´ que se utilizaran´ durante este trabajo. Esta clase de algoritmos presenta una nueva forma de analizar grandes conjuntos de datos y de buscar correlaciones entre las variables involucradas en un dado problema. Habiendo sido aplicadas con mucho exito´ en diferentes areas´ de la ciencia y en diversos proble- mas tecnologicos,´ en este trabajo utilizamos dichos metodo´ para abordar 2 problemas as- tronomicos:´ la clasificacion´ de cumulos´ de galaxias segun´ su estado dinamico´ (Cap´ıtulo3) y el analisis´ estad´ıstico del fondo cosmico´ de microondas (Cap´ıtulo7). Adem as´ tambien´ se presenta un estudio estad´ıstico sobre la relacion´ entre el estado dinamico´ de los cumu-´ los de galaxias y los campos magneticos´ presentes en el medio intra-cumulo´ (Cap´ıtulo4) y una serie de estudios individuales (Cap´ıtulos5y6) sobre los candidatos a c umulos´ en interaccion´ identificados mediante algoritmos de aprendizaje automatico.´ Finalmente en el Cap´ıtulo8 se presenta un estudio te orico´ sobre las implicaciones observacionales que tendr´ıa una posible interaccion´ entre la materia oscura y los fotones del fondo cosmico´ de microondas. VII VIII Abstract. In this work we present studies with novel machine learning techniques about different cosmological problems. In the first part of the work we present the necessary theoretical framework to understand the astronomical problems that we will address. In Chapter1 we present an introduction of the standard cosmological model, while in Chapter2 we present the principal details of the Machine learning techniques that we will use. This kind of algorithms represent a new way of analysing big datasets and to find patterns and relations between the variables that are involved in an specific problem. While these techniques have been applied with a lot of success in technological problems and in other areas of science, we apply it for 2 astronomical issues: the dynamical classification of galaxy clusters (Chapter3) and the statistical study of the temperature anisotropies of the cosmological cosmic microwave background (Chapter7). We also present an statistical analysis of the relation between the dynamical status of galaxy clusters and the magnetic fields in their intra-cluster medium (Chapter4) and a series of individual studies of systems that were previously classify as merging clusters (Chapters5 and6). In the last Chapter (8) we introduce a theoretical study of the observational and cosmological implications that may have an interaction between the dark matter particle and the cosmic microwave background photons. IX X Indice´ general II 0.1. Palabras claves................................ III 0.2. Clasificaciones............................... III AgradecimientosV Resumen. VII Abstract. VIII 1. Modelo cosmologico´ estandar.´ 1 1.1. Descripcion´ general de la geometr´ıa y evolucion´ del universo.......1 1.2. El sector oscuro................................7 1.2.1. La materia oscura..........................8 1.2.2. Energ´ıa oscura............................ 22 Bibliograf´ıa 24 2. Introduccion´ a las tecnicas´ de aprendizaje Automatico.´ 39 2.1. Aprendizaje Supervisado........................... 41 2.1.1. Modelos de aprendizaje supervisado mas´ utilizados........ 41 2.1.2. Evaluacion´ de modelos y sobre-ajuste (Overfitting)........ 52 2.2. Aprendizaje No Supervisado......................... 57 2.2.1. Modelos de aprendizaje no supervisado mas´ utilizados....... 58 Bibliograf´ıa 62 XI XII Indice´ general 3. Construccion´ de un catalogo´ de cumulos´ en interaccion´ a partir de tecnicas´ de aprendizaje automatico.´ 65 3.1. Los cumulos´ en interaccion´ y su importancia en la cosmolog´ıa....... 66 3.1.1. Desafiando el modelo cosmologico´ estandar.´ ........... 67 3.1.2. L´ımites en la seccion´ eficaz de la materia oscura.......... 70 3.2. El algoritmo MeSsI (Merging Systems Identification)........... 72 3.2.1. Confeccion´ de la muestra de entrenamiento utilizando simulacio- nes cosmologicas.´ ......................... 72 3.2.2. Estimacion´ de features para la muestra de cumulos.´ ........ 75 3.2.3. Entrenamiento de diferentes modelos de aprendizaje automatico.´ . 78 3.2.4. Aplicacion´ del algoritmo MeSsI a catalogos´ reales........ 87 3.2.5. El caso de fusiones multiples.´ ................... 93 3.2.6. Conclusiones............................. 93 Bibliograf´ıa 95 4. Estudios estad´ısticos de cumulos´ segun´ su estado dinamico.´ 107 4.1. Introduccion.´ ................................ 107 4.2. Datos observacionales............................ 109 4.2.1. Conjunto de Cumulos´ de Galaxias.................. 109 4.2.2. Observaciones de la senal˜ de Rotacion´ de Faraday......... 112 4.3. Analisis´ estad´ıstico.............................. 113 4.3.1. Distribuciones de densidad..................... 116 4.4. Campos magneticos´ inferidos........................ 118 4.5. Conclusiones................................. 121 Bibliograf´ıa 123 5. Estudio individual de los candidatos a cumulos´ en interaccion´ A2029=33 y A1204. 129 5.1. Adquisicion´ de datos............................. 130 5.1.1. Observaciones fotometricas.´ .................... 130 5.1.2. Observaciones de la emision´ en rayos-X.............. 130 5.1.3. Catalogos´ espectroscopicos.´ .................... 131 Indice´ general XIII 5.2. Analisis´ de lentes debiles.´ .......................... 132 5.2.1. Identificacion´ y clasificacion´ de fuentes............... 132 5.2.2. Medida de la elipticidad de las galaxias de fondo.......... 133 5.2.3. Estimacion´ de las masas individuales de las subestructuras..... 135 5.2.4. Distribucion´ de densidad de masa proyectada............ 137 5.2.5. Resultados.............................. 138 5.3. Analisis´ dinamico.´ ............................. 138 5.3.1. Modelo de 2 cuerpos......................... 143 5.4. Conclusiones................................. 146 5.4.1. A1204................................ 146 5.4.2. A2029/A2033............................ 147 Bibliograf´ıa 148 6. Estudio individual del candidato a cumulo´ en interaccion´ A267. 157 6.1. Adquisicion´ de datos............................. 158 6.1.1. Catalogos´ espectroscopicos´ y fotometricos.´ ............ 158 6.1.2. Datos de la emision´ en rayos-X................... 158 6.1.3. Datos simulados........................... 159 6.2. Analisis´ dinamico´ y morfologico.´ ...................... 159 6.3. Grupos fosiles´ en simulaciones cosmologicas.´ ............... 164 6.4. Conclusiones................................. 165 Bibliograf´ıa 168 7. Estudio sobre la distribucion´ angular de los parametros´ cosmologicos.´ 175 7.1. Sobre el espectro de potencias de temperaturas del fondo cosmico´ de mi- croondas................................... 175 7.2. Analisis´ de componentes principales de los espectros de potencia..... 179 7.2.1. Tecnicas´ de Aprendizaje no supervisado aplicadas a las compo- nentes principales.......................... 183 7.3. CosmoML: Estimacion´ de los parametros´ cosmologicos´ mediante metodos´ de aprendizaje automatico´ supervisado................... 184 7.3.1. Estimacion´ de los parametros´ cosmologicos´ utilizando CMB+Supernovas.194 XIV Indice´ general 7.4. Distribucion´ angular de los parametros´ cosmologicos.´ ........... 196 7.4.1. Reconstruccion´ de los espectros de potencia............ 200 7.4.2. Estimacion´ de los parametros´ cosmologicos.´ ........... 203 7.4.3. Estimacion´ de la distribucion´ angular de los parametros´ cosmologi-´ cos en datos de PLANCK...................... 206 7.5. Conclusiones................................. 212 Bibliograf´ıa 214 8. Estudio sobre