Machine Learning Applied to Wind and Waves Modelling Aprendizaje
Total Page:16
File Type:pdf, Size:1020Kb
Machine Learning Applied to Wind and Waves Modelling Aprendizaje Automático Aplicado al Modelado de Viento y Olas Author: Montserrat Sacie Alcázar Bachelor’s Degree Final Project in Software Engineering Trabajo de Fin de Grado en el Grado de Ingeniería del Software Facultad de Informática Director: Dr. Matilde Santos Peñas Co-director: Dr. Rafael López Martínez Madrid, Academic Year 2019/2020 II Document created with LATEX prepared to be double-sided printed A mi familia. Este TFG y yo llevamos un poquito de vosotros Machine Learning Applied Montserrat to Wind and Waves Modelling Sacie Alcázar Agradecimientos Quiero dar las gracias a mi tutora Matilde Santos Peñas por confiar en mí, introducirme en el mundo de la energía eólica marina y guiarme en la elaboración del TFG y a mi co-tutor Rafael López Martínez por ofrecerme su conocimiento sobre los datos y estar siempre disponible para resolver mis dudas. Sin vosotros, este TFG no hubiera sido posi- ble. No puedo cerrrar este TFG sin antes emocionarme al dar las gracias a mis padres por darme la vida e inculcarme su fortaleza, motivación, constancia y trabajo duro necesarios para conseguir cualquier objetivo que me proponga en la vida. A mi hermano por ser mi referente y enseñarme lo que sabe por experiencia cuando yo aún no sé que camino es- coger. Gracias por tu silla también. A mi hermana por su apoyo durante todo el proceso y la tranquilidad que me transmite. Doy las gracias a todos mis seres queridos y amigos por confiar siempre en mí y hacerme el camino más llevadero. Y gracias a los profesores de instituto de los que no dejo de acordarme, en especial al profesor de física Marcos Naz que me infundó la pasión por la investigación científica y las ganas infinitas de aprender. Por último, quiero dar las gracias a mis profesores del grado de Ingeniería del Software y compañeros de clase por su apoyo y generosidad que hacen que la experiencia universitaria sea realmente bonita y enriquecedora. V Machine Learning Applied Montserrat to Wind and Waves Modelling Sacie Alcázar Abstract In the fight against climate change, Offshore wind energy is at the forefront, inthedevel- opment phase. The problem with turbines anchored to the seabed lies in the enormous cost of installation and maintenance, leading to the theoretical approach of floating off- shore wind turbines. However, floating turbines are exposed to new wave loads and stronger wind loads. To enable their implementation while maximizing the electricity production and ensuring the protection of the structure, more accurate predictive models than the physical and statistical ones found in the literature are needed for the metocean (meteorological and oceanographic) variables involved. This project aims to model the wind speed in the time domain, the significant waves height in the frequency domain and the misalignment between wind and waves direction in the time domain, applying Machine Learning techniques. Offshore data collection as well as an exploratory data analysis and data cleaning phases have been carried out. Subsequently, the following algorithms were applied to train the models: Linear Regression, Support Vector Machines for Regression, Gaussian Process Regression and Neural Networks. Nonlinear Autoregressive with exogenous input neural networks (NARX) have proved to be the best algorithm both for wind speed and mis- alignment forecasting and the most accurate predictive model for significant waves height prediction has been the Gaussian Process Regression (GPR). In this project we demonstrated the ability of Machine Learning algorithms to model wind variables of a stochastic nature and waves. We emphasize the importance of evaluating the models through techniques such as Learning Curves to make better decisions to optimize them. This work not only makes predictive models available for later use, but it is also a pioneer in misalignment modelling, leaving a door open for future research. VII Machine Learning Applied Montserrat to Wind and Waves Modelling Sacie Alcázar Key words • Data cleaning • Exploratory Data Analysis • Floating Offshore Wind Turbines • Machine Learning • Misalignment • Optimization • Regression • Waves models • Wind energy • Wind models IX Machine Learning Applied Montserrat to Wind and Waves Modelling Sacie Alcázar Resumen En la lucha contra el cambio climático, la energía eólica marina se sitúa en cabeza encon- trándose en fase de desarrollo. El problema de las turbinas ancladas al lecho marino reside en el enorme coste de instalación y mantenimiento, llevando al planteamiento teórico de turbinas eólicas marinas flotantes. Estas, sin embargo, están expuestas a nuevas cargas de olas y cargas de viento más fuertes. Para hacer posible su implantación maximizando la producción eléctrica a la vez que asegurando la protección de la estructura, se necesita disponer de modelos predictivos más precisos que los físicos y estadísticos de la literatura para las variables metoceánicas (meteorológicas y oceánicas) implicadas. El objetivo de este proyecto es modelar la velocidad del viento en el dominio del tiempo, la altura significativa de la ola en el dominio de la frecuencia y la desalineación entrela dirección del viento y de las olas en el dominio temporal, aplicando técnicas de Apren- dizaje Automático. Se ha llevado a cabo una fase de recopilación de datos medidos en alta mar, así como el análisis exploratorio y limpieza de los mismos. Posteriormente, para el entrenamiento de los modelos se aplicaron los algoritmos: Regresión Lineal, Máquinas de Vectores So- porte para Regresión, Proceso de Regresión Gausiano y Redes Neuronales. Las redes neuronales autorregresivas no lineales con entrada externa (NARX) han resultado ser el mejor algoritmo tanto para la predicción de la velocidad del viento como para la desalin- eación y para la altura significativa de la ola el modelo predictivo más preciso ha sidoel proceso regresivo gausiano (GPR). En este proyecto demostramos la capacidad de los algoritmos de Aprendizaje Automático para modelar las variables del viento de naturaleza estocástica y del oleaje. Destacamos la importancia de la evaluación de los modelos mediante técnicas como las Curvas de Aprendizaje para tomar mejores decisiones en la optimización de los mismos. Este trabajo no pone solo a disposición modelos predictivos para su posterior uso, además es pionero en el modelado de la desalineación dejando una puerta abierta a futuras investigaciones. XI Machine Learning Applied Montserrat to Wind and Waves Modelling Sacie Alcázar Palabras clave • Análisis Exploratorio de Datos • Aprendizaje Automático • Desalineación • Energía eólica • Limpieza de Datos • Modelos de olas • Modelos de viento • Optimización • Regresión • Turbinas eólicas marinas flotantes XIII Machine Learning Applied Montserrat to Wind and Waves Modelling Sacie Alcázar Contents List of Acronyms XIX List of Figures XXIV List of Tables XXVII 1 Introduction 1 1.1 Motivation ................................... 2 1.2 Goals ..................................... 3 1.3 Work plan ................................... 3 1.4 Repository ................................... 4 1.5 Structure of the project ........................... 5 2 State of art 7 2.1 Research context ............................... 7 2.1.1 Lines of study ............................. 9 2.2 Wind forecasting ............................... 10 2.2.1 Motivation .............................. 10 2.2.2 Time-scales of predictions ...................... 11 2.2.3 Models classification ......................... 11 2.2.3.1 Naive models ........................ 11 2.2.3.2 Physical models ...................... 12 2.2.3.3 Statistical models ..................... 12 2.2.3.4 Intelligent Models ..................... 14 2.3 Waves forecasting ............................... 15 2.3.1 Motivation .............................. 15 2.3.2 Significant waves height models ................... 16 2.3.3 Wind-wave misalingment studies .................. 17 2.4 Frequency domain vs. time domain in modelling .............. 18 3 Materials and methods 21 3.1 Used databases ................................ 21 3.2 Machine Learning ............................... 21 XV XVI CONTENTS 3.2.1 Introduction ............................. 22 3.2.2 Workflow of a standard ML application .............. 23 3.2.3 ML types ............................... 24 3.2.4 Model representation ......................... 25 3.2.5 Data pre-processing ......................... 26 3.2.5.1 Z-score ........................... 26 3.2.6 Unsupervised Learning ........................ 27 3.2.6.1 LDOF algorithm ...................... 27 3.2.6.2 PCA algorithm ....................... 27 3.2.7 Supervised learning Algorithms ................... 29 3.2.7.1 Linear Regression ..................... 29 3.2.7.2 Gaussian Process Regression ............... 31 3.2.7.3 Support Vector Machine for Regression ......... 33 3.2.7.4 Artificial Neural Networks ................. 34 3.2.8 Evaluation .............................. 39 3.2.8.1 Accuracy Metrics ..................... 39 3.2.8.2 Train/Validation/Test sets ................ 40 3.2.8.3 K-fold cross validation method .............. 41 3.2.8.4 Diagnosing Bias or Variance ............... 42 3.2.8.5 Learning Curves ...................... 42 3.2.9 Optimization methods ........................ 44 3.2.9.1 Regularization ....................... 44 3.2.9.2 Other decisions for optimization ............. 45 3.3 Matlab ..................................... 46 I Data Preparation 47 4 Data Collection 49 4.1 Santa Maria station,