134627.Pdf (2380Mb)

Universitat Politecnica` de Catalunya Grau en Enginyeria Informatica` Especialitat en Computacio´ TFG - Treball Final de Grau Estudi de l'algoritme NEAT aplicat als videojocs Autor: Mario Fernandez´ Villalba Director: Codirector: Luis Antonio Belanche Munoz~ Renè Alquezar Mancho Dept. de Ciencies` de la Dept. de Ciencies` de la Computacio´ Computacio´ Data de defensa: 23 d'octubre de 2018 Agra¨ıments Voldria agrair aquest projecte primerament a tots els professors de la Facultat d’Informàticade Barcelona que varen aconseguir convertir un home perdut en la vida a un informàticde cap a peus. Tambévoldria agrair-lo als meus amics i companys de la facultat: Carlos, Juan Miguel, Carlota, David, Jordi, Didac, ... Séque no esteu tots peròja sabeu qui sou! I en últimlloc peròno menys important, a la meva fam´ılia,que van tenir que aguantar el so que produ¨ıaal teclejar a altes hores de la nit durant setmanes. Gràciesa tots pel vostre suport! 1 Índex 1 Introducció 4 1.1 Context.........................................4 1.2 Actors implicats....................................7 1.3 Abast..........................................7 2 Gestiódel projecte9 2.1 Metodologia de treball.................................9 2.2 Eines utilitzades....................................9 2.3 Mètode de validació..................................9 2.4 Planificació....................................... 10 2.5 Integracióde coneixements.............................. 17 2.6 Lleis i regulacions.................................... 19 3 El videojoc Tetris i la seva implementació 20 3.1 Descripciódel joc.................................... 20 3.2 Accions disponibles................................... 20 3.3 Elements del joc.................................... 20 3.4 Sistema de puntuaciói nivells............................. 22 3.5 Game Over....................................... 23 3.6 Implementaciódel joc Tetris.............................. 23 4 Funcionament d'una xarxa neuronal i implementaciód'una xarxa neuronal simple 28 4.1 Processament de les dades............................... 28 4.2 Entrenament de la xarxa neuronal.......................... 28 4.3 La importànciadel bias................................ 29 4.4 Implementaciód'una xarxa neuronal simple..................... 29 5 L'algoritme NEAT i la seva implementació 31 5.1 Definicions dels elements propis d'un algoritme genètic............... 31 2 5.2 Representaciógenètica................................. 31 5.3 Operadors genèticsi la innovació........................... 32 5.4 Especiació........................................ 34 5.5 Generacióde nova població.............................. 34 5.6 Implementacióde l'algoritme NEAT......................... 35 6 Experimentacióamb l'algoritme NEAT 39 6.1 Bucle principal d’execució............................... 39 6.2 Experimentaciósobre la entrada........................... 40 6.3 Experiments sobre els paràmetresde l'algoritme................... 40 7 Pressupost i sostenibilitat 48 7.1 Pressupost........................................ 48 7.2 Sostenibilitat...................................... 53 8 Conclusions, possibles millores i opiniópersonal 55 8.1 Conclusions....................................... 55 8.2 Possibles millores.................................... 55 8.3 Opiniópersonal..................................... 56 3 1 Introducció Un dels temes recurrents a les pel·l´ıculesde ciència-ficcióésla intel·ligènciaartificial. Podem veure en aquestes pel·l´ıculesIAs que es rebel·len contra els humans, altres que recullen escom- braries... Aleshores, podria ser capa¸cun ordinador d'aprendre a jugar des de zero a un videojoc? L'objectiu d'aquest treball ésrespondre aquesta pregunta. Per fer aixòes vol estudiar l'algoritme genèticNEAT al videojoc Tetris. Concretament, es volen estudiar la influènciadels paràmetresde l'algoritme en l'acompliment d'aquest a l'hora de jugar. Aix´ımateix, tambées vol implementar tant l'algoritme NEAT com el joc Tetris. S'ha aconseguit implementar de manera satisfactòriatant NEAT com el videojoc Tetris utilitzant Visual Studio i Unity. Respecte als paràmetres,s'ha comprovat mitjan¸cant l'experimentació que paràmetrescom el nombre d'individus de la poblaciói les probabilitats de mutaciótenen un gran impacte en la generaciód'individus capa¸cosde jugar de manera satisfactòriaal joc. 1.1 Context Abans d'anar en profunditat amb les explicacions del videojoc i de l'algoritme es necessari obtenir una mica de context. 1.1.1 Evol·lucióde la IA en els jocs Durant els últimsanys la intel·ligènciaartificial (IA a partir d'ara) ha passat de ser un concepte clàssicde la ciència-ficcióa estar arrelada a les nostres vides. Les seves aplicacions sónquasi infinites, i no paren de créixercada dia. D'entre elles, cal destacar l’aplicacióen els jocs i posteriorment, videojocs. Una de les primeres vegades de la que es téconstànciaque la IA va ser aplicada als jocs va ser sobre l'any 1950, quan un programa d'escacs d'ordinador podia presentar un bon desafiament a un jugador experimentat [1]. Un altre exemple destacable de la IA aplicada als videojocs sónels jocs arcade com Space Invaders, on els enemics alteraven els seus patrons de moviment dependent del nivell de dificultat; o Pac-Man, que va introduir diferents IAs als enemics, els fantasmes. Molt ha passat des d'aleshores; l'any 2017 una IA desenvolupada per Google anomenada AlphaGo, va ser capa¸cde vèncer al campiómundial del Go, un joc tradicional xinèsen un confrontament a 3 partides [2]. Una de les eines utilitzades per aquesta eina son les ben conegudes xarxes neuronals, les quals introduirem en breu. Peròabans d’això...Com ha sigut l'evolucióde NEAT als videojocs? El mateix creador de l'algoritme NEAT, Kenneth O. Stanley, va fer una demostraciópràctica d'aquest en un videojoc programat per ell anomenat Neuroevolving Robotic Operatives (NERO) l'any 2005. En aquest joc, el jugador entrena un equip de robots virtuals per a competir contra altres equips controlats per altres jugadors. Va concloure que aquest joc demostrava la possibilitat de crear videojocs amb agents que evolucionen i s'adapten a temps real. [3]. Un altre joc desenvolupat per Stanley va ser Galactic Arms Race. En aquest joc el jugador controla una nau que va adquirint armes que han evolucionat a partir d'altres utilitzant infor- maciódel jugador i NEAT. Aquest joc va ser llen¸cata la coneguda plataforma online Steam, demostrant aix´ıque éspossible crear videojocs que generen el seu propi contingut per satisfer als jugadors, a la mateixa hora que es redueixen els costos de producciói s'augmenta la rejugabilitat 4 dels jocs [4]. L'any 2015 l'usuari de Youtube SethBling va postejar el v´ıdeo"MarI/O - Machine Learning for Video Games"[5], en el qual mostra l’aplicacióde l'algoritme NEAT en el videojoc Super Mario World. Sense cap coneixement previ d'aquest joc, la xarxa neuronal va ser capa¸cde superar el nivell Donut Plains 1 de l'esmenat joc desprésde 34 generacions de poblacions. Hi ha molts mésexemples d'aplicacions de NEAT als videojocs, peròal ser totes similars no cal incloure-les en aquest document. 1.1.2 Bases de les xarxes neuronals Una xarxa neuronal ésun model computacional que busca imitar el comportament dels cervells animals [6]. A l'igual que les xarxes neuronals que componen els nostres cervells, les xarxes neuronals artificials estan compostes per neurones. Una neurona ésuna unitat bàsicade càlcul de la xarxa neuronal que genera una sortida a travésd'una entrada assignada. Aquestes estan connectades entre si amb connexions ponderades i s'organitzen en forma de capes dins de la xarxa neuronal, de les quals es destaquen la d'entrada i la de sortida. A les capes restants intermèdies se les anomena capes ocultes. Anomenem topologia al conjunt de neurones i les connexions que les connecten. Podem veure aquesta estructura a la Figura1. Figura 1: Estructura d'una xarxa neuronal La següent pregunta que ens podem fer éscom funcionen les xarxes neuronals? Es técom a hipòtesique les persones aprenem per repetició,i ésen aixòen el que es basen les xarxes. Normalment, el procésde funcionament d'una xarxa neuronal es compon per dues parts, la d'aprenentatge i la de testing. Durant la part d'aprenentatge la xarxa es sotmesa a una gran quantitat de dades d'entrada per tal d'aprendre, o en altres paraules, ajustar els paràmetresinterns com les ponderacions de les connexions de la xarxa; per tal d'aconseguir el millor resultat en una tasca encomanada. Durant la part de testing es prova la xarxa entrenada en conjunts de dades diferents dels de l'aprenentatge, per tal d'estudiar el comportament d'aquestes en un cas general. Com a exemple il·lustratiu, AlphaGo va ser entrenat amb 30 milions de posicions de partides jugades per humans per tal d'aprendre a jugar al Go [7]. 5 Si encara voleu saber méssobre les xarxes neuronals, trobareu una explicaciómésexhaustiva d'aquestes a la Secció4. Les xarxes neuronals sónestudiades per un gran nombre de cient´ıfics, on cadascúbusca aportar el seu granet de sorra. Durant els diversos anys d'estudi han sorgit diversos models de xarxes neuronals i diversos algoritmes que les modifiquen. Com ja s'ha comentat, en aquest projecte ens centrarem en l'estudi de l'algoritme genèticNEAT. Que ésaleshores un algoritme genètic? 1.1.3 Algoritmes genètics Els algoritmes genèticssónuna fam´ıliad'algoritmes d’optimitzacióque basen la seva heur´ıstica en la selecciónatural [8][9]. Concretament, utilitzen les operacions biològiquesde mutació, encreuament i selecció. Aquests algoritmes requereixen dos components principals: una representaciógenèticadel domini de solucions i una funcióde fitness que avaluaràel domini de solucions. Un cop satisfets els dos requeriments, el funcionament dels algoritmes éssimple. Primerament s'inicialitza una poblacióde manera aleatòria. A continuació,comencem un bucle on s'avalua la poblaciógenerada mitjan¸cant la funcióde fitness, es seleccionen als millors individus i seguidament se li apliquen les operacions biològiquesanteriorment esmentades per tal de generar una poblaciófilla, i es torna a repetir el procés.

134627.Pdf (2380Mb)

Project Design: Tetris

Human-Computer Interaction in 3D Object Manipulation in Virtual Environments: a Cognitive Ergonomics Contribution Sarwan Abbasi

Homework 4: Tetronimoes

Tetromino Reptiles

A Speech Therapy Game for Children with Speech Sound Disorders

BOOK the Tetris Effect: the Game That Hypnotized the World

Description Implementation Discussion

A Comparison of Feature Functions for Tetris Strategies

LEVELING PAINS: CLONE GAMING and the CHANGING DYNAMICS of an INDUSTRY Nicholas M

Secure High Capacity Tetris-Based Scheme for Data Hiding

This Material Is Protected by Copyright and Is for the Personal Use of the Individual Smithline Training Subscriber Who Purchased Access to This Episode Only

Tetris Tetris Tetris TETRIS