[cat] Aquest Treball Final de Grau (TFG) consisteix a exemplificar amb els videojocs si l’aprenentatge
automàtic d’una màquina és possible. A causa de la seva importància
històrica, s’ha escollit el Pong com a base per a l’estudi.
Per a l’aprenentatge s’ha dissenyat unmètode basat en dos conceptes principals:
les xarxes neuronals i els algoritmes genètics. Aquest mètode d’aprenentatge crea
una població inicial de xarxes neuronals que van evolucionant,modificant de manera
adient els seus pesos i biaixos, fins a trobar un individu que compleixi l’objectiu definit
per a l’algoritme. La funció objectiu per a l’avaluació de bones solucions en l’algoritme
genètic considera el nombre de pilotes retornades seguides. La condició de finalització
d’aquest serà també arribar a n pilotes retornades seguides, on n pot prendre els valors
de 20 o 200.
Per a l’estudi d’aquest mètode s’han dissenyat 4 videojocs basats en el Pong. Com a
prova de concepte, s’ha considerat un primer joc, que li diem Pong Simple, que retorna
la pilota amb el mateix angle i velocitat. El segon i tercer modifiquen com retorna la
paleta rival la pilota, variant aleatòriament la velocitat o l’angle de rebot respectivament.
El quart combina els anteriors.
Una vegada entrenades les xarxes neuronals, per a avaluar el grau d’assoliment
d’una solució, es considera el percentatge de pilotes que és capaç de retornar la xarxa.
Per a cada joc entrenat i una vegada seleccionat el millor individu de cada joc, es
consideren els resultats com a satisfactoris, ja que en el joc més complex el percentatge
de retorn era superior al 88%.
Al treball s’ha estudiat l’aprenentatge d’un joc fent ús d’un algoritme evolutiu. Com
a possible ampliació del treball aquest mateix model podria donar resposta a altres
tipus de problemes. Un camp d’investigació que actualment fa ús de models similars
és el de la conducció autònoma.