[cat] L’objectiu principal d’aquest treball és realitzar una predicció dels resultats de les
properes eleccions dels Estats Units, que tendran lloc dia 8 de Novembre del 2016. Per
poder realitzar aquesta predicció necessitam aprofundir teòricament en una sèrie de
temes. En primer lloc s’introdueix la teoria de la regressió linealmúltiple que serà la
base del model que emprarem a l’hora de realitzar la predicció. D’especial interès serà
l’anàlisi dels residus útil per tal de determinar la bondat del model. A continuació,
s’introdueix la regressió lineal generalitzada i s’analitza el model que se’n deriva.
Una vegada explicada tota la base teòrica, s’aplica aquesta en la part pràctica per tal
d’aconseguir determinar un model que dugui una predicció acurada dels resultats de
les eleccions americanes. Es disposa d’una sèrie dades sobre variables demogràfiques,
econòmiques, socials, etc. dels 51 estats dels EstatsUnits corresponents per una banda a
l’any 2012, any de les anteriors eleccions, i per l’altra a l’any 2015 darrer any complet del
qual disposam de les dades. Així, a partir de les primeres, es proposen distints models
de regressió lineal múltiple o generalitzada, que ens permeten obtenir les prediccions
per aquestes properes eleccions emprant les dades del 2015. Abans de tot, aplicant
tècniques d’estadística descriptiva, s’analitzen les dades recopilades per determinar
correlacions entre variables, com han variat els valors d’una variable d’un any a l’altre i
si hi ha dades anòmales. Una vegada trobats els distints models, es determina quin és el
millor en base tant a la precisió del model com a la seva simplicitat, que permetrà una
interpretació significativa del model. Al final, es determina que el modelmés interessant
és un model de regressió lineal múltiple on s’han aplicat distintes transformacions en
les variables originals.
Per acabar realitzamla predicció emprant els distints models considerats. Es comprova
que elsmodels trobats donen uns resultats excessivament optimistes pel partit
republicà i s’analitzen les causes, concloent que la variable que indica el percentatge
d’atur ha de ser modificada, trobant uns millors models. En la predicció final obtenim
que amb 317 vots electorals el partit demòcrata se’n durà la victòria, seguit pel partit
republicà amb 142 vots electorals, mentre que 79 vots electorals corresponen a estats
indecisos. Una vegada realitzada la predicció es comenten les limitacions del model i
es comenten diverses possibles línies de millora. Entre les limitacions destaca que no
tenim en compte quin serà el candidat per a cada partit; pel que fa a les línies demillora
tenim que podríem haver considerat algunes variables de tipus factor comper exemple
de quin partit és el governador de cada estat o quin partit va guanyar les eleccions
anteriors.