[cat] El volum i la importància de la informació que generen les xarxes socials creix de dia en dia i Twitter
és un gran referent en aquest àmbit. Poder analitzar
aquesta informació per tal de poder esbrinar la polaritat (positiu/negatiu) d’un missatge concret pot donar
un valor afegit a l’anàlisi automatitzat de textos, ajudant així en la presa de decisions estratègiques per
una determinada empresa o entitat. Si ens centram en
informació de tipus sanitari, les repercussions
d’aquesta anàlisi poden tenir una transcendència rellevant i influir directament en el conjunt de la societat.
En aquest treball de fi de màster (TFM) s’ha desenvolupat el panell de control d’un inspector sanitari
que inclou un sistema d’anàlisi de polaritats per tal
d’esbrinar, a partir d’un algoritme d’aprenentatge automàtic supervisat, si els missatges de caire sanitari
generats a Twitter a l’entorn de les Illes Balears són
positius o no. L’objectiu principal és que aquesta anàlisi juntament amb altres indicadors inclosos en el panell de control suposin una informació de suport en la
presa de decisions per una entitat com la Conselleria
de Salut. Per tal de seleccionar l’algoritme d’aprenentatge automàtic més adequat s’ha realitzat una comparativa per finalment seleccionar aquell algoritme de
classificació que ens ha proporcionat unes mesures de
precisió més elevades, sent finalment l’algoritme de
Support Vector Machines (SVM) el seleccionat.
[eng] The volume and importance of the information that
social networks generate grows day by day and Twitter is a great reference in this field. Being able to analyze this information in order to find out the polarity
of a specific message can give an intelligence point to
the automated analysis of texts that, at the same time,
can help in the making of strategic decisions for a
company or entity. If we focus on health information,
the impact of this analysis can directly influence the
society as a whole.
In this master's degree project, we have developed
the control panel of a health inspector that includes a
system of polarity analysis to find out if the health related messages generated on Twitter in the environment of the Balearic Islands are positive or non positive. We use supervised machine learning algorithms
to fulfill this goal. The main objective of this analysis,
along with other indicators included in the control
panel, is to provide support information in decision
making to an entity such as the «Conselleria de
Salut». In order to select the most appropriate machine learning algorithm, a comparison has been
made between different classification algorithms. We
have finally selected Support Vector Machines
(SVM) because it is the one that has released higher
accuracy measurements.