[spa] En este trabajo se presenta un estudio sobre la
clasificación de casos clínicos del Programa de
Detección Precoz de Cáncer de Colon [10], en
concreto un análisis de los resultados del programa en
el sector sanitario del Hospital Comarcal de Inca.
El objetivo de este estudio es crear un sistema de
aprendizaje supervisado para la clasificación de los
casos en leves o graves para poder ser priorizados, y
en la importancia de cada atributo dicha clasificación.
Este trabajo se estructura en una serie de pasos como
es la identificación de los datos y los sistemas de
información en los que se almacenan, su obtención y
preparación en un dataset y la creación de los
modelos de clasificación.
Se han aplicado diferentes técnicas k-neigbours,
árboles y random forest para la creación de dichos
modelos.
Los resultados han sido parcialmente satisfactorios
porque no se ha podido crear un modelo con una
buena precisión de clasificación, pero si se han
obtenido otros resultados interesantes.
[eng] The main purpose of this study is classify the
population by the risk of developing colorectal cancer
cancer. The data has been collected from patients who
have attended the program screening in Inca Hospital.
Early detection of servere cases could hep to
priorizatize these pacients and improve the efficiency
of screening with lower cancer incidence and
mortality.
Three different methods of unsupervised learning
have been applied: K-neighbours, Trees and Random
Forest in order to create serveral risk models
predictions.
Results obtained have not been as accurate as we
expected, and models have to be rebuild and
improved by the addition of more samples and some
variables as diet or smoking. Otherwise some
interesant results have been obtanied confirming que
the list of medication studied probably lower the risk
of colorectal cancer.