Aprendizaje automático para el análisis evolutivo de Cáncer de mama
DOI:
https://doi.org/10.26910/issn.2528-8083vol3issCITT2017.2018pp44-49Palabras clave:
Análisis inteligente, Cáncer de mama, Aprendizaje automáticoResumen
El uso del aprendizaje automático permite la creación de un modelo predictivo de datos, como resultado del análisis en un conjunto de datos con 286 instancias y nueve atributos pertenecientes al Instituto de Oncología del Centro Médico Universitario. Ljubljana. En función de esta situación, los datos se preprocesan aplicando técnicas inteligentes de análisis de datos para eliminar los valores perdidos, así como la evaluación de cada atributo que permite la optimización de resultados. Utilizamos varios algoritmos de clasificación incluyendo árboles J48, bosque aleatorio, bayes net, bayes naive, tabla de decisiones, para obtener uno que, dadas las características de los datos, permita el mejor porcentaje de clasificación y por lo tanto una mejor matriz de confusión, utilizando 66% de los datos para aprendizaje y 33% para validar el modelo. Con este modelo, se obtiene un predictor con una eficacia del 71,134 % para estimar o no la recurrencia del cáncer de mama.
Descargas
Citas
Coleman, M. P., Quaresma, M., Berrino, F., Lutz, J.-M., De Angelis, R., Capocaccia, R., Baili, P., Rachet, B., Gatta, G., Hakulinen, T., et al. (2008). Cancer survival in ve continents: a worldwide population-based study (concord). The lancet oncology, 9(8):730–756.
Dimitoglou, G., Adams, J. A., and Jim, C. M. (2012). Comparison of the c4. 5 and a naïve bayes classi er for the prediction of lung cancer survivability. arXiv preprint arXiv:1206.1121.
Dunham, M. H. (2006). Data mining: Introductory and advanced topics. Pearson Education India.
Gharehchopogh, F. S. and Lot , Y. (2013). Machine learning based question classi cation methods in the question answering systems. Int J Innovat Appl Stud, 4(2).
Kohavi, R. (1995). The power of decision tables. In European conference on machine learning, pages 174– 189. Springer.
Liu, H. and Motoda, H. (1998). Feature extraction, construction and selection: A data mining perspective, volume 453. Springer Science & Business Media.
Livingston, F. (2005). Implementation of breiman’s random forest machine learning algorithm, in ece591q machine learning conference.
Patil, T. R. and Sherekar, S. (2013). Performance analysis of naive bayes and j48 classi cation algorithm for data classi cation. International Journal of Computer Science and Applications, 6(2):256–261.
Quadrianto, N., Petterson, J., Caetano, T. S., Smola, A. J., and Vishwanathan, S. (2010). Multitask learning without label correspondences. In Advances in Neural Information Processing Systems, pages 1957–1965.
Quinlan, J. (1993). C4. 5: Programs for machine learning morgan kaufmann publishers san francisco. CA Google Scholar.
Rimey, R. D. and Brown, C. M. (1992). Where to look next using a bayes net: Incorporating geometric relations. In European Conference on Computer Vision, pages 542– 550. Springer.
Witten, I. H., Frank, E., Hall, M. A., and Pal, C. J. (2016). Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann.
Zavoral, M., Suchanek, S., Zavada, F., Dusek, L., Muzik, J., Seifert, B., and Fric, P. (2009). Colorectal cancer screening in europe. World journal of gastroenterology: WJG, 15(47):5907.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Los autores mantienen los derechos sobre los artículos y por tanto son libres de compartir, copiar, distribuir, ejecutar y comunicar públicamente la obra bajo las condiciones siguientes:
Reconocer los créditos de la obra de la manera especificada por el autor o el licenciante (pero no de una manera que sugiera que tiene su apoyo o que apoyan el uso que hace de su obra).
No utilizar esta obra para fines comerciales.
Declaración de privacidad
Los nombres y direcciones de correo-e introducidos en esta revista se usarán exclusivamente para los fines declarados por esta revista y no estarán disponibles para ningún otro propósito u otra persona.