Modelo de predicción de los resultados de la prueba icfes saber 11 en el área de matemáticas a partir de variables socioeconómicas

Modelo de previsão de resultados de testes icfes saber 11 na área de matemática baseado em variáveis socioeconómicas

Authors

  • Yamile Peña Lozano
  • José John Fredy González Veloza

DOI:

https://doi.org/10.54021/seesv3n1-006

Keywords:

ICFES, socio-economic variables, Machine Learning, LightGBM, mathematics., / ICFES, variables socioeconómicas, Machine Learning, LightGBM, matemáticas.

Abstract

Con base en la encuesta realizada al momento de la inscripción de los estudiantes para la prueba ICFES Saber 11 y los resultados obtenidos en la prueba de matemáticas, se busca generar un modelo de predicción de los resultados a partir de las condiciones socioeconómicas de los estudiantes que presentarán este examen. Históricamente, en Colombia, El Instituto Colombiano para la Evaluación de la Educación, anteriormente “Instituto Colombiano para el Fomento de la Educación Superior” lleva a cabo la aplicación de pruebas de desempeño académico a nivel nacional, por medio de la cuál es posible realizar mediciones de las capacidades de los estudiantes, en algunas competencias académicas, buscando establecer el nivel educativo de cada estudiante.  Desarrollar un modelo predictivo para esta prueba, se utiliza la base de datos de los estudiantes que presentaron la prueba en 2020 analizando las variables género, estrato, número de personas que conforman el hogar, educación de la madre, acceso a Internet, disponibilidad de computadora en el hogar, horas de trabajo semanal del estudiante, naturaleza de la Institución Educativa, área de ubicación geográfica de la Institución Educativa y el puntaje de la prueba en matemáticas.  Se realiza la predicción mediante las técnicas de Machine Learning y el modelo LightGBM con la ayuda del paquete PyCaret de Python, obteniendo como variable más significativa el acceso a internet con un MAPE de 0.1741, un MAE de 8.0244 y un R2 de 0.2049 entre sus principales métricas. 

 

Based on the survey carried out at the time of enrollment of the students for the ICFES Saber 11 test and the results obtained in the mathematics test, the aim is to generate a prediction model of the results based on the socioeconomic conditions of the students who they will take this exam. Historically, in Colombia, the Colombian Institute for the Evaluation of Education, formerly "Colombian Institute for the Promotion of Higher Education", carries out the application of academic performance tests at the national level, through which it is possible to make measurements of the capacities of the students, in some academic competitions, seeking to establish the educational level of each student. To develop a predictive model for this test, the database of students who took the test in 2020 is used, analyzing the variables gender, stratum, number of people who make up the household, mother's education, Internet access, computer availability at home, weekly work hours of the student, nature of the Educational Institution, geographic location area of ​​the Educational Institution and the score of the test in mathematics. The prediction is performed using Machine Learning techniques and the LightGBM model with the help of the PyCaret Python package, obtaining as the most significant variable internet access with a MAPE of 0.1741, an MAE of 8.0244 and an R2 of 0.2049 among its main variables. metrics.

Downloads

Published

2022-01-13

How to Cite

Yamile Peña Lozano, & José John Fredy González Veloza. (2022). Modelo de predicción de los resultados de la prueba icfes saber 11 en el área de matemáticas a partir de variables socioeconómicas: Modelo de previsão de resultados de testes icfes saber 11 na área de matemática baseado em variáveis socioeconómicas. STUDIES IN ENGINEERING AND EXACT SCIENCES, 3(1), 52–68. https://doi.org/10.54021/seesv3n1-006