Evaluación de Métodos para la Imputación de Datos en Series Temporales de Variables Meteorológicas del Norte de Chile Utilizando Técnicas para el Análisis de Datos

Abstract:

El estudio del cambio climático por medio de los Indicadores de Extremo Climático para mitigar sus efectos se ha vuelto muy relevante en los últimos años. Estos indicadores requieren los datos de temperatura y precipitación de las estaciones meteorológicas para su cálculo, siendo muy importante la completitud de estos. En el caso de Norte de Chile las series temporales de las estaciones meteorológicas presentan problemas de datos vacíos, por lo que, en este artículo se evalúan distintos métodos para la imputación de datos con el objetivo de identificar los que puedan mejorar la calidad de las series temporales referente a su completitud y representatividad en el comportamiento de las variables meteorológicas. Para lo anterior, se utiliza la metodología CRISP-DM adaptada para estructurar las fases de la investigación, se realizan análisis de errores residuales y correlación para evaluar los métodos, destacando como resultado que los mejores métodos son CLP, IDC y RN dependiendo de la variable, concluyendo que existe más de un método con mínimo error residual y de correlación positiva que puede ser utilizado para la imputación de datos en las variables meteorológicas del Norte de Chile.