4. Justificación 1 Un factor importante es el tiempo de respuesta de los análisis para proceder a las acciones preventivas. Introducción a la Minería de Datos
5. Justificación 2 Mayores las frecuencias de algas, mayor la contaminación. Introducción a la Minería de Datos
6. Bibliotecas en R Bibliotecas (packages) en R almacenan funciones y conjuntos de dados. DMwR car lattice Hmisc … Introducción a la Minería de Datos
7. Conjuntos de datos Un conjunto de datos de entrenamiento. (algae_entrenamiento_regressionlineal.txt.txt) Un conjunto de datos de test (Validación). (algae_validacion_regressionlineal.txt.txt) Un conjunto de datos solución. (algae_validacion_regressionlinealsols.txt.txt) Introducción a la Minería de Datos
8. Conjunto de datos de entrenamiento Introducción a la Minería de Datos
9. Conjunto de datos de entrenamiento 8 variables continuas Máximo valor de pH (acidez) Valor medio de O2 (oxígeno) Valor medio de Cl_ (cloruro ) Valor medio de NO3_ (nitrato) Valor medio de NH4_(amonio ) Valor medio de PO43_ (ortofosfato) Valor medio de PO4 (fosfato) valor medio de clorofila 7 variables continuas Frecuencias de 7 algas. Introducción a la Minería de Datos
10. Conjunto de datos de test (validación) Consiste de un conjunto de datos de 140 registros con la misma estructura del conjunto de entrenamiento pero sin la información de la frecuencia de las algas. Introducción a la Minería de Datos
12. Etapas 5Modelo de Predicción: Regresión Múltiple 6 Modelo de Predicción: Árbol de Regresión 7Selección y evaluación de modelos 8Predicción del florecimiento de las algas Introducción a la Minería de Datos
50. 4Completar los NA con valores semejantes de otros registros Introducción a la Minería de Datos
51. 4Completar los NA con valores semejantes de otros registros Introducción a la Minería de Datos
52. 4Completar los NA con valores semejantes de otros registros Este enfoque esta implementado en la función knnImputation() disponible en la biblioteca DMwR. Introducción a la Minería de Datos
53. 4Completar los NA con valores semejantes de otros registros Introducción a la Minería de Datos