Entrenamiento de neurona para reconocimiento de imágenes usando las bases de datos de MNIST Y CIFAR
1. Sr. Marlon Torres
Entrenamiento de neurona para reconocimiento de imágenes usando las bases de datos de
MNIST Y CIFAR
DATAFRAME DE LAS BASES DE DATOS:
MNIST
Fig. 1 DataFrame base de datos MNIST
CIFAR
Fig. 2 DataFrame base de daros CIFAR
2. Sr. Marlon Torres
Señales cardiacas
Fig. 3 DataFrame Base de datos de señales cardiacas
MATRICES DE CONFUSIÓN:
MNIST
Por el volumen de datos se demoró unas 4 veces más en entrenenarse que las otras,
exactamente 40 minutos, existen varios falsos negativos entre el 1 y el 7 así como entre el 9 y el
2, sin embargo la red sigue dentro de la categoría de excelente. Se trata de una falla tradicional
de la red neuronal que también puede equivocarse debido a la similitud entre los números al
ser escritos por diferentes personas, concluyendo que la red neuronal está correctamente
entrenada.
Tras las 5 épocas se obtuvo un acucuracy de 0.991000
La red confunde entre el 1 y el 7 pero no entre el 7 y el 1
Fig. 4 Matriz de confusión MNIST
3. Sr. Marlon Torres
CIFAR
Tras 5 épocas de entrenamiento la red neuronal tiene un accuracy global de 0.875000 entrando
apenas dentro de la categoría de excelente, sin embargo los resultados están por debajo de la
red de MNIST.
Al igual que en el caso anterior se trata de una falla tradicional del sistema debido a que tanto
el gato, perro y caballo son cuadrúpedos, en el caso del caballo hay menos errores seguramente
por el largo de sus patas y cuerpo que facilitan un poco más el diferenciarlo, pero como el gato
y el perro tienen proporciones corporales similares comete más errores.
En su mayoría se producen falsos positivos entre el perro y el gato y viceversa, existen pocos
falsos negativos.
Otro factor importante es el volumen de la base de datos ya que para este caso se trabajó
unicamente con 200 imágenes por clase, y se ven falsos negativos y falsos positivos incluso con
la rana que debería ser fácilmente diferenciable.
Fig. 5 Matriz de confusión CIFAR
Señales cardiacas
Para este caso la red neuronal no ha sido entrenada adecuadamente, el accuracy global es de
0.636364 recordando que se considera buena sobre el 0.65, pero en el caso puntual del CHF es
de apenas 0.38 generando una gran cantidad de falsos positivos y falsos negativos.
A pesar de que las señales fueron previamente tratadas los resultados no son buenos lo que
apunta a la escasa base de datos, constando de apenas 162 elementos para entrenar 3 clases,
por la naturaleza de las imágenes no se podría usar técnicas de data aumentation además de la
rotación que fue aplicada, en lugar de eso una buena alternativa sería obtener más imágenes a
partir de los tramos sobrantes de la señal, es decir generar las imágenes tomando tramos más
pequeños ejemplo 0:400; 400:800; 800:1200, etc., e irlos incluyendo a la base de datos.
4. Sr. Marlon Torres
Fig. 6 Matriz de confusión Señales cardiacas
TOP LOSSES:
MNIST
La peor es entre el 1 y el 7 con una probabilidad de 0.00 y se observa que de forma similar en el
resto de errores en los que confunde el 1 con el 7 la probabilidad es de apenas 0.01 excepto en
el quinto elemento que cabe recalcar parece más un 1 que un 7 sin embargo la probabilidad
sigue siendo baja.
Fig. 7 Top losses MNIST
CIFAR
Al igual que en el caso anterior la probabilidad se encuentra entre el 0.01 al 0.04
Fig. 8 Top losses CIFAR
5. Sr. Marlon Torres
Señales cardiacas
La base de datos usada para el entrenamiento es demasiado pequeña.
Fig. 9 Top losses señales cardiacas