Entrenar por más épocas una red neuronal no siempre resulta mejor

menos de 1 minutos de lectura

Relojes

En un ejercicio que nos dejaron durante la clase de la RIIAA, para detectar puntos de datos o registros de partículas subatómicas que correspondieran al Bosón de Higgs con una confianza de más de 4 sigmas, nos enseñaron a crear una red neuronal que se entrena por la cantidad de tiempo determinado por el programador, cada entrenamiento se llama una época (epoch).

Después de hacer muchos intentos y por expereincia propia (entrenando hasta por 100 épocas la red neuronal), comprobé algo que nos mostraron durante la clase y con lo que hay que tener cuidado a la hora de entrenar la red neuronal: entrenarla por más tiempo no significa que se comportará mejor, pero entrenarla menos tiempo del debido tampoco es una solución óptima.. La gráfica siguiente lo describe mejor:

Errores en una red neuronal sobre-entrenada

El punto es, para cada set de datos, encontrar el número de épocas que hay que entrenar la red para llegar al lugar de la gráfica que está antes que se empiece mover en zig-zag de arriba hacia abajo.

Actualizado:

Comentar