¿Qué es un conjunto reservado? A veces denominado como datos de "prueba", un subconjunto reservado proporciona una estimación final del rendimiento del modelo de aprendizaje automático después de haber sido entrenado y validado. Los conjuntos de reserva nunca deben usarse para tomar decisiones sobre qué algoritmos usar o para mejorar o ajustar algoritmos.
¿Es mejor la validación cruzada que la retención?
La validación cruzada suele ser el método preferido porque le da a su modelo la oportunidad de entrenar en múltiples divisiones de prueba de entrenamiento. Esto le brinda una mejor indicación de qué tan bien funcionará su modelo en datos no vistos. Hold-out, por otro lado, depende de una sola división de prueba de tren.
¿Qué es el enfoque de exclusión?
El
Holdout Method es el método más sencillo para evaluar un clasificador. En este método, el conjunto de datos (una colección de elementos de datos o ejemplos) se separa en dos conjuntos, denominados conjunto de entrenamiento y conjunto de prueba. Un clasificador realiza la función de asignar elementos de datos en una colección determinada a una categoría o clase objetivo.
¿Debería hacer siempre validación cruzada?
En general, la validación cruzada es siempre necesaria cuando necesita determinar los parámetros óptimos del modelo, para la regresión logística, este sería el parámetro C.
¿Cuál es la ventaja de la validación cruzada K-fold?
si se comparan, los MSE de prueba son mejores en el caso de CV k-fold que LOOCV. K-fold CV o cualquier CV o métodos de remuestreo nomejorar los errores de prueba. estiman errores de prueba. en el caso de k-fold, hace mejor trabajo al estimar el error que LOOCV.