El aprendizaje por refuerzo (RL) recibe un sistema de recompensas y castigos. El aprendizaje por refuerzo es más amplio que el aprendizaje supervisado o no supervisado para alcanzar un objetivo o simplemente beneficiarse de los incentivos y sanciones del contacto con el entorno.
¿En qué tipo de recompensas y castigos se dan como retroalimentación?
El primero es la retroalimentación evaluativa como refuerzo, donde las recompensas y los castigos se utilizan para dar forma al comportamiento del alumno a través de mecanismos de aprendizaje por refuerzo.
¿Cuáles son los tipos de recompensa y castigo?
Ahora combinemos estos cuatro términos: refuerzo positivo, refuerzo negativo, castigo positivo y castigo negativo (Tabla 1). Se agrega algo para aumentar la probabilidad de un comportamiento. Se agrega algo para disminuir la probabilidad de un comportamiento.
¿Qué tipo de aprendizaje se basa en el enfoque de recompensa y castigo?
De forma implícita, sin un procesamiento consciente, las personas aprenden sobre el valor de la recompensa y el castigo de cada contexto y actividad. Estos procesos de aprendizaje asociativo, a su vez, afectan la probabilidad de que las personas vuelvan a participar en tales actividades o busquen ese contexto.
¿Cómo influyen las recompensas y los castigos en el aprendizaje?
En general, vimos poco efecto de la recompensa en el aprendizaje o la retención. El castigo no tuvo efecto en la retención de habilidades, pero tuvo un efecto significativo,efectos dependientes de la tarea en el aprendizaje. En el castigo SRTT velocidad mejorada con un impacto mínimo en la precisión. Por el contrario, el castigo perjudicó el desempeño en el FTT.