¿Qué es un horario de refuerzo?

¿Qué impacto tienen los horarios de refuerzo en el aprendizaje?

El condicionamiento operante es un proceso de aprendizaje en el que se adquieren y modifican nuevos comportamientos a través de su asociación con las consecuencias. Reforzar un comportamiento aumenta la probabilidad de que ocurra nuevamente en el futuro, mientras que castigar un comportamiento disminuye la probabilidad de que se repita. En el condicionamiento operante , los horarios de refuerzo son un componente importante del proceso de aprendizaje.

Cuándo y con qué frecuencia reforzamos un comportamiento puede tener un impacto dramático en la fuerza y ​​la velocidad de la respuesta.

¿Qué es un horario de refuerzo?

Entonces, ¿qué es exactamente un programa de refuerzo y cómo funciona en el proceso de acondicionamiento? Un programa de refuerzo es básicamente una regla que establece qué instancias de un comportamiento se reforzarán. En algunos casos, un comportamiento puede reforzarse cada vez que ocurre.

A veces, un comportamiento puede no ser reforzado en absoluto.

Se puede usar refuerzo positivo o refuerzo negativo , dependiendo de la situación. En ambos casos, el objetivo del refuerzo es siempre fortalecer el comportamiento y aumentar la probabilidad de que ocurra nuevamente en el futuro.

Puede tener una mejor idea de cómo funcionan los programas de refuerzo al pensar cómo se produce el aprendizaje tanto en situaciones de aprendizaje que se producen naturalmente como en situaciones de entrenamiento más estructuradas.

En entornos del mundo real, las conductas probablemente no se reforzarán cada vez que ocurran. En situaciones en las que intencionalmente intenta entrenar y reforzar una acción, como en el aula, en deportes o en entrenamiento con animales, puede optar por seguir un programa de refuerzo específico.

Como verá a continuación, algunos horarios son más adecuados para ciertos tipos de situaciones de entrenamiento. En algunos casos, el entrenamiento puede requerir comenzar con un horario y cambiar a otro una vez que se ha enseñado el comportamiento deseado. Ciertos horarios de refuerzo pueden ser más efectivos en situaciones específicas.

Hay dos tipos de programas de refuerzo:

Horarios de refuerzo continuo

En refuerzo continuo, el comportamiento deseado se refuerza cada vez que ocurre. Este programa se utiliza mejor durante las etapas iniciales de aprendizaje para crear una fuerte asociación entre el comportamiento y la respuesta.

Por ejemplo, imagine que está tratando de enseñarle a un perro a estrechar su mano. Durante las etapas iniciales de aprendizaje, probablemente se apegará a un cronograma continuo de refuerzo para enseñar y establecer el comportamiento. Puede comenzar por agarrar la pata del animal, realizar el movimiento de sacudida, decir "Sacudir" y luego ofrecer una recompensa cada vez que realice esta secuencia de pasos. Eventualmente, el perro comenzará a realizar la acción por sí mismo, y puede optar por continuar reforzando cada respuesta correcta hasta que el comportamiento esté bien establecido.

Una vez que la respuesta está firmemente unida, el refuerzo generalmente se cambia a un programa de refuerzo parcial.

Horarios parciales de refuerzo

En el refuerzo parcial o intermitente, la respuesta se refuerza solo una parte del tiempo . Los comportamientos aprendidos se adquieren más lentamente con un refuerzo parcial, pero la respuesta es más resistente a la extinción .

Por ejemplo, piense en nuestro ejemplo anterior en el que estaba entrenando a un perro para que lo sacudiera. Si bien inicialmente usó un cronograma continuo, reforzar cada una de las instancias del comportamiento puede no ser siempre realista. Eventualmente, puede optar por cambiar a un cronograma parcial donde proporcione refuerzo después de que se produzcan tantas respuestas o después de que haya transcurrido tanto tiempo.

Hay cuatro horarios de refuerzo parcial:

Los programas de relación fija son aquellos en los que una respuesta se refuerza solo después de un número específico de respuestas. Este programa produce una tasa alta y constante de respuesta con solo una breve pausa después de la entrega del reforzador. Un ejemplo de un programa de relación fija sería la entrega de un pellet de comida a una rata después de que presione una barra cinco veces.

Los programas de relación variable ocurren cuando se refuerza una respuesta después de una cantidad impredecible de respuestas. Este horario crea una alta tasa constante de respuesta. Los juegos de azar y lotería son buenos ejemplos de una recompensa basada en un programa de proporción variable. En una configuración de laboratorio, esto podría implicar la entrega de pellets de comida a una rata después de una barra de prensa, de nuevo después de cuatro prensas de barra, y un tercer pellet después de dos prensas de barra.

Los programas de intervalo fijo son aquellos en los que la primera respuesta se recompensa solo después de que ha transcurrido un período de tiempo específico. Este programa provoca altas cantidades de respuesta cerca del final del intervalo, pero responde mucho más lentamente inmediatamente después de la entrega del reforzador. Un ejemplo de esto en una configuración de laboratorio sería reforzar una rata con una pastilla de laboratorio para la primera presión de barra después de que haya transcurrido un intervalo de 30 segundos.

Las programaciones de intervalo variable ocurren cuando se recompensa una respuesta después de que ha pasado una cantidad de tiempo impredecible. Este horario produce una tasa de respuesta lenta y constante. Un ejemplo de esto sería la entrega de un pellet de comida a una rata después de la primera barra después de un intervalo de un minuto, otro pellet para la primera respuesta después de un intervalo de cinco minutos y un tercer pellet de comida para la primera respuesta después de un intervalo de tres minutos.

¿Cómo eliges un horario de refuerzo?

Decidir cuándo reforzar un comportamiento puede depender de una serie de factores. En los casos en los que específicamente está tratando de enseñar un nuevo comportamiento, un horario continuo es a menudo una buena opción.

Una vez que se ha aprendido el comportamiento, a menudo es preferible cambiar a un cronograma parcial.

En la vida diaria, los cronogramas parciales de refuerzo ocurren con mucha mayor frecuencia que los continuos. Por ejemplo, imagínese si recibió algún tipo de recompensa cada vez que se presentó a trabajar a tiempo. En cambio, tales recompensas generalmente se distribuyen en un cronograma de refuerzo parcial mucho menos predecible. Estos cronogramas no solo son mucho más realistas y fáciles de implementar, sino que también tienden a producir tasas de respuesta más elevadas y son menos susceptibles a la extinción.

De manera realista, reforzar un comportamiento cada vez que ocurre puede ser difícil y requiere una gran cantidad de atención y recursos. Los programas parciales no solo tienden a conducir a conductas que son más resistentes a la extinción, sino que también reducen el riesgo de saturación del sujeto. Si el reforzador que se usa ya no es deseado o no es gratificante, el sujeto puede dejar de realizar el comportamiento deseado.

Por ejemplo, imagine que está tratando de enseñarle a sentarse a un perro. Si está utilizando comida como recompensa, el perro puede dejar de realizar la acción una vez que esté lleno. En tales casos, algo como alabanza o atención podría ser un reforzador más efectivo.

Una palabra de

El condicionamiento operante puede ser una poderosa herramienta de aprendizaje. El programa de refuerzo utilizado durante el proceso de capacitación y mantenimiento puede tener una gran influencia en la rapidez con que se adquiere un comportamiento, la fuerza de la respuesta y la frecuencia con la que se muestra el comportamiento. Para determinar qué horario es preferible, es importante considerar diferentes aspectos de la situación, incluido el tipo de comportamiento que se enseña y el tipo de respuesta que se requiere.

> Fuentes:

> Cooper, J, Heron, T, y Heward, W. Applied Behavior Analysis . Nueva Jersey: Pearson Education; 2007.

> Nevid, JS. Fundamentos de la psicología: conceptos y aplicaciones. Boston, MA: Cengage Learning; 2016.