¿Qué es el condicionamiento operante y cómo funciona?

Cómo el refuerzo y el castigo modifican el comportamiento

El condicionamiento operante (a veces referido como acondicionamiento instrumental ) es un método de aprendizaje que ocurre a través de recompensas y castigos por comportamiento. A través del condicionamiento operante, se establece una asociación entre un comportamiento y una consecuencia para ese comportamiento.

Por ejemplo, cuando una rata de laboratorio presiona un botón azul, recibe una bolita de comida como recompensa, pero cuando presiona el botón rojo recibe una leve descarga eléctrica.

Como resultado, aprende a presionar el botón azul pero evita el botón rojo.

Pero el condicionamiento operante no es solo algo que tiene lugar en entornos experimentales mientras se entrenan animales de laboratorio; también juega un papel importante en el aprendizaje diario. El refuerzo y el castigo tienen lugar casi todos los días en entornos naturales, así como en entornos más estructurados, como el aula o las sesiones de terapia.

Echemos un vistazo más de cerca cómo se descubrió el condicionamiento operante, el impacto que tuvo en la psicología y cómo se usa para cambiar los comportamientos anteriores y enseñar otros nuevos.

La historia del condicionamiento operante

El condicionamiento operante fue acuñado por el conductista BF Skinner , que es la razón por la que de vez en cuando puedes escucharlo como un condicionamiento skinneriano. Como conductista, Skinner creía que no era realmente necesario mirar los pensamientos y las motivaciones internas para explicar el comportamiento. En cambio, sugirió, deberíamos mirar solo las causas externas y observables del comportamiento humano.

Durante la primera parte del siglo XX, el conductismo se había convertido en una fuerza importante dentro de la psicología. Las ideas de John B. Watson dominaron esta escuela de pensamiento desde el principio. Watson se centró en los principios del condicionamiento clásico , una vez famoso sugiriendo que podía tomar a cualquier persona independientemente de sus antecedentes y entrenarlos para que sea lo que él elija.

Donde los primeros conductistas habían centrado sus intereses en el aprendizaje asociativo, Skinner estaba más interesado en cómo las consecuencias de las acciones de las personas influían en su comportamiento.

Skinner usó el término operante para referirse a cualquier "comportamiento activo que opera sobre el medio ambiente para generar consecuencias". En otras palabras, la teoría de Skinner explica cómo adquirimos el rango de conductas aprendidas que exhibimos todos los días.

Su teoría fue fuertemente influenciada por el trabajo del psicólogo Edward Thorndike , que había propuesto lo que llamó la ley del efecto . De acuerdo con este principio, es más probable que se repitan las acciones que siguen los resultados deseables, mientras que las medidas seguidas por resultados indeseables tienen menos probabilidades de repetirse.

El condicionamiento operante se basa en una premisa bastante simple: las acciones que son seguidas por el refuerzo se fortalecerán y es más probable que vuelvan a ocurrir en el futuro. Si cuenta una historia divertida en clase y todo el mundo se ríe, probablemente sea más probable que vuelva a contar esa historia en el futuro. Si levanta la mano para hacer una pregunta y su profesor alaba su comportamiento educado, será más probable que levante la mano la próxima vez que tenga una pregunta o comentario.

Debido a que el comportamiento fue seguido por el refuerzo o un resultado deseable, las acciones anteriores se fortalecen.

Por el contrario, las acciones que resultan en castigo o consecuencias indeseables se debilitarán y es menos probable que vuelvan a ocurrir en el futuro. Si vuelves a contar la misma historia en otra clase, pero esta vez nadie se ríe, es menos probable que vuelvas a repetir la historia en el futuro. Si gritas una respuesta en clase y tu profesor te regaña, es menos probable que vuelvas a interrumpir la clase.

Tipos de Comportamientos

Skinner distinguió entre dos tipos diferentes de comportamientos

Si bien el condicionamiento clásico podría explicar las conductas de los encuestados, Skinner se dio cuenta de que no podía explicar una gran cantidad de aprendizaje. En cambio, Skinner sugirió que el condicionamiento operante tenía mucha más importancia.

Skinner inventó diferentes dispositivos durante su infancia y puso estas habilidades a trabajar durante sus estudios sobre el condicionamiento operante.

Creó un dispositivo conocido como una cámara de acondicionamiento operante, a la que a menudo se hace referencia hoy como una caja de Skinner . La cámara era esencialmente una caja que podía contener un pequeño animal como una rata o una paloma. La caja también contenía una barra o llave que el animal podía presionar para recibir una recompensa.

Para rastrear las respuestas, Skinner también desarrolló un dispositivo conocido como grabador acumulativo. El dispositivo registró las respuestas como un movimiento hacia arriba de una línea, de modo que las tasas de respuesta pudieran leerse mirando la pendiente de la línea.

Componentes del condicionamiento operante

Hay varios conceptos clave en el condicionamiento operante.

Refuerzo en condicionamiento operante

El refuerzo es cualquier evento que fortalece o aumenta el comportamiento que sigue. Hay dos tipos de reforzadores:

  1. Los refuerzos positivos son eventos o resultados favorables que se presentan después del comportamiento. En situaciones que reflejan un refuerzo positivo, una respuesta o comportamiento se fortalece mediante la adición de algo, como el elogio o una recompensa directa. Por ejemplo, si hace un buen trabajo en el trabajo y su gerente le da una bonificación.
  2. Los reforzadores negativos implican la eliminación de eventos o resultados desfavorables después de mostrar un comportamiento. En estas situaciones, una respuesta se ve reforzada por la eliminación de algo que se considera desagradable. Por ejemplo, si su hijo comienza a gritar en el medio de la tienda de comestibles, pero se detiene una vez que le da un regalo, será más probable que le dé un regalo la próxima vez que empiece a gritar. Su acción condujo a la eliminación de la condición desagradable (el niño grita), reforzando negativamente su comportamiento.

En ambos casos de refuerzo, el comportamiento aumenta.

Castigo en condicionamiento operante

El castigo es la presentación de un evento o resultado adverso que causa una disminución en el comportamiento que sigue. Hay dos tipos de castigo:

  1. El castigo positivo , a veces denominado castigo por aplicación, presenta un evento o resultado desfavorable para debilitar la respuesta que sigue. Nalgadas por mala conducta es un ejemplo de castigo por aplicación.
  2. El castigo negativo , también conocido como castigo por remoción, ocurre cuando se elimina un evento o resultado favorable después de que ocurre un comportamiento. Quitar el videojuego de un niño después de la mala conducta es un ejemplo de castigo negativo.

En ambos casos de castigo, el comportamiento disminuye.

Horarios de refuerzo

El refuerzo no es necesariamente un proceso directo y hay una serie de factores que pueden influir en la rapidez y la capacidad de aprender cosas nuevas. Skinner descubrió que cuando y con qué frecuencia se reforzaban los comportamientos desempeñaba un papel en la velocidad y la fuerza de la adquisición. En otras palabras, el momento y la frecuencia del refuerzo influyeron en cómo se aprendieron nuevos comportamientos y cómo se modificaron los comportamientos antiguos.

Skinner identificó varios programas diferentes de refuerzo que afectan el proceso de acondicionamiento operante:

  1. El refuerzo continuo implica la entrega de un refuerzo cada vez que ocurre una respuesta. El aprendizaje tiende a ocurrir con relativa rapidez, sin embargo, la tasa de respuesta es bastante baja. La extinción también ocurre muy rápidamente una vez que se detiene el refuerzo.
  2. Los programas de relación fija son un tipo de refuerzo parcial. Las respuestas se refuerzan solo después de que se haya producido un número específico de respuestas. Esto generalmente conduce a una tasa de respuesta bastante estable.
  3. Los horarios de intervalo fijo son otra forma de refuerzo parcial. El refuerzo ocurre solo después de que ha transcurrido un cierto intervalo de tiempo. Las tasas de respuesta permanecen bastante estables y comienzan a aumentar a medida que el tiempo de refuerzo se acerca, pero se desaceleran inmediatamente después de que se ha entregado el refuerzo.
  4. Los programas de relación variable también son un tipo de refuerzo parcial que implican un comportamiento reforzado después de un número variado de respuestas. Esto conduce a una tasa de respuesta alta y tasas de extinción lentas.
  5. Los programas de intervalos variables son la forma final de refuerzo parcial descrito por Skinner. Este cronograma implica entregar refuerzo después de que ha transcurrido un tiempo variable. Esto también tiende a conducir a una tasa de respuesta rápida y una tasa de extinción lenta.

Ejemplos de condicionamiento operante

Podemos encontrar ejemplos de condicionamiento operante en el trabajo a nuestro alrededor. Considere el caso de los niños que completan la tarea para ganar una recompensa de un padre o maestro, o los empleados que terminan proyectos para recibir elogios o promociones.

Algunos ejemplos más de condicionamiento operante en acción:

En algunos de estos ejemplos, la promesa o posibilidad de recompensas causa un aumento en el comportamiento, pero el condicionamiento operante también se puede utilizar para disminuir un comportamiento. La eliminación de un resultado deseable o una aplicación de resultados negativos se puede utilizar para disminuir o prevenir comportamientos indeseables. Por ejemplo, a un niño se le puede decir que perderá los privilegios de recreo si habla fuera de turno en clase. Este potencial de castigo puede conducir a una disminución de las conductas disruptivas.

Una palabra de

Si bien el conductismo puede haber perdido gran parte del dominio que tuvo durante la primera parte del siglo XX, el condicionamiento operante sigue siendo una herramienta importante y frecuentemente utilizada en el proceso de aprendizaje y modificación de la conducta. Algunas veces las consecuencias naturales conducen a cambios en nuestro comportamiento. En otros casos, las recompensas y los castigos se pueden repartir conscientemente para crear un cambio.

El condicionamiento operante es algo que puede reconocer de inmediato en su propia vida, ya sea en su enfoque para enseñarles a sus hijos el buen comportamiento o en entrenar al perro de la familia para que deje de masticar sus zapatillas favoritas. Lo importante para recordar es que con cualquier tipo de aprendizaje, a veces puede llevar tiempo. Considere el tipo de refuerzo o castigo que puede funcionar mejor para su situación particular y evalúe qué tipo de programa de refuerzo podría conducir a los mejores resultados.

> Fuentes:

> Coon, D & Mitterer, JO. Psicología: un viaje. Belmont, CA: Wadsworth; 2014.

> Domjan, M. Los Principios de Aprendizaje y Conducta, Séptima Edición. Stamford, CT; Aprendizaje Cengage; 2015.