Acondicionamiento instrumental

Otro término para el condicionamiento operante

El condicionamiento instrumental es otro término para el condicionamiento operante , un proceso de aprendizaje descrito por primera vez por BF Skinner . En el condicionamiento instrumental, el refuerzo o el castigo se usan para aumentar o disminuir la probabilidad de que un comportamiento vuelva a ocurrir en el futuro.

Ejemplos de acondicionamiento instrumental

Por ejemplo, si un alumno es recompensado con elogios cada vez que levanta la mano en clase, es más probable que vuelva a levantar la mano en el futuro.

Si ella también es regañada cuando habla fuera de turno, es menos probable que interrumpa la clase. En estos ejemplos, el maestro está utilizando refuerzo para fortalecer el comportamiento y el castigo de la mano para debilitar la conversación del comportamiento de turno.

El condicionamiento instrumental también se usa a menudo en el entrenamiento de animales. Por ejemplo, entrenar a un perro para estrechar la mano implicaría ofrecer una recompensa cada vez que ocurra el comportamiento deseado.

Una breve historia del acondicionamiento instrumental

El psicólogo EL Thorndike fue uno de los primeros en observar el impacto del refuerzo en los experimentos de rompecabezas con gatos. Durante estos experimentos, Thorndike observó un proceso de aprendizaje que denominó aprendizaje de "ensayo y error".

Los experimentos consistieron en colocar a un gato hambriento en una caja de rompecabezas y, para liberarse, el gato tuvo que descubrir cómo escapar. Thorndike luego notó cuánto tiempo les tomó a los gatos liberarse en cada prueba experimental.

Inicialmente, los gatos se involucraron en métodos de escape ineficaces, arañando y escarbando en los lados o en la parte superior de la caja. Eventualmente, prueba y error llevaría a los gatos a empujar o tirar con éxito la ruta de escape. Después de cada prueba sucesiva, los gatos se involucraban cada vez menos en los comportamientos de escape ineficaces y respondían más rápidamente con las acciones de escape correctas.

Thorndike se refirió a sus observaciones como la Ley del Efecto . La fuerza de una respuesta aumenta cuando es seguida inmediatamente por un "satisfactorio" (reforzador). Por otro lado, las acciones que van seguidas de efectos desagradables tienen más probabilidades de debilitarse.

En los experimentos de rompecabezas de Thorndike, escapar de la caja fue satisfactorio. Cada vez que los gatos escaparon con éxito de la caja, el comportamiento que inmediatamente precedió al escape fue reforzado y fortalecido.

El trabajo de Thorndike tuvo un efecto tremendo en la investigación posterior de BF Skinner sobre el condicionamiento operante . Skinner incluso creó su propia versión de las cajas de rompecabezas de Thorndike a la que se refirió como una cámara operante, también conocida como caja de Skinner .

Cómo funciona el acondicionamiento instrumental

Skinner identificó dos tipos de comportamientos clave. El primer tipo son los comportamientos de los encuestados. Estas son simplemente acciones que ocurren reflexivamente sin ningún aprendizaje. Si tocas algo caliente, inmediatamente retirarás tu mano en respuesta. El condicionamiento clásico se centra en estos comportamientos de los encuestados. En los experimentos clásicos de Pavlov con perros , el comportamiento del encuestado fue la salivación de la presentación de los alimentos. Al formar una asociación entre el sonido de una campana y la presentación de los alimentos, sin embargo, Pavlov fue capaz de entrenar perros para realmente salivar simplemente al sonido de esa campana.

Skinner se dio cuenta de que si bien el condicionamiento clásico podía explicar cómo los comportamientos de los encuestados podían conducir al aprendizaje, no podía explicar todos los tipos de aprendizaje. En cambio, sugirió que eran las consecuencias de las acciones voluntarias las que llevaban a la mayor cantidad de aprendizaje.

El segundo tipo de comportamientos es lo que Skinner denominó comportamientos operantes. Él los definió como todos y cada uno de los comportamientos voluntarios que actúan sobre el medio ambiente para crear una respuesta. Estos son los comportamientos voluntarios que están bajo nuestro control consciente. Estas también son acciones que se pueden aprender. Las consecuencias de nuestras acciones juegan un papel importante en el proceso de aprendizaje.

Refuerzo y castigo

Skinner identificó dos aspectos clave del proceso de acondicionamiento operante. El refuerzo sirve para aumentar el comportamiento mientras que el castigo sirve para disminuir el comportamiento.

También hay dos tipos diferentes de refuerzo y dos tipos diferentes de castigo. El refuerzo positivo implica la presentación de un resultado favorable, como darle un regalo a un niño después de que limpie su habitación. El refuerzo negativo implica la eliminación de un estímulo desagradable, como decirle a un niño que si come todas sus patatas, entonces no tendrá que comer su brócoli. Dado que el niño considera que el brócoli es una consecuencia desagradable y que comer patatas conduce a la eliminación de esta consecuencia indeseable, comer patatas se ve negativamente reforzado.

Castigo positivo significa aplicar un evento desagradable después de un comportamiento. Nalgadas, por ejemplo, es un ejemplo común de castigo positivo. Este tipo de castigo a menudo se conoce como castigo por la aplicación. Una consecuencia negativa se aplica directamente para reducir el comportamiento no deseado.

El castigo negativo implica quitar algo agradable después de un comportamiento. Por ejemplo, si un niño no limpia su habitación, sus padres podrían decirle que no puede ir al centro comercial con sus amigos. Quitar la actividad deseable actúa como un castigo negativo en el comportamiento anterior.