El Condicionamiento Instrumental

¿Qué se aprende con el Condicionamiento Instrumental?

El Condicionamiento Instrumental es un tipo de aprendizaje por condicionamiento, en el que, a diferencia del condicionamiento clásico, las personas aprenden a relacionar o asociar una conducta con sus consecuencias.

El término instrumental que recibe este condicionamiento hace referencia a aquellas respuestas que se utilizan como instrumentos para obtener unas determinadas consecuencias del entorno. Este tipo de respuesta se llama conducta instrumental.

Así, mientras que en el condicionamiento clásico aprendemos, básicamente, a asociar estímulos que se presentan con una relación predictiva entre sí (asociación EC-EI), sin poder ejercer ningún control sobre su presencia, es decir, que se presentan independientemente de cuál sea nuestra conducta, en el condicionamiento instrumental aprendemos cuál es la respuesta más adecuada para obtener unas determinadas consecuencias (asociación RC). En este caso, utilizamos nuestra conducta para controlar los hechos que han de suceder a continuación; por tanto, en el condicionamiento instrumental la conducta adquiere un papel primordial, ya que sin su presencia no es posible obtener el control ambiental característico de este tipo de acondicionamiento.

El tipo de consecuencias que se deriven de la conducta instrumental determinarán que aumente la probabilidad de aparición de esta conducta, o bien que se deje de hacer. El estudio del condicionamiento instrumental nos permitirá conocer cuáles son estos tipos de consecuencias y de qué manera afectan nuestra conducta futura.

Respuesta operante o instrumental

En principio, cualquier respuesta que se encuentre en el repertorio habitual del individuo puede ser sometida a acondicionamiento, generalmente, sin embargo, se trata de una respuesta voluntaria y motora que se puede elegir arbitrariamente o bien se puede asignar con el motivo explícito de modificar su probabilidad de aparición, aumentándola o disminuyéndola; así, por ejemplo, tanto se puede condicionar la conducta de ir vestido de color verde, como la conducta de cepillarse a diario los dientes.

Este aprendizaje discriminativo que habilita a la persona para elegir cuál es el momento más oportuno para realizar una determinada respuesta lo ponen en práctica, muy claramente, los niños. Así, por ejemplo, no es raro que un niño use, cuando habla con sus abuelos, todas aquellas palabras o expresiones malsonantes que los hacen reír tanto, pero al mismo tiempo, nunca se le ocurriría hablar de esta manera cuando se dirige a su padre.

Muy a menudo la respuesta instrumental se realiza cuando están presentes unos determinados estímulos discriminativos o contexto; estos estímulos informan al sujeto que, si en este momento realiza la respuesta, obtendrá unas consecuencias que no serían las mismas que en el caso de realizar esta misma respuesta ante unos estímulos o contexto diferente.

Consecuencias de la respuesta

Cuando hablamos de consecuencias de la respuesta operante hacemos referencia a cualquier hecho que suceda inmediatamente después de haber realizado la respuesta y que modifique su probabilidad de aparición en un futuro inmediato. En este sentido, ya grandes rasgos, nos encontramos con dos tipos diferentes de consecuencias: las de refuerzo, que provocan aumento de la probabilidad de aparición, y las de castigo, que provocan el efecto contrario sobre la conducta.

Consecuencias de reforzamiento

En las consecuencias de refuerzo se encuentran los estímulos reforzadores.

Reforzador puede ser cualquier hecho que se presenta después de realizar la conducta y que provoca un aumento en la probabilidad de aparición de esta conducta.

Muy a menudo se identifica estímulo reforzador con estímulo apetitivo o deseado. A pesar de que esto es correcto en la mayoría de los casos, nos podríamos encontrar con alguna situación en la que no fuera así, dado que es difícil confeccionar una lista de estímulos apetitivos que sea totalmente válida para todos. En este sentido, podríamos encontrar un ejemplo en el que el elemento reforzador que se presenta (y hace aumentar la conducta) no fuera entendido por todos como estímulo apetitivo.

Los estímulos reforzadores se pueden clasificar en incondicionados o primarios, condicionados o secundarios y generalizados.

Incondicionados o primarios

Son todos aquellos estímulos que tienen poder reforzador por sí mismos. En general, son efectivos para la mayoría de personas desde la primera vez que se presentan, pero, en general, es necesario que haya un cierto estado de privación para garantizar su poder reforzando y para que se reserven para ser presentados únicamente después de haber realizado la conducta.

En la mayoría de procedimientos de condicionamiento operante utiliza la comida como un poderoso reforzador primario para los animales hambrientos; en este caso, el nivel de privación de comida que presente el animal es crítico para garantizar el poder reforzante de la comida. Otros ejemplos de reforzadores primarios pueden ser las caricias y los elogios, o los caramelos y los juguetes, en el caso de los niños.

Condicionados o secundarios

Inicialmente, estos estímulos no tienen ningún efecto reforzador ni son, de entrada, estímulos apetitivos, pero estos estímulos refuerzan gracias a que han sido asociados anteriormente (por condicionamiento clásico) con un estímulo reforzador incondicionado. Como el poder reforzador de estos estímulos depende de una historia anterior asociativa que puede ser diferente para cada persona, encontraremos mucha más diversidad y variabilidad individual entre los estímulos reforzadores secundarios que entre los reforzadores primarios. Una ventaja importante que presentan este tipo de reforzadores es que “ahorran” los reforzadores primarios y, por tanto, no se presenta fácilmente el problema de saciedad que conlleva la utilización de los reforzadores incondicionados.

Un reforzador secundario efectivo podría ser dibujar una estrella en la libreta de un niño cada vez que realiza correctamente los ejercicios, y cambiar, al final de la semana, un determinado número de estrellas por diez sobres de cromos de los dibujos de moda.

Generalizados

Estos estímulos, al igual que los estímulos reforzadores condicionados, refuerzan porque han sido anteriormente asociados a otros reforzadores, pero, en el caso de los reforzadores generalizados, esta asociación se da con una amplia gama de estímulos reforzadores, tanto primarios como secundarios.

Desde hace tiempo, los supermercados utilizan un sistema de puntos para incrementar las ventas. Así, cuando el cliente compra determinados productos “gana” una serie de puntos que puede cambiar posteriormente por varios objetos, o por otros productos de alimentación. El dinero también tienen el papel de estímulos reforzadores generalizados, dado que están asociados a infinidad de otros reforzadores, tanto primarios como secundarios.

Antes de terminar el apartado de las consecuencias reforzantes de la conducta, debemos dejar indicado que como elemento reforzador, tanto puede servir la presentación de un estímulo apetitivo (deseado) después de realizar la conducta, como la retirada de un estímulo aversivo (desagradable); así, pues, estas dos consecuencias provocarán un aumento de la conducta.

Consecuencias de castigo

Las consecuencias de castigo son las que se dan cuando se presenta un estímulo aversivo o se retira un estímulo reforzador o apetitivo inmediatamente después de hacer la conducta.

De la misma manera que anteriormente hemos diferenciado los términos reforzador (como elemento que hace incrementar la conducta que sigue) y estímulo apetitivo (como deseado por la mayoría de personas, pero que quizás en alguna ocasión no funciona como reforzador de conducta), en este apartado también podemos diferenciar estímulo punitivo y estímulo aversivo. Se habla de estímulo punitivo cuando tenemos la certeza de que este estímulo provoca una disminución en la conducta que sigue y de estímulo aversivo, cuando se trata de un elemento que provoca rechazo, pero del que no necesariamente se ha constatado la capacidad para a reducir la presencia de la conducta, es decir, para castigar. De todos modos, y como es lógico suponer, en la mayoría de los casos los estímulos punitivos suelen ser estímulos aversivos, y esto provoca que muy a menudo se traten estos dos términos (punitivo y aversivo ) de manera indistinta.

Dejar respuesta

Please enter your comment!
Please enter your name here