Psicología General
El aprendizaje es un cambio relativamente permanente en la conducta (o en la disposición a conducirse) producto de la experiencia.
Una de las tesis centrales del programa conductista es que las leyes del aprendizaje son comunes a los seres humanos y a otros animales. Por lo tanto, estudiar el aprendizaje en cualquiera de los dos grupos permite derivar principios generales.
Dos referentes mayores del aprendizaje conductual:
→ Watson — aprendizaje como relación entre estímulos y respuestas (condicionamiento clásico)
→ Skinner — aprendizaje como relación entre la conducta y sus consecuencias (condicionamiento operante)
Estímulo que provoca una respuesta de manera natural e innata, sin aprendizaje previo.
Ej.: la comida en la boca.
Respuesta natural e innata provocada por el EI.
Ej.: la salivación frente a la comida.
Estímulo que no guarda relación natural con la respuesta de interés.
Ej.: el sonido de una campana, en relación con la salivación.
EN que, tras emparejarse repetidamente con el EI, adquiere las propiedades de éste y pasa a evocar la respuesta.
Antes del aprendizaje:
Comida (EI) → Salivación (RI) — relación natural, innata
Campana (EN) → sin respuesta relevante
Durante el aprendizaje — emparejamiento repetido:
Campana (EN) + Comida (EI) → Salivación (RI)
Después del aprendizaje:
Campana (EC) → Salivación (RC)
La campana adquiere las propiedades del estímulo de comida por contigüidad temporal.
EI y EN se presentan al mismo tiempo.
Ej.: el torno del dentista (sonido y dolor simultáneos).
EN se retira antes de que aparezca el EI. Es el emparejamiento más débil.
EN se presenta antes y permanece durante el EI. Es el emparejamiento más usado en laboratorio.
EN se presenta después del EI.
En otros animales no suele generar aprendizaje; es habitual en publicidad.
El motor del aprendizaje operante son las consecuencias que siguen a la conducta. Esas consecuencias pueden aumentar o disminuir la probabilidad de emisión de la conducta a futuro.
Consecuencia que aumenta la probabilidad de la conducta a futuro.
P(conducta futura) > P(conducta pasada)
Consecuencia que disminuye la probabilidad de la conducta a futuro.
P(conducta futura) < P(conducta pasada)
La conducta queda asociada a la aparición de un estímulo apetitivo.
Ej.: jugar a la ruleta queda reforzado cuando esa conducta produce la aparición de dinero ganado.
La conducta queda asociada a la desaparición de un estímulo aversivo.
Ej.: tomar una pastilla de la marca X queda reforzado cuando esa conducta hace desaparecer el dolor de cabeza.
Ambos casos aumentan la probabilidad de emisión de la conducta. La diferencia está en si lo que sigue a la conducta es la aparición de algo apetitivo o la retirada de algo aversivo.
El castigo disminuye la probabilidad de emisión de la conducta. La conducta queda asociada a la aparición de un estímulo aversivo (o a la retirada de uno apetitivo).
Ej.: la probabilidad de poner los dedos en el enchufe baja porque esa conducta estuvo vinculada a la aparición de un estímulo aversivo (dolor, incomodidad corporal).
La descripción anterior es la versión habitual de los manuales: positivo significa que aparece algo apetitivo o aversivo; negativo, que se retira. Es útil para empezar, pero es técnicamente imprecisa.
Skinner mismo no definió el reforzador por su valencia hedónica, sino por su efecto sobre la conducta. Y eso abre dos problemas en la versión de manual:
Un estímulo que parece apetitivo puede no funcionar como reforzador para un sujeto particular; uno que parece aversivo puede no castigar. La definición funcional pasa por el efecto observado, no por el valor hedónico supuesto.
Que muchas veces coincidan es accidental, no definitorio. Hace falta una definición más precisa de qué quiere decir el signo positivo o negativo en estos procedimientos.
Para ganar precisión, conviene introducir un concepto previo: el de contingencia.
La contingencia contingencia implica una relación de probabilidad entre dos eventos. ¿Qué tan probable es que ocurra el evento X dado que antes ocurrió el evento Z?
Una relación de contingencia es una diferencia de probabilidades:
P(evento X | ocurrió evento Z) − P(evento X | no ocurrió evento Z)
Ej.: ¿qué tan probable es distraerme mientras estudio si tengo el celular sobre el escritorio? ¿Y si lo dejé en otra habitación? Si esas probabilidades son distintas, la presencia del celular altera la probabilidad de distraerme: hay una relación de contingencia entre el celular y la distracción.
El resultado de esa resta puede tener tres signos, y cada uno tiene un nombre:
Contingencia positiva.
El primer evento aumenta la probabilidad del segundo.
Contingencia negativa.
El primer evento disminuye la probabilidad del segundo.
No hay contingencia.
Un evento no cambia la probabilidad del otro.
Cuando en condicionamiento operante hablamos de procedimientos positivos o negativos, no nos referimos a estímulos agradables o desagradables, ni a que algo se ponga o se quite. El signo se refiere únicamente al tipo de relación probabilística entre la respuesta y su consecuencia.
Identificar qué tipo de procedimiento opera en una situación implica dos preguntas independientes:
Lo define el efecto sobre la conducta.
→ Conducta aumenta: reforzamiento.
→ Conducta disminuye: castigo.
Lo define el signo de la contingencia entre la respuesta y la consecuencia.
→ Resta > 0: positivo.
→ Resta < 0: negativo.
| Conducta ↑ (reforzamiento) | Conducta ↓ (castigo) | |
|---|---|---|
|
Contingencia positiva la R aumenta P(C) |
Reforzamiento positivo Apostar aumenta P(ganar); apostar se repite más. |
Castigo positivo Meter los dedos en el enchufe aumenta P(dolor); la conducta disminuye. |
|
Contingencia negativa la R disminuye P(C) |
Reforzamiento negativo Abrochar el cinturón disminuye P(sonido); la conducta se repite más. |
Castigo negativo Portarse mal disminuye P(usar el celu esa tarde); la conducta disminuye. |
Pedro suele conducir sin abrochar el cinturón. Cambia de auto: el nuevo emite un sonido agudo y molesto al arrancar si el cinturón no está puesto; el sonido se calla sólo cuando lo abrocha. Con el tiempo, Pedro empieza a abrocharse el cinturón antes de encender el auto, y lo hace cada vez con más frecuencia.
La pregunta es: ¿qué pasa con la probabilidad de emisión de la conducta a futuro?
La conducta de abrocharse el cinturón aumenta en frecuencia.
→ Es un procedimiento de reforzamiento.
Calculamos la contingencia entre la conducta (R) y la consecuencia (C = sonido agudo):
P(sonido | abrocha) = 0
P(sonido | no abrocha) = 1
Resta: 0 − 1 = −1
Resta menor que cero → contingencia negativa.
→ Estamos ante un procedimiento de reforzamiento negativo. Lo “negativo” no significa que el sonido “se quite”: significa que la conducta de Pedro reduce la probabilidad del sonido.
El programa de reforzamiento describe la regla según la cual una conducta es seguida o no por un reforzador. La pregunta clave es: ¿cuán resistente a la extinción será la conducta cuando el reforzador deje de aparecer?
Cada emisión de la conducta es reforzada.
Resistencia a la extinción: baja. Bastan pocas emisiones no reforzadas para que la conducta se extinga.
La conducta se refuerza cada cierto número de emisiones, en promedio (razón variable) o cada cierto tiempo, en promedio (intervalo variable).
Resistencia a la extinción: alta.
Ej.: juegos de azar — el jugador continúa emitiendo la conducta de apuesta aunque no obtenga reforzador durante muchas emisiones.
Conductismo cognitivo. El aprendizaje no se reduce a vínculos E–R: los organismos construyen mapas mentales y expectativas sobre el ambiente.
Aprendizaje por insight. Uno de los fundadores de la Gestalt. El aprendizaje puede ocurrir de modo súbito, por reorganización perceptiva del problema, sin ensayo y error gradual.
Aprendizaje social. Buena parte del aprendizaje humano ocurre por modelado: observar a otros y reproducir sus conductas, sin necesidad de reforzamiento directo.
Tres grupos de ratas deben aprender a salir de un laberinto:
Reforzada en cada ensayo.
Aprende rápido.
Nunca reforzada.
No aprende (no mejora su desempeño).
Sin reforzador los primeros 10 días; reforzada a partir del día 11.
Tras introducir el reforzador, aprende tan rápido como el Grupo 1.
En el Grupo 3 el aprendizaje habría quedado latente: las ratas construyeron un mapa mental del laberinto durante la fase no reforzada, mapa que se hizo visible en la conducta sólo cuando hubo un motivo para usarlo.
Tiempo de salida del laberinto a lo largo de los días. La flecha marca el día 11, cuando el Grupo 3 comienza a recibir reforzador.
La memoria es una parte crucial del proceso de aprendizaje. Sin memoria, las experiencias se perderían y el organismo no podría beneficiarse de la experiencia pasada.
En sentido amplio:
Adquisición de conocimiento. Corresponde al aspecto de almacenamiento (guardar).
Almacenamiento de una representación interna de ese conocimiento y su recuperación.
En el sentido común se usa “memoria” sólo como recuperación; en psicología abarca registro, almacenamiento y recuperación.
Pionero del estudio experimental de la memoria. Estudia curvas de aprendizaje y curvas de olvido usando sílabas sin sentido para controlar la influencia del significado previo.
Propone los términos memoria primaria (antecedente de la memoria de corto plazo) y memoria secundaria (antecedente de la memoria de largo plazo).
Durante la primera mitad del siglo XX, el predominio del conductismo desplazó el estudio de la memoria. Recobra fuerza con el giro cognitivo de mediados de siglo.
La memoria es un constructo hipotético que refiere a tres procesos diferenciados pero relacionados:
Información que impacta en los sentidos.
No todo lo que se registra se almacena.
Información que queda guardada.
No todo lo que se guarda se recupera.
Acceso a lo almacenado. Distinguir disponibilidad (si está guardado) de accesibilidad (si puede recuperarse).
Sólo el ≈1% de la información sensorial llega a ser consciente; y de la información consciente, sólo el ≈5% se almacena de forma estable.
Recuperar información de modo libre (dar un final oral, contar la propia historia).
Identificar la respuesta correcta entre opciones (examen multiple choice; probar sabores).
Volver a estudiar algo previamente aprendido (repaso antes de un examen).
Recuerdo de un testigo ocular reconstruido en parte a partir de información posterior (Loftus).
Reminiscencias del pasado disparadas por una clave (oler un perfume).
Estrategias de agrupación y representación para facilitar el recuerdo.
Aparte: la fabulación es la generación de recuerdos inventados, frecuente en ciertos cuadros amnésicos.
El modelo postula tres almacenes secuenciales: sensorial, de corto plazo y de largo plazo, con procesos de transferencia y olvido.
Conserva una copia exacta del estímulo durante un período muy breve luego de la exposición. Almacena los estímulos discriminados sólo por sus rasgos físicos (tamaño, forma, color, localización), no por su significado.
Visual. Dura aproximadamente 0,5 s.
Permite, por ejemplo, ver una película como flujo continuo.
Auditiva. Dura aproximadamente 2 s.
Permite unir sonidos en palabras al escuchar.
Táctil. Conserva brevemente la información del contacto con la piel.
| Característica | Memoria de corto plazo | Memoria de largo plazo |
|---|---|---|
| Capacidad | 7 ± 2 unidades (chunks); puede incrementarse agrupando información | Ilimitada |
| Duración | 15–30 segundos sin repaso | De segundos a muchos años |
| Codificación | Principalmente acústica y visual | Semántica, visual, acústica |
El paso de corto a largo plazo se logra principalmente mediante repaso y, sobre todo, procesamiento profundo (semántico).
La MLP no es un almacén único: se distinguen memoria episódica, semántica y procedural.
Craik y Lockhart: la durabilidad del recuerdo depende de la profundidad con que se procesa la información, no de un trasvase entre almacenes.
Baddeley y Hitch: la memoria de corto plazo no es pasiva, sino un sistema activo de mantenimiento y manipulación.
Información que puede recuperarse conscientemente y expresarse verbalmente.
→ Episódica: recuerdos autobiográficos, situados en tiempo y lugar. Ej.: ver a Argentina ganar la copa.
→ Semántica: conocimiento general del mundo, conceptos, reglas, lenguaje. Ej.: saber la capital de Buenos Aires.
Información que no puede inspeccionarse conscientemente, pero influye en el desempeño.
→ Procedimental: habilidades motoras y cognitivas automatizadas. Ej.: atarse los cordones, andar en bici.
→ Emocional: respuestas afectivas condicionadas a estímulos.
| Medidas directas | Tipo | Medidas indirectas | Tipo |
|---|---|---|---|
| Pruebas de reconocimiento | Explícita | Pruebas de conocimiento perceptual | Implícita |
| Pruebas de evocación | Explícita | Pruebas de conocimiento procedimental | Implícita |
| Recuerdo serial / libre | Explícita | Prueba de respuesta evaluadora | Implícita |
La doble disociación entre medidas directas e indirectas en pacientes amnésicos es uno de los hallazgos más sólidos a favor de distinguir sistemas de memoria: en tareas directas su desempeño cae marcadamente; en tareas indirectas se acerca al de personas sin daño.
Antes de seguir, vamos a hacer una pequeña experiencia para sentir cómo trabaja la memoria de trabajo. La consigna es simple:
→ Cuando yo les indique, cierren los ojos.
→ Recorran mentalmente su casa, habitación por habitación.
→ Cuenten cuántas ventanas hay en total.
→ Cuando crean tenerlo, levanten la mano sin abrir los ojos.
Baddeley y Hitch (1974). La memoria de corto plazo no es un almacén pasivo, sino un sistema activo que mantiene la información al mismo tiempo que la manipula.
Sistema atencional supervisor: coordina los otros componentes, asigna recursos, controla y manipula la información.
“Voz interna”. Almacena y repasa información verbal y acústica.
“Ojo interno”. Almacena y manipula imágenes y relaciones espaciales.
En revisiones posteriores Baddeley agrega un cuarto componente, el buffer episódico, que integra información de los demás componentes con la MLP.
→ Traumatismo craneoencefálico
→ Síndrome de Korsakoff (deficiencia severa de vitamina B1, asociada a alcoholismo crónico)
→ Enfermedad de Alzheimer
→ Daño al hipocampo y a estructuras talámicas
→ TEC (terapia electroconvulsiva)
→ Midazolam y otras benzodiacepinas: amnesia inducida farmacológicamente
Dificultad para recordar información previa a la lesión.
Ej.: el personaje de una telenovela que tras un golpe no reconoce a su familia.
Dificultad para formar nuevos recuerdos, posteriores a la lesión.
Ej.: el caso de Clive Wearing; el marinero perdido (Oliver Sacks); la trama de 50 First Dates.
La lesión define dos períodos: lo anterior (retrógrado) y lo posterior (anterógrado).
El caso Clive Wearing (encefalitis por herpes con daño al hipocampo) y el caso H. M. (extirpación bilateral del hipocampo por epilepsia refractaria) mostraron que, pese a la amnesia severa para nuevos hechos:
→ Conservan el lenguaje, la marcha, la lectura, habilidades musicales previas.
→ Pueden adquirir nuevas habilidades procedimentales (por ejemplo, dibujar a través de un espejo) sin tener recuerdo episódico de haber practicado.
Esta disociación es uno de los argumentos clínicos más fuertes para distinguir entre memoria declarativa (afectada) y memoria procedimental (preservada).
→ El conductismo describe el aprendizaje a través de relaciones observables entre estímulos, respuestas y consecuencias.
→ Watson y Skinner aportan dos paradigmas complementarios.
→ Tolman, Köhler y Bandura introducen variables internas y sociales que el conductismo radical no explica.
→ La memoria no es un almacén único: hay sistemas con propiedades distintas (sensorial, MCP, MLP; declarativa vs. procedimental).
→ El recuerdo depende tanto de cómo se codifica como de cómo se recupera.
→ La clínica de la amnesia es una herramienta clave para mapear esos sistemas.
Psicología General · UP