Aprendizaje y Memoria

Psicología General

Dr. Fernando Tonini

Parte I — Aprendizaje

¿Qué es el aprendizaje?

El aprendizaje es un cambio relativamente permanente en la conducta (o en la disposición a conducirse) producto de la experiencia.

Una de las tesis centrales del programa conductista es que las leyes del aprendizaje son comunes a los seres humanos y a otros animales. Por lo tanto, estudiar el aprendizaje en cualquiera de los dos grupos permite derivar principios generales.

Dos referentes mayores del aprendizaje conductual:

Watson — aprendizaje como relación entre estímulos y respuestas (condicionamiento clásico)

Skinner — aprendizaje como relación entre la conducta y sus consecuencias (condicionamiento operante)

Watson · Condicionamiento clásico

Términos clave

Estímulo incondicionado (EI)

Estímulo que provoca una respuesta de manera natural e innata, sin aprendizaje previo.

Ej.: la comida en la boca.

Respuesta incondicionada (RI)

Respuesta natural e innata provocada por el EI.

Ej.: la salivación frente a la comida.

Estímulo neutral (EN)

Estímulo que no guarda relación natural con la respuesta de interés.

Ej.: el sonido de una campana, en relación con la salivación.

Estímulo condicionado (EC)

EN que, tras emparejarse repetidamente con el EI, adquiere las propiedades de éste y pasa a evocar la respuesta.

El paradigma de Pavlov

Antes del aprendizaje:

Comida (EI) → Salivación (RI) — relación natural, innata

Campana (EN) → sin respuesta relevante

Durante el aprendizaje — emparejamiento repetido:

Campana (EN) + Comida (EI) → Salivación (RI)

Después del aprendizaje:

Campana (EC) → Salivación (RC)

La campana adquiere las propiedades del estímulo de comida por contigüidad temporal.

Tipos de emparejamiento EI–EN

1 · Simultáneo

EI y EN se presentan al mismo tiempo.

Ej.: el torno del dentista (sonido y dolor simultáneos).

2 · Huella

EN se retira antes de que aparezca el EI. Es el emparejamiento más débil.

3 · Adelantado

EN se presenta antes y permanece durante el EI. Es el emparejamiento más usado en laboratorio.

4 · Retroactivo

EN se presenta después del EI.

En otros animales no suele generar aprendizaje; es habitual en publicidad.

Skinner · Condicionamiento operante

Reforzadores y castigos

El motor del aprendizaje operante son las consecuencias que siguen a la conducta. Esas consecuencias pueden aumentar o disminuir la probabilidad de emisión de la conducta a futuro.

Reforzador

Consecuencia que aumenta la probabilidad de la conducta a futuro.

P(conducta futura) > P(conducta pasada)

Castigo

Consecuencia que disminuye la probabilidad de la conducta a futuro.

P(conducta futura) < P(conducta pasada)

Reforzamiento positivo y negativo

Reforzamiento positivo (R+)

La conducta queda asociada a la aparición de un estímulo apetitivo.

Ej.: jugar a la ruleta queda reforzado cuando esa conducta produce la aparición de dinero ganado.

Reforzamiento negativo (R−)

La conducta queda asociada a la desaparición de un estímulo aversivo.

Ej.: tomar una pastilla de la marca X queda reforzado cuando esa conducta hace desaparecer el dolor de cabeza.

Ambos casos aumentan la probabilidad de emisión de la conducta. La diferencia está en si lo que sigue a la conducta es la aparición de algo apetitivo o la retirada de algo aversivo.

Castigo

El castigo disminuye la probabilidad de emisión de la conducta. La conducta queda asociada a la aparición de un estímulo aversivo (o a la retirada de uno apetitivo).

Ej.: la probabilidad de poner los dedos en el enchufe baja porque esa conducta estuvo vinculada a la aparición de un estímulo aversivo (dolor, incomodidad corporal).

Un problema con esta forma de presentarlo

La descripción anterior es la versión habitual de los manuales: positivo significa que aparece algo apetitivo o aversivo; negativo, que se retira. Es útil para empezar, pero es técnicamente imprecisa.

Skinner mismo no definió el reforzador por su valencia hedónica, sino por su efecto sobre la conducta. Y eso abre dos problemas en la versión de manual:

Lo “apetitivo” no garantiza nada

Un estímulo que parece apetitivo puede no funcionar como reforzador para un sujeto particular; uno que parece aversivo puede no castigar. La definición funcional pasa por el efecto observado, no por el valor hedónico supuesto.

“Positivo/negativo” no es “aparece/desaparece”

Que muchas veces coincidan es accidental, no definitorio. Hace falta una definición más precisa de qué quiere decir el signo positivo o negativo en estos procedimientos.

Para ganar precisión, conviene introducir un concepto previo: el de contingencia.

Contingencia

La contingencia contingencia implica una relación de probabilidad entre dos eventos. ¿Qué tan probable es que ocurra el evento X dado que antes ocurrió el evento Z?

Una relación de contingencia es una diferencia de probabilidades:

P(evento X | ocurrió evento Z) − P(evento X | no ocurrió evento Z)

Ej.: ¿qué tan probable es distraerme mientras estudio si tengo el celular sobre el escritorio? ¿Y si lo dejé en otra habitación? Si esas probabilidades son distintas, la presencia del celular altera la probabilidad de distraerme: hay una relación de contingencia entre el celular y la distracción.

El signo de la contingencia

El resultado de esa resta puede tener tres signos, y cada uno tiene un nombre:

Resta > 0

Contingencia positiva.

El primer evento aumenta la probabilidad del segundo.

Resta < 0

Contingencia negativa.

El primer evento disminuye la probabilidad del segundo.

Resta = 0

No hay contingencia.

Un evento no cambia la probabilidad del otro.

Cuando en condicionamiento operante hablamos de procedimientos positivos o negativos, no nos referimos a estímulos agradables o desagradables, ni a que algo se ponga o se quite. El signo se refiere únicamente al tipo de relación probabilística entre la respuesta y su consecuencia.

Dos preguntas, cuatro procedimientos

Identificar qué tipo de procedimiento opera en una situación implica dos preguntas independientes:

1 · ¿Reforzamiento o castigo?

Lo define el efecto sobre la conducta.

→ Conducta aumenta: reforzamiento.

→ Conducta disminuye: castigo.

2 · ¿Positivo o negativo?

Lo define el signo de la contingencia entre la respuesta y la consecuencia.

→ Resta > 0: positivo.

→ Resta < 0: negativo.

Conducta ↑ (reforzamiento) Conducta ↓ (castigo)
Contingencia positiva
la R aumenta P(C)
Reforzamiento positivo
Apostar aumenta P(ganar); apostar se repite más.
Castigo positivo
Meter los dedos en el enchufe aumenta P(dolor); la conducta disminuye.
Contingencia negativa
la R disminuye P(C)
Reforzamiento negativo
Abrochar el cinturón disminuye P(sonido); la conducta se repite más.
Castigo negativo
Portarse mal disminuye P(usar el celu esa tarde); la conducta disminuye.

Releyendo un caso · el cinturón de seguridad

Pedro suele conducir sin abrochar el cinturón. Cambia de auto: el nuevo emite un sonido agudo y molesto al arrancar si el cinturón no está puesto; el sonido se calla sólo cuando lo abrocha. Con el tiempo, Pedro empieza a abrocharse el cinturón antes de encender el auto, y lo hace cada vez con más frecuencia.

Paso 1 · ¿Reforzamiento o castigo?

La pregunta es: ¿qué pasa con la probabilidad de emisión de la conducta a futuro?

La conducta de abrocharse el cinturón aumenta en frecuencia.

→ Es un procedimiento de reforzamiento.

Paso 2 · ¿Positivo o negativo?

Calculamos la contingencia entre la conducta (R) y la consecuencia (C = sonido agudo):

P(sonido | abrocha) = 0

P(sonido | no abrocha) = 1

Resta: 0 − 1 = −1

Resta menor que cero → contingencia negativa.

→ Estamos ante un procedimiento de reforzamiento negativo. Lo “negativo” no significa que el sonido “se quite”: significa que la conducta de Pedro reduce la probabilidad del sonido.

Programas de reforzamiento

El programa de reforzamiento describe la regla según la cual una conducta es seguida o no por un reforzador. La pregunta clave es: ¿cuán resistente a la extinción será la conducta cuando el reforzador deje de aparecer?

Reforzamiento continuo

Cada emisión de la conducta es reforzada.

Resistencia a la extinción: baja. Bastan pocas emisiones no reforzadas para que la conducta se extinga.

Reforzamiento variable

La conducta se refuerza cada cierto número de emisiones, en promedio (razón variable) o cada cierto tiempo, en promedio (intervalo variable).

Resistencia a la extinción: alta.

Ej.: juegos de azar — el jugador continúa emitiendo la conducta de apuesta aunque no obtenga reforzador durante muchas emisiones.

Modelos alternativos al conductismo radical

Tres líneas que abren la caja negra

Tolman

Conductismo cognitivo. El aprendizaje no se reduce a vínculos E–R: los organismos construyen mapas mentales y expectativas sobre el ambiente.

Köhler

Aprendizaje por insight. Uno de los fundadores de la Gestalt. El aprendizaje puede ocurrir de modo súbito, por reorganización perceptiva del problema, sin ensayo y error gradual.

Bandura

Aprendizaje social. Buena parte del aprendizaje humano ocurre por modelado: observar a otros y reproducir sus conductas, sin necesidad de reforzamiento directo.

Tolman · Aprendizaje latente

Tres grupos de ratas deben aprender a salir de un laberinto:

Grupo 1

Reforzada en cada ensayo.

Aprende rápido.

Grupo 2

Nunca reforzada.

No aprende (no mejora su desempeño).

Grupo 3

Sin reforzador los primeros 10 días; reforzada a partir del día 11.

Tras introducir el reforzador, aprende tan rápido como el Grupo 1.

En el Grupo 3 el aprendizaje habría quedado latente: las ratas construyeron un mapa mental del laberinto durante la fase no reforzada, mapa que se hizo visible en la conducta sólo cuando hubo un motivo para usarlo.

Tolman · Curva de aprendizaje latente

Tiempo de salida del laberinto a lo largo de los días. La flecha marca el día 11, cuando el Grupo 3 comienza a recibir reforzador.

Parte II — Memoria

Aprendizaje y memoria

La memoria es una parte crucial del proceso de aprendizaje. Sin memoria, las experiencias se perderían y el organismo no podría beneficiarse de la experiencia pasada.

En sentido amplio:

Aprendizaje

Adquisición de conocimiento. Corresponde al aspecto de almacenamiento (guardar).

Memoria

Almacenamiento de una representación interna de ese conocimiento y su recuperación.

En el sentido común se usa “memoria” sólo como recuperación; en psicología abarca registro, almacenamiento y recuperación.

Apuntes históricos

Ebbinghaus (1885)

Pionero del estudio experimental de la memoria. Estudia curvas de aprendizaje y curvas de olvido usando sílabas sin sentido para controlar la influencia del significado previo.

William James (1890)

Propone los términos memoria primaria (antecedente de la memoria de corto plazo) y memoria secundaria (antecedente de la memoria de largo plazo).

Durante la primera mitad del siglo XX, el predominio del conductismo desplazó el estudio de la memoria. Recobra fuerza con el giro cognitivo de mediados de siglo.

Memoria: tres procesos

La memoria es un constructo hipotético que refiere a tres procesos diferenciados pero relacionados:

1 · Registro

Información que impacta en los sentidos.

No todo lo que se registra se almacena.

2 · Almacenamiento

Información que queda guardada.

No todo lo que se guarda se recupera.

3 · Recuperación

Acceso a lo almacenado. Distinguir disponibilidad (si está guardado) de accesibilidad (si puede recuperarse).

Sólo el ≈1% de la información sensorial llega a ser consciente; y de la información consciente, sólo el ≈5% se almacena de forma estable.

Formas de recuperación

Rememoración

Recuperar información de modo libre (dar un final oral, contar la propia historia).

Reconocimiento

Identificar la respuesta correcta entre opciones (examen multiple choice; probar sabores).

Reaprendizaje

Volver a estudiar algo previamente aprendido (repaso antes de un examen).

Memoria reconstructiva

Recuerdo de un testigo ocular reconstruido en parte a partir de información posterior (Loftus).

Reintegración

Reminiscencias del pasado disparadas por una clave (oler un perfume).

Imaginería

Estrategias de agrupación y representación para facilitar el recuerdo.

Aparte: la fabulación es la generación de recuerdos inventados, frecuente en ciertos cuadros amnésicos.

Modelo multialmacén · Atkinson y Shiffrin

El modelo en bloque

El modelo postula tres almacenes secuenciales: sensorial, de corto plazo y de largo plazo, con procesos de transferencia y olvido.

Memoria sensorial

Conserva una copia exacta del estímulo durante un período muy breve luego de la exposición. Almacena los estímulos discriminados sólo por sus rasgos físicos (tamaño, forma, color, localización), no por su significado.

Icónica

Visual. Dura aproximadamente 0,5 s.

Permite, por ejemplo, ver una película como flujo continuo.

Ecoica

Auditiva. Dura aproximadamente 2 s.

Permite unir sonidos en palabras al escuchar.

Háptica

Táctil. Conserva brevemente la información del contacto con la piel.

Corto plazo vs. largo plazo

Característica Memoria de corto plazo Memoria de largo plazo
Capacidad 7 ± 2 unidades (chunks); puede incrementarse agrupando información Ilimitada
Duración 15–30 segundos sin repaso De segundos a muchos años
Codificación Principalmente acústica y visual Semántica, visual, acústica

El paso de corto a largo plazo se logra principalmente mediante repaso y, sobre todo, procesamiento profundo (semántico).

Alternativas y refinamientos del modelo

Tres alternativas al modelo multialmacén

Sistemas múltiples en MLP

La MLP no es un almacén único: se distinguen memoria episódica, semántica y procedural.

Niveles de procesamiento

Craik y Lockhart: la durabilidad del recuerdo depende de la profundidad con que se procesa la información, no de un trasvase entre almacenes.

Memoria de trabajo

Baddeley y Hitch: la memoria de corto plazo no es pasiva, sino un sistema activo de mantenimiento y manipulación.

Sistemas de memoria a largo plazo

Explícita / declarativa

Información que puede recuperarse conscientemente y expresarse verbalmente.

Episódica: recuerdos autobiográficos, situados en tiempo y lugar. Ej.: ver a Argentina ganar la copa.

Semántica: conocimiento general del mundo, conceptos, reglas, lenguaje. Ej.: saber la capital de Buenos Aires.

Implícita / no declarativa

Información que no puede inspeccionarse conscientemente, pero influye en el desempeño.

Procedimental: habilidades motoras y cognitivas automatizadas. Ej.: atarse los cordones, andar en bici.

Emocional: respuestas afectivas condicionadas a estímulos.

Medidas de memoria

Medidas directas Tipo Medidas indirectas Tipo
Pruebas de reconocimiento Explícita Pruebas de conocimiento perceptual Implícita
Pruebas de evocación Explícita Pruebas de conocimiento procedimental Implícita
Recuerdo serial / libre Explícita Prueba de respuesta evaluadora Implícita

La doble disociación entre medidas directas e indirectas en pacientes amnésicos es uno de los hallazgos más sólidos a favor de distinguir sistemas de memoria: en tareas directas su desempeño cae marcadamente; en tareas indirectas se acerca al de personas sin daño.

Pongmos a trabajar la memoria

Antes de seguir, vamos a hacer una pequeña experiencia para sentir cómo trabaja la memoria de trabajo. La consigna es simple:

→ Cuando yo les indique, cierren los ojos.

→ Recorran mentalmente su casa, habitación por habitación.

→ Cuenten cuántas ventanas hay en total.

→ Cuando crean tenerlo, levanten la mano sin abrir los ojos.

0:30

Memoria de trabajo

Baddeley y Hitch (1974). La memoria de corto plazo no es un almacén pasivo, sino un sistema activo que mantiene la información al mismo tiempo que la manipula.

Ejecutivo central

Sistema atencional supervisor: coordina los otros componentes, asigna recursos, controla y manipula la información.

Bucle fonológico

“Voz interna”. Almacena y repasa información verbal y acústica.

Agenda visoespacial

“Ojo interno”. Almacena y manipula imágenes y relaciones espaciales.

En revisiones posteriores Baddeley agrega un cuarto componente, el buffer episódico, que integra información de los demás componentes con la MLP.

Amnesia

Causas comunes

Causas neurológicas

→ Traumatismo craneoencefálico

→ Síndrome de Korsakoff (deficiencia severa de vitamina B1, asociada a alcoholismo crónico)

→ Enfermedad de Alzheimer

→ Daño al hipocampo y a estructuras talámicas

Causas iatrogénicas y farmacológicas

TEC (terapia electroconvulsiva)

Midazolam y otras benzodiacepinas: amnesia inducida farmacológicamente

Tipos de amnesia

Retrógrada

Dificultad para recordar información previa a la lesión.

Ej.: el personaje de una telenovela que tras un golpe no reconoce a su familia.

Anterógrada

Dificultad para formar nuevos recuerdos, posteriores a la lesión.

Ej.: el caso de Clive Wearing; el marinero perdido (Oliver Sacks); la trama de 50 First Dates.

La lesión define dos períodos: lo anterior (retrógrado) y lo posterior (anterógrado).

Disociación entre sistemas

El caso Clive Wearing (encefalitis por herpes con daño al hipocampo) y el caso H. M. (extirpación bilateral del hipocampo por epilepsia refractaria) mostraron que, pese a la amnesia severa para nuevos hechos:

→ Conservan el lenguaje, la marcha, la lectura, habilidades musicales previas.

→ Pueden adquirir nuevas habilidades procedimentales (por ejemplo, dibujar a través de un espejo) sin tener recuerdo episódico de haber practicado.

Esta disociación es uno de los argumentos clínicos más fuertes para distinguir entre memoria declarativa (afectada) y memoria procedimental (preservada).

Cierre · ideas para llevarse

Aprendizaje

→ El conductismo describe el aprendizaje a través de relaciones observables entre estímulos, respuestas y consecuencias.

→ Watson y Skinner aportan dos paradigmas complementarios.

→ Tolman, Köhler y Bandura introducen variables internas y sociales que el conductismo radical no explica.

Memoria

→ La memoria no es un almacén único: hay sistemas con propiedades distintas (sensorial, MCP, MLP; declarativa vs. procedimental).

→ El recuerdo depende tanto de cómo se codifica como de cómo se recupera.

→ La clínica de la amnesia es una herramienta clave para mapear esos sistemas.