Samenvatting leerpsychologie

Samenvatting leerpsychologie
1. basisconcepten en definities
1.1 fundamentele functies van leren
 Leren is één van de fundamentele karakteristieken van gedrag
 Het gaat zowel om intentioneel, bewust leren al som incidenteel, onbewust leren
 Leren wordt geïdentificeerd door een verandering in gedrag
o Veel (maar niet alle!) instanties van leren verijzen het verwerven van nieuwe responsen.
 De verandering in gedrag welke gebruikt wordt om leren te identificeren kan een toename of
een afname zijn van een particuliere respons
o We kunnen leren iets niet te doen
1.1.1 leren en andere vormen van gedragsveranderingen
 Niet alle instanties waar gedrag gewijzigd wordt, zijn instanties van leren
 Leren is relatief duurzame gedragsverandering
o Oorzaken van tijdelijke gedragsverandering (≠ leren)
 Vermoeidheid
 Tijdelijke veranderingen in fysiologische/ motivationele toestanden
 Tijdelijke veranderingen in omgevingsstimuli
o Eens iets geleerd is, zal het herinnerd blijven voor een substantiële periode in de tijd
 Leren is een relatief duurzame gedragsverandering veroorzaakt door specifieke ervaring
o Andere oorzaken van relatief duurzame gedragsverandering= Maturatie
 Maturatie vereist geen oefening of ervaringen die specifiek in verband staan met
het geleerde gedrag
 De ervaring/ oefening bij leren kan variëren van éénmalig (on trial learning) tot
erg veel maar is wel noodzakelijk om van leren te kunnen spreken
 Hetzelfde maturatie proces kan gedragsveranderingen produceren in een variëteit
van situaties
 Gedragsveranderingen veroorzaakt door leren zijn relatief specifiek/ beperkt
tot het geleerde gedrag (MAAR er is wel enige mate van generalisatie mogelijk
naar gelijkaardige situaties/gedragingen)
o Andere oorzaak van relatief duurzame gedragsverandering= Evolutie
 Net zoals bij leren zijn gedragsveranderingen door evolutie het resultaat van
interacties met de omgeving
 Evolutionaire veranderingen gebeuren voer generaties heen, leren vindt plaats
binnen het leven van 1 individu
 Leren is zelf wel een product van evolutie
 Leren is een relatief duurzame verandering in het gedragspotentieel
o Afwezigheid van performantie/ gedragsverandering wil niet zeggen dat er niet geleerd is
o Veranderingen (leren) kan alleen tot uiting komen in bepaalde condities
1.1.2 leren, prestatie en niveaus van analyse
 Alleen door een verandering in gedrag op te merken, kan er besloten worden dat er leren
optrad.
o De verandering is alleen evident onder speciale omstandigheden
o Leren kan behaviorally silent zijn (= geen zichtbare gedragsmanifestatie hebben)
o Performantie= de observeerbare acties die een individu doet.
 Leren is één van de factoren die performantie determineren
 Leren vereist een verandering in het potentieel om iets te doen
1
o Gedrag wordt gereguleerd door zenuwsysteem. Dus leren betreft een duurzame
verandering in de neurale mechanisme van gedrag
 Gevolg: leren kan bestudeerd worden op verschillende niveau
 Moleculaire veranderingen in zenuwcellen of neuronen
 Veranderingen in neurotransmittersysteem en neuronale circuits geassocieerd
met leren
 Veranderingen in het gedrag van het gehele organisme
 Drie fundamentele types van ‘ervaring’
o Ervaring met een prikkel/ gebeurtenis op zich
 Louter herhaald blootgesteld worden aan een bepaalde prikkel
 Habituatie/ sensitisatie
o Ervaring met de relatie tussen twee prikkels/ gebeurtenissen
 S-S leren
 Klassieke/ pavloviaanse conditionering
o Ervaring met de relatie tussen het eigen gedrag en de consequenten in de omgeving
 Operante conditionering
 Effecten van de eigen acties op de omgeving
1.1.3 een definitie van leren
 leren is een relatief duurzame verandering in het potentieel om een bepaald gedrag te
stellen, die toe te schrijven is aan ervaring met gebeurtenissen in de omgeving die specifiek
gerelateerd zijn aan dat gedrag.
1.2 naturalistische vs. experimentele observaties
 naturalistische observatie: observeren en meten van gedrag zoals het verschijnt onder
natuurlijke omstandigheden, in de afwezigheid van interventies/ manipulaties door de
onderzoeker
o kan nooit antwoord geven op oorzaken van gedrag(verandering), enkel hypothesen
genereren
o beschrijvend/ correlationeel/ differentieel onderzoek
 experimentele observatie: meten van gedrag onder condities die speciaal ontworpen zijn door
de onderzoeker om particuliere factoren/ variabelen te testen welke het leren of de
performantie van het gedrag zouden kunnen beïnvloeden
o kan leiden tot causale uitspraken
o MAAR de oorzaak van gedrag kan niet rechtstreeks geobserveerd worden
 Moeten geobserveerd worden door verschillen in het gedrag in verschillende
experimentele condities
 Causale conclusies zijn inferenties gebaseerd op een vergelijking van twee ( of meer)
experimentele condities
1.3 het fundamentele leerexperiment
 Kritiek aspect van onze definitie is dat leren een resultaat is van het verleden. Om te besluiten
dat leren plaatsvond, moeten we zeker zijn dat de verandering in gedrag veroorzaakt is door
een ervaring in het verleden
 Werken met (minstens) 2 groepen: experimentele en controle groep
o Zijn gelijkgesteld op alle ( persoon/ omgeving)variabelen
o Experimentele groep krijgt kritische leerervaring (OV) op een bepaald moment (T)
o Verandering in gedrag (AV) wordt in beide groepen gemeten op moment (T+1) en
vergeleken met elkaar
2
1.3.1 het controle probleem in studies over leren
 Adequate controlegroep is essentieel
 Gevolg 1: leren kan niet onderzocht worden in een naturalistische observatie
 Gevolg 2: controle groep moet op alle punten gelijk zijn aan experimentele groep, behalve
wat betreft de kritische onafhankelijke variabele
 Gevolg 3: meestal wordt er gebruik gemaakt van een between subject design, soms ook van
een within subject design (vooral in Skineriaanse traditie)
o Visuele voorstelling: zie Blz. 11
1.3.2 de algemene proces benadering voor de studie van leren
 Assumptie: dezelfde fundamentele leerprocessen zijn aan de orde in een veelheid van
leertaken/ situaties, en dit in principe bij alle diersoorten
 Assumptie: er bestaan een aantal universele leerwetmatigheden
 ! ontkent niet dat er bij verschillende leertaken of bij verschillende diersoorten verschillende
soorten prikkels/ responsen kunnen zijn of dat bepaalde leertaken relatief moeilijker/
makkelijker kunnen verlopen
 Algemene regels van leren kunnen ontdekt worden door eender welk soort of eender welk
gedragssysteem welke leren vertoont, te bestuderen
1.3.3 het gebruik van niet menselijke subjecten in onderzoek naar leren
 Voordelen:
o Betere kennis en controle over leergeschiedenis
o Betere precisie en controle over leeromgeving en leertaak
o Herhaald testen/ trainen is goed mogelijk (zelfde individu observeren in zelfde
omstandigheden)
o Kennis en controle over genetica
o Grotere controle over motivationele factoren welke het leren kunnen beïnvloeden
o Betere kans om de invloed van taal te minimaliseren
o Minimale invloed van vraag effecten
 Inadequate alternatieven
o Observationeel (veld) onderzoek: geen controlegroep
o Studies op planten: hebben geen zenuwsysteem
o Studies op weefselculturen: kan interessant zijn, maar zonder gedragsmatig onderzoek
met intacte organismen, kan men niet determineren wat het belang is van een bepaald
celulair proces
o Computersimulaties : er zijn vele observaties nodig voordat men een goede pc simulatie
kan maken
2. De structuur van ongeconditioneerd gedrag
2.1 shaping en homogene vs. heterogene substraten van gedrag
 Door middel van shaping kan een organisme zijn gedrag geleidelijk aan veranderd worden
zodat het nieuwe responsen kan uitdrukken
 Analogie: klei boetseren tot het gewenste object gebeurt ook stapje voor stapje (klei is
homogeen substraat dat in eender welke richting vervormd kan worden)
 Gedrag is een heterogeen substraat: veranderingen in gedrag vinden plaats in de context van
genetisch geprogrammeerde predisposities die ervoor zorgen dat bepaalde veranderingen
makkelijker plaatsvinden
 Alle instanties van leren reflecteren een interactie tussen de training procedure en het reeds
bestaande gedrag van het individu
3
2.2het concept van de reflex
 De kleinste eenheid van ongeconditioneerd gedrag is de reflex
 Descartes: belangrijke aspecten van het menselijke leven zijn vrijwillig. Daarnaast zijn er
schijnbaar automatische en onvrijwillige reacties wat hij bestempelt als een reflex
o Analogie met ‘bewegende standbeelden’
o Onvrijwillige reacties op bepaalde stimuli zijn voorbeelden van uitgelokt gedrag
o Reflexboog: het volledige geheel van stimulus input naar respons output.
 Ontlokkende prikkel wordt via een receptor cel waargenomen en via een sensorieel
(afferent) neuron doorgestuurd naar een inter neuron. Deze stuurt de info naar
efferente neuronen (motorisch neuron) dat via de effector zorgt voor een ontlokte
respons
 Visuele voorstelling: blz. 18
o Reflexen zijn betrokken in vele aspecten van gedrag die nodig zijn om noodzakelijke
levensfuncties te hand haven
2.3 complexe vormen voor uitgelokt gedrag
 Reflexen gelden niet enkel voor de elementaire regulatie van vitale levensfuncties. Maar ook
voor complex gedrag en complexe sociale interacties
 Vaak gaat het om complexe sequenties van specifiek ontlokkende prikkels en specifieke
responsen
 Bv. Paargedrag stekelbaars
o Mannetje bouwt nesttunnel in territorium
o Andere mannetjes in de buurtaanval
o Vrouwtje in territoriumzigzag zwemmen
o Vrouwtje volgt mannetje naar tunnel
o Vrouwtje in tunnel: mannetje raakt staart vrouwtje aan
o Vrouwtje legt eitjes in tunnel
o Mannetje bevrucht de eitjes en jaagt vrouwtje weg
o !! als de reactie van 1 van de 2 faalt in het uitlokken van de volgende respons bij de
partner, dan is de sequenties van acties verstoord en beëindigd de sociale interactie
2.3.1 modale actie patronen (MAP)
 Lijkt op een reflex, maar is complexer vermits er verschillende spiergroepen bij betrokken zijn
 Aangeboren patronen van ontlokt gedrag die specifiek zijn voor een bepaalde soort
 Eerder actiepatronen ipv responses ( want niet beperkt tot 1 spierbeweging)
 Modaal: meeste leden van de soort vertonen het actiepatroon op erg gelijkwaardige wijze
 Soort specifiek gedrag
2.3.2 signaalprikkels
 MAP treedt op in de context van rijke/ complexe prikkelcondiguraties
 Signaalprikkels: de beperkte set van cruciale prikkelkenmerken van de complexe ontlokkende
prikkelconfiguratie, die noodzakelijk en voldoende zijn om een modaal actiepatroon te
ontlokken
o Vaak een opvallend klein deeltje van de cues die normaal een actiepatroon zouden
uitlokken
 Bv: kop en nek van vrouwelijke kwartel is signaalprikkel voor seksuele benadering door
mannetjes kwartel
o De visuele cues van het rest van het lichaam, bewegingscues, auditieve, olfactieve of
tactiele cues zijn onbelangrijk
 Bv.: de punt vorm van de bek en de rode stip op de bek van de moeder is signaalprikkel voor
de pikrespons op de bek door de kuikens bij meeuwen
4
o De vorm van de kop, de ogen, geluiden,… zijn onbelangrijk
2.4 de organisatie van uitgelokt gedrag
 Uitgelokte gedragingen gebeuren niet onafhankelijk van elkaar. Ze zijn georganiseerd op
speciale manieren.
 De organisatie kan het gevolg zijn van aangeleerde of niet- aangeleerde factoren
2.4.1 motivationele factoren
 Cruciaal in de coördinatie van Modale actiepatronen is de interne status van het organisme
 Hydraulisch model (Lorenz): motivationele toestand brengt het organisme in gereedheid voor
een bepaald soort MAP. Een signaalstimulus triggert dan het MAP tegen deze achtergrond
o Bepaalde factoren leiden tot de opbouw en ontlading van een bepaald type motivatie/
drive
 Bv. Verbruik van energie en voedingsstoffen doet de honger drive toenemen
 De aandacht voor signaalstimuli verhoogt en de drempel voor de activering van
voeding gerelateerde Maps verkleint
 De MAP tot eten wordt ontlokt waardoor de honger drive afneemt
2.4.2 appetitieve en consumatorisch gedrag
 Betreft een sequentiële organisatie: Appetitief gedrag bestaat uit activiteiten die het
organisme toelaten om in contact te komen met signaalprikkels die het modale actiepatroon
zullen ontlokken welke op hun beurt zorgen voor het beëindigen van de responssequentie
 Appetitief gedrag: exploreren van de omgeving naar voedselbronnen
o Variabel gedrag welke optreedt als reactie op algemene spatiale cues
o Betreft een brede reeks van mogelijke activiteiten
 Consummatorisch gedrag: beëindigen de respons sequentie omdat ze de motivatie
beëindigen
2.4.3 gedragssystemen
 Timberlake: voeding- gedragssysteem bestaat ui meer dan 2 (appetitief- consummatorisch)
componenten
o Algemene zoekmodus: het dier reageert op algemene kenmerken van de omgeving met
reacties die toelaten om in contact te komen met verscheidenheid aan potentiële
voedselbronnen
o Focale zoekmodus: focussen op een specifiek aspect van de omgeving
o Hanteren en opeten van voedsel (= Consummatorisch gedrag)
 Gedragssystemen zijn beschreven voor een variëteit van verschillende functies die
organismen hebben om te slagen in hun leven
 Kenmerken
o Bestaan vaak uit sequenties van 3 of meer gedragsmodi
o De sequentie van respons modi is lineair (men gaat van de ene respons naar de andere,
zonder er eentje over te slaan)
o De sequentie is bi-directioneel
o Elke respons modi vereist specifieke responsen en een toegenomen aandacht/
sensitiviteit voor specifieke prikkels
 Dergelijke georganiseerde gedragssystemen werden beschreven in een veelheid van
domeinen (bv. Voortplanting, voeding, zorg voor jongen,…)
 Leren ent zich op dit complexe, heterogene en georganiseerde substraat van
ongeconditioneerd gedrag, bestaande uit eenvoudige reflexen, meer complexe modale
actiepatronen, en sequentieel georganiseerde gedragssystemen
5
3. Habituatie en sensitisatie
Inleiding
 Meest voorkomende en eenvoudigste vormen van gedragsverandering
 Ze kunnen optreden in alle meer complexe procedures
 Meest bestudeerd in reflex systemen
o Descartes: reflexen hebben 2 hoofdkenmerken
 De kracht van de ontlokkende respons is direct gerelateerd aan de intensiteit van de
ontlokkende stimulus
 Een reflexmatige respons zal altijd optreden wanneer de uitlokkende stimuli aanwezig
is
o MAAR reflexen blijken niet altijd met dezelfde intensiteit op te treden (uitgelokt gedrag kan
flexibel zijn)
 Habituatie en sensitisatie reguleren onze reflex responsen en doen de efficiëntie toenemen
van onze interacties met de omgeving
o Bv. oriënteringsrespons: we richten ons naar nieuwe stimuli, maar als alle stimuli in de
omgeving onze aandacht zouden trekken, vereist dat teveel inspanning
 Habituatie en sensitisatie zijn de eerste principes van gedragsorganisatie gebaseerd op
ervaring
3.1 algemene principes van regulatie
 Iets wordt gereguleerd wanneer zijn functies gehandhaafd worden binnen acceptabele
limieten of binnen een vastgelegd doelbereik (=homeostatisch niveau)
 Om een systeem te handhaven binnen een bepaald bereik, moeten krachten die het systeem
in de ene richting duwen, tegengegaan worden door krachten die het systeem terug naar het
vereiste homeostatisch niveau brengen.
 Regulatie wordt bekomen door de activatie van opponenten processen
o Habituatie en sensitisatie zijn tegengestelde processen welke de intensiteit van het
uitgelokt gedrag regelen
 Opponente- proces theorie van motivatie/ emotie (Solomon)
o Emotionele reacties zijn vaak tweefasig: primaire reactie/ toestand gevolgd door
tegenovergestelde secundaire reactie/ toestand
o Bij herhaling wordt de primaire reactie zwakker, de secundaire reactie wordt sterker. (bv.
Alcohol, sauna,…)
o A proces:
 treedt onmiddellijk op
 Sterkte is functie van intensiteit ontlokkende prikkel
 Eindigt snel na aanbieding prikkel
o B proces:
 Eerst traag, zwak en relatief kortdurend
 Blijft tijdje aanhouden na aanbieding prikkel
 Wordt door oefening sneller, intenser en duurzamer
 Wordt terug trager, zwakker, relatief kortdurend bij gebrek aan oefening
3.2 effecten van herhaalde presentatie van een uitlokkende stimulus
 Exp. Zie blz. 31
o Langer kijken naar complexe patronen
o Bij het eenvoudige patroon treedt habituatie op ( afname aandacht)
o Bij het complexe patroon treedt eerst sensitisatie op en vervolgens habituatie
 Habituatie effect: afname in de sterkte of de probaliteit van een respons ten gevolge van
herhaalde aanbieding van de ontlokkende prikkel
6
 Sensitisatie effect: toename in de sterke/ probaliteit van een respons ten gevolge van
herhaalde aanbieding van ontlokkende prikkel
 Exp.: startle respons
o = plotse beweging veroorzaakt door sterk, nieuw geluid
o Bij herhaalde aanbieding van het plotse geluid, treedt er habituatie op
 Hoe intenser de stimuli, hoe moeilijk om er aan gewend te geraken
 Stimulus generalisatie van habituatie: habituatie effect is overgedragen naar nabijgelegen
locaties
3.2.1 karakteristieken van habituatie effecten
 Effecten van stimulus verandering
o Habituatie is specifiek voor de particuliere stimulus welke herhaaldelijk aanwezig was
o Als er een nieuwe stimulus aanwezig is, zal de gehabitueerde respons herstellen
o Er is dus sprake van stimulus specificiteit
o Stimulus generalisatie van habituatie: het habituatie effect wordt overgedragen naar
andere prikkels die sterk lijken op de oorspronkelijke prikkel
o Exp.: blz. 34
o ! vermoeidheid is dus niet de oorzaak van habituatie: als vermoeidheid een rol speelt, zou
er geen nieuw habituatie proces optreden bij het aanbieden van een nieuwe stimulus
 Effecten van time-out van stimulatie
o Habituatie effecten zijn vaak temporeel
o Spontaan herstel: als de stimuli niet meer gepresenteerd wordt, verdwijnt het habituatie
effect
o De mate van spontaan herstel is afhankelijk van de grote van het tijdsinterval zonder
prikkelaanbieding ( hoe groter het tijdsinterval, hoe meer spontaan herstel)
o Er treedt niet altijd spontaan herstel op! (bijvoorbeeld bij flavor neophobia)
o Korte termijn habituatie: case waarin substantiële spontaan herstel optreedt
 Komen niet overeen met leren, want niet duurzaam
o Lange termijn habituatie: case waarin substantieel spontaan herstel niet optreedt
 Komt overeen met leren
o Deze twee vormen zijn niet mutueel exclusief: ze kunnen tegelijk plaatsvinden
 Effecten van stimulus frequentie
o Frequentie van eens stimulus refereert naar hoe vaak de stimulus herhaald wordt binnen
een bepaalde tijd
o Hoe hoger de frequentie, hoe korter de periode van rust tussen de herhalingen. Dus
minder kans op spontaan herstel
 Effecten van stimulus intensiteit
o Hoe intenser de stimuli, hoe minder kans op habituatie
 Effecten van blootstelling aan een tweede stimulus
o Habituatie wordt niet alleen getermineerd door de uitlokkende stimulus. Het niveau van
reageren wordt ook beïnvloed door andere stimuli welke het organisme ervaart
o Dishabituatie: blootstelling aan een tweede stimuli kan resulteren in het herstel van een
voordien geleerde habituatie respons
o Exp. Blz. 37
 Steeds minder visuele aandacht voor schaakpatroon
 Schaakpatroon+ geluid aanbieden: terug langer kijken naar patroon (!! Dus niet
richten op geluid)
7
3.2.2 karakteristieken van sensitisatie effecten
 Hoe intenser de prikkel, hoe meer sensitisatie
 Hoog frequente aanbieding leidt tot snellere sensitisatie dan laag frequente aanbiedingen
 Korte termijn sensitisatie: resultaat van tijd zonder stimulatie (respons daalt na verloop van
tijd)
 Lange termijn sensitisatie: sensitisatie is evident zelfs na een aanvaardbare periode zonder
stimulatie (respons blijft stijgen)
 Veel minder prikkel specificiteit
3.3 de duale proces theorie van habituatie en sensitisatie
 Groves en Thompson
 Onderscheid tussen onderliggende processen en observeerbare fenomenen
o Habituatie en sensitisatie fenomeen: performantie effect
o Habituatie en sensitisatie proces: refereert naar de onderliggende gebeurtenissen die
verantwoordelijk geacht worden voor de gedrag habituatie en sensitisatie effecten
 Gebaseerd op 2 onderliggende processen: sensitisatie en habituatie proces
 Actief in twee functioneel onderscheiden systemen in het zenuwstelsel: S-R systeem en
Toestand systeem
3.3.1 het S-R systeem en het toestand systeem
 S-R systeem
o Het kortste pad in het zenuwsysteem tussen een ontlokkende stimuli en het
resulterende ontlokte gedrag
o = reflexboog van Descartes
o Bestaat uit 3 neuronen: sensorisch (afferent) neuron, inter neuron, motorisch (efferent)
neuron
 Toestand systeem
o Bestaat uit alle neuronale processen die niet zelf deel uitmaken van het S-R systeem,
maar die de responsiviteit van het S-R systeem beïnvloeden
o Opstijgende zenuwbanen naar en dalende zenuwbanen vanuit de hersenen
o Moduleren de activiteit van het S-R systeem
 Habituatie proces vindt plaats in S-R systeem, sensitisatie proces in toestand systeem
o Kunnen simultaan geactiveerd worden
o Werken als opponente mechanismen
o Het netto effect van beide processen bepaald het observeerbare gedrag
 Habituatie effect sterker dan sensitisatie  daling in gedragsoutput
 Sensitisatie effect sterker dan habituatie  toename in gedragsoutput
o Zowel habituatie als sensitisatie zwakken af na verloop van tijd zonder bijkomende
stimulatie
3.3.2implicaties van het de duale proces theorie
 S-R systeem is meest primitieve mechanisme van uitgelokt gedrag
o Gevolg: wordt altijd geactiveerd wanneer een uitlokkende stimulus aanwezig is
o Elke activatie van S-R systeem leidt tot opbouw van habituatie proces (dus habituatie is
universeel kenmerk van ontlokt gedrag)
o Of er een habituatie effect optreedt, is afhankelijk van de activatie van het
toestandssysteem en het tijdsinterval sinds de laatste aanbieding van de prikkel
 Sensitisatie effect is niet universeel voor elk ontlokt gedrag
o Enkel bij de aanbieding van erg intense of betekenisvolle prikkels wordt het toestand
systeem geactiveerd
o Farmaca of emoties kunnen invloed uitoefenen op toestand systeem
8
o Sensitisatie proces kan geactiveerd worden door een andere gebeurtenis dan de
ontlokkende stimuli OF door de ontlokkende stimuli zelf
 Bv aanbieding luide toon activeert toestand systeem: sensitisatie proces stijgt.
Sensitisatie wordt groter dan habituatie, dus visuele aandacht stijgt
 dishabituatie
 Zwaktes
o Biedt geen adequate verklaring voor langer termijn habituatie, noch voor lange termijn
sensitisatie effecten
o Deze fenomenen veronderstellen ook vormen van associatief leren
 Sterktes
o Kijkt naar verschillende patronen ( habituatie, sensitisatie)
o Bekijkt de effecten van tijdsverloop
o Effecten van stimulus frequentie
o Prikkel specificiteit en generalisatie van habituatie
o Dishabituatie
o A- specificiteit van sensitisatie
4. Pavloviaanse conditionering: basis concepten
Inleiding
 Associatief leren: wat we leren over combinaties van stimuli
 Leren voer de samenhang tussen gebeurtenissen/ prikkels in de omgeving waarbij de relatie
zich voordoet onafhankelijk van het gedrag van het organisme
 Gedrag ontlokt door prikkel wijzigt hier ten gevolge van het samengaan van deze prikkel met
een andere prikkel
4.1 pavlov zijn spreekwoordelijke bel
 Er wordt herhaaldelijk een bel aangeboden welke onmiddellijk gevolgd wordt door toediening
van voedsel.
o Aanvankelijk: enkel speekselsecretie bij toediening voedsel
o Na verloop van tijd ook speekselsecretie bij de bel
 Basisterminologie
o Voorwaardelijke prikkel (VP) =conditioned stimulus (CS)
 de bel
o onvoorwaardelijke prikkel (OP)= unconditioned stimulus (US)
 voedsel
o onvoorwaardelijke respons (OR)= unconditioned respons (UR)
 speekselsecretie door voedsel
o voorwaardelijke respons (VP)= conditioned respons (CR)
 speekselsecretie door bel
4.2 hedendaagse pavloviaanse conditionering voorbereidingen
4.2.1 appetitieve conditionering
 procedure wordt vaak gehanteerd bij duiven en ratten
 procedure met duiven
o duiven zijn gematigd uitgehongerd
o gebruik gemaakt van skinner box
o geconditioneerde stimulus: licht geprojecteerd op kleine plaat of respons sleutel boven
het voederbakje
o geconditioneerde procedure: het lichtje enkele seconden doen branden alvorens een
kleine hoeveelheid voedsel te geven
9
o resultaat: na een aantal aanbiedingen, beginnen de duiven op de responssleutel te
pikken van zodra het oplicht (ze blijven pikken zelfs wanneer ze geen voedsel meer
krijgen dus er is sprake van niet doelgericht gedrag)
 het licht wordt een signaal voor voedsel
o visuele voorstelling zie Blz. 48
 hier is sprake van sign tracking= autoshaping:
 procedure met ratten
o voorwaardelijke prikkel: toon/ lichtje op plafond
o onvoorwaardelijke prikkel: voedsel
o resultaat: het horen van de toon laat het hoofd van de rat bewegen ( head jerk)/ rat gaat
op achterste poten staan om aan het lichtje te geraken
o dus verschillende soorten VP kunnen verschillende soorten VR ontlokken, bij één zelfde
OP
4.2.2 aversieve conditionering
 wordt vaak onderzocht door gebruik te maken van de oogknipper reflex
 procedure 1
o deelnemers: mensen,
o VP: korte visuele of auditieve prikkel
o OP: luchtstootje tegen het oog ( of licht elektrische prikkel in de buurt van het oog)
o Respons: oogknipper reflex
 Procedure 2
o Deelnemers: konijnen, ratten
o VP: toon of licht
o OP: korte elektrische prikkel langs het rooster op de bodem van de kooi
o OR: opspringen
o VR: freezing ( volledig bewegingsloos zitten)
o Visuele voorstelling zie Blz. 49
 Geconditioneerde supressie
o Fase 1: aanleren van stabiel (operant) gedrag: drukken op hendel leidt tot voedsel
o Fase 2: klassieke vrees conditionering: toon (VP) leidt tot shock (OP) leidt tot freezing
o Fase 3, testfase: aanbieden van de toon tijdens het operant gedrag
o Resultaat: operant gedrag wordt onderdrukt, dier gaat freezen
 Supressieratio:
o aantal responsen tijdens de toonprikkel/ ( aantal responsen tijdens toonprikkel+ aantal
responsen voor het aanbieden van toonprikkel)
o ondergrens= 0 (volledige supressie)zeer sterke pavloviaanse conditionering
o bovengrens= 0,5 (geen supressie) geen pavloviaanse conditionering
4.3 de natuur van de conditionele respons
4.3.1 skelet vs. autonoom vegetatieve geconditioneerde reacties
 in de standaardprocedures wordt er voornamelijk gebruik gemaakt van skeletresponsen
o sign tracking: skeletrespons
o head jerk, rearing
o oogknipper reflex
 maar pavloviaanse conditionering kan ook resulteren in rechtstreekse beïnvloeding van
skelet responsen
4.3.2 gelijkenissen van geconditioneerd en ongeconditioneerde gedragingen
 soms zijn de VR en de OR gelijkend (identiek) aan elkaar (bv. oogknipperreflex)
 maar het kan even goed zijn dat VR helemaal niet lijkt op OR (bv. freezing vs. opspringen)
10
4.3.3 de gedragssysteem benadering
 de OP activeert het gedragssysteem dat relevant is voor de OP in kwestie
o bv. voedsel activeert voedingssysteem, shock activeert defensiesysteem
 aard van de VR wordt bepaald door de manier waarop de VP geïntegreerd wordt in het
gedragssysteem dat geactiveerd wordt door OP
o voedingssysteem begint met algemene zoekmodus gevolgd door focale zoekmodus en
opeten van voedsel
 als VP gepresenteerd wordt voordat het dier voedsel krijgt, zal de VP ingekapseld
worden in één van de respons modi van het voedselgedragssysteem
 focale zoekmodus: toenaderingsgedrag (bv. sign tracking)
 consummatorische respons: hanteren van en bijten op de VP
o defensiesysteem
 shock= externe bron van pijn, zoals gebeten worden door slang: recht springen
 lichtprikkel= een slang zien/ruiken: freezing
4.4 de inhoud van pavloviaanse associaties
 S-R leren: VP lokt VR direct uit
o VP ontlokt VR rechtstreeks
o OP is de oorzaak van associatief leren en van de gedragsverandering, maar wordt niet
mee geëncodeerd
 S-S leren: VP activeert een representatie van de OP, welke de VR genereert
o VP ontlokt de VR onrechtstreeks, via activatie van de representatie van de OP
o OP wordt mee geëncodeerd
o VP activeert de verwachting/ doet denken aan de OP
o Als het resultaat van deze associatie, activeert de presentatie van de VP een neutrale
representatie van de OP
o Klassieke conditionering leidt tot het vormen van een associatie tussen de VP en OP
 visuele voorstelling zie Blz. 52
4.4.1 effecten van US devaluatie
 een krachtige techniek op het onderscheid te maken tussen S-R en S-S mechanisme
 de test impliceert het evalueren van de kracht van de VR nadat de motivatie om te reageren
om de OP veranderd is
o bij OP devaluatie wordt de motivatie verminderd
 procedure
o visuele voorstelling zie Blz. 53
o fase 1: acquisitie
 seksuele pavloviaanse conditionering bij mannelijke kwartels
 VP= lichtprikkel
 OP= toegang tot en paren met een vrouwtje
 VR= toenaderingsgedrag tot de lichtprikkel
o fase 2: OP devaluatie
 experimentele groep: seksuele motivatie doen dalen (devaluatie)
 controle groep: seksuele motivatie blijft gelijk
o test VP
 S-R leren ( lichtjetoenadering) : verandering in motivatie mag geen invloed hebben
op respons
 S-S leren (lichtjevrouwtjetoenadering): verandering in motivatie leidt tot
verandering respons
 Resultaten tonen evidentie voor S-S leren ( vermits er daling is in
toenaderingsgedrag)
11
4.4.2 effecten van US inflatie
 Motivatie doen stijgen
 Procedure 1
o Fase 1 acquisitie
 Smaak-smaak conditionering bij ratten
 VP: licht bittere smaak (kinine)
 OP: zout
 VR: drinken van bittere smaak oplossing
o Fase 2: Op inflatie
 Inductie van sodium tekort waardoor de voorkeur voor zout gaat toenemen
o Fase 3: test VP
 Hoeveel drinken de ratten van de kinine oplossing
 S-R leren: er zou geen effect mogen zijn
 S-S leren: er zou een toename moeten plaats vinden van het drinken
 De resultaten bieden evidentie voor S-S leren
 Procedure 2
o Fase 1 acquisitie
 Aroma- smaak conditionering bij mensen
 VP: neutraal fruitaroma
 OP: polysorbaat20 (erg slechte smaak)
 VR: lekker/slecht vinden van VP aroma
o Fase 2: OP inflatie
 Aanbieding van erg hoge dosis polysorbaat20( valentie van OP veel negatiever
maken)
o Fase 3: test VP
 Er is geen invloed van de OP inflatie, wat wijst op S-R leren
4.5 stimulus factoren in klassieke conditionering
4.5.1 CS nieuwigheid en het latente inhibitie effect
 Herhaalde blootstelling aan een stimulus kan resulteren in habituatie effect. Dit maakt hoog
gelijkaardige stimuli minder effectief in het uitlokken van sterke gedragsreacties
 Habituatie kan ook de effectiviteit van een stimulus verminderen die later gebruikt wordt als
VP in een conditioneringsprocedure
 Procedure Latente inhibitie (= VP-pre exposure effect)
o VP pre-exposure fase: Mensen in experimentele groep krijgen eerst herhaalde presentatie
van de stimulus die later als VP aangeboden wordt (in controle conditie krijgt men dit
niet)
o VP-OP aanbiedingen
o Test: de VP in de experimentele conditie is minder dan de VR in de controle conditie
 Meestal wordt dit effect verklaard in termen van een aandachtsproces
o Tijdens de pre- exposure daalt de aandacht voor VP
o Die verminderde aandacht verstoort het daaropvolgende leren van de VP-OP associatie
 = associatieve interferentie
 Geleerd om prikkel (toon) te negeren waardoor je er geen aandacht meer aan gaat
schenken
 Na aanbieding van de shock wordt het moeilijk om het verband tussen toon en shock
te leggen
o Alternatief: geheugen interferentie ( eerst leer je dat VP ongevaarlijk is, daarna moet je
leren dat dezelfde VP gevaarlijk is)
12
4.5.2 CS- US relevantie en selectieve associaties
 De OP activeert het gedragssysteem dat relevant is voor de OP in kwestie
 Elk gedragssysteem wordt gekenmerkt door specifieke responsen en een verhoogde
aandacht/ sensitiviteit voor specifieke prikkels
 Procedure
o Fase 1
 Conditie 1: een smaak en een audiovisueel signaal wordt gekoppeld aan een shock
 Conditie 2: smaak en audiovisueel signaal wordt gekoppeld aan misselijkheid
o Fase 2: test
 Smaak of audiovisueel signaal worden apart aangeboden, men onderzoekt de ‘likes’
o Resultaat:
 In de misselijkheid conditie is er meer afkeer voor smaak
 In de shock conditie is er meer afkeer voor audiovisueel signaal
 De effectiviteit van VP in pavloviaanse conditionering hangt van de OP die gebruikt wordt
 Het is essentieel om de VP-OP INTERACTIE te kunnen aantonen
o VP1-OP1 > VP2-OP1 en tegelijk:
o VP1-OP2 ≤ VP2-OP2
 Instanties van selectief leren zijn niet absoluut (bv. de associatie toon- misselijk kan ook
geleerd worden, maar is moeilijker)
 Gelijkenissen tussen VP en OP vergemakkelijken de vorming van de associatie
4.6 het controle probleem in pavloviaanse conditionering
 Het is cruciaal om aan te tonen dat de gedragswijziging ten opzichte van de VP causaal toe te
wijzen is aan ervaring van een VP-OP relatie
o Dus habituatie en sensitisatie effecten moeten uitgesloten worden
 VP alleen controleconditie:
o Herhaald aanbieden van VP (zonder OP)
o Controleert wel voor sensitisatie effecten door herhaalde aanbieding van VP op zich
o Controleer niet voor sensitisatie effecten (of dishabituatie) door OP aanbiedingen
 OP alleen controleconditie
o Herhaald aanbieden van OP (zonder VP)
o Controleert voor sensitisatie effecten door herhaalde aanbieding van OP
o Controleert niet voor sensitisatie effecten door herhaalde aanbiedingen van VOP
 Zuiver random controle conditie
o Aanbieding van VP en OP, even frequent als in de experimentele conditie, maar het
moment waarop ze aangeboden worden is at random en onafhankelijk van elkaar
o Controleert voor effecten van herhaalde aanbieding van VP op zich en van OP op zich
o Probleem: geen zuiver neutrale basislijn; sluit associatief leren niet uit
 Incidentiele VPOP aanbiedingen zijn niet uitgesloten
 Contextuele cues (bv. kooi) kunnen bron zijn van associatief leren
 Prikkelcompetitie: hoe meer contextconditionering, hoe minder ruimte voor
toonconditionering ( toon zou zelfs deels een veiligheidssignaal kunnen worden)
 VP+/VP- discriminatieve controle
o De helft van de VP aanbiedingen worden gevolgd door een OP, de andere helft worden
getoond zonder gevolg te worden door OP
o De VP+ en VP- beurten worden random toegewezen
o Voor de ene helft van de profpersonen is VP+ een licht en VP- een toon, voor de andere
helft is het omgekeerd
o Associatief leren wordt enkel geïnterfereerd wanneer VRvp+ > VRvpo Controleert voor herhaalde aanbieding VP en herhaalde aanbieding OP op zich
 Niet gepaarde controle
13
o Aanbieding VP en OP even frequent als in experimentele conditie, maar VP en OP
komen nooit samen voor
o Controleert voor effecten van herhaalde aanbieding VP op zich en OP op zich
o Maar VP kan inhibitorisch worden
4.7 prevalentie van pavloviaanse conditionering
 Klassieke conditionering is meest voor de hand liggend wanneer een gebeurtenis betrouwbaar
optreedt kort voor een andere gebeurtenis
 Wordt vaak onderzocht in hoe mensen een bepaalde gebeurtenis beoordelen als de oorzaak
van een andere gebeurtenis
 Drugs tolerantie en verslaving
 Kinderlijke en moederlijke reacties tijdens voeden
 Leren voer seksuele situaties
5. Stimulus relaties in pavloviaanse conditionering
5.1 temporele relaties tussen CS en US
5.1.1 simultane conditionering
 De VP en OP worden op het zelfde moment aangeboden
 Bevat perfecte temporele contiguïteit
 In veel gevallen biedt dit geen sterke evidentie voor conditionering
5.1.2 uitgestelde conditionering
 VP wordt in de tijd iets voor OP aangeboden en duurt minimaal tot het begin van de
aanbieding van OP (dus geen leegte tussen OP en VP)
 Levert het sterkste conditioneringseffect op
5.1.3 spoor conditionering
 VP wordt in de tijd iets voor OP aangeboden, maar is niet meer aanwezig bij het begin van de
aanbieding van OP
 Er is ene leeg interval ( trace interval) tussen VP en OP
 Leidt tot zwakkere conditionering dat bij uitgestelde conditionering ( ze vereisen een ander
soort geheugen systeem)
5.1.4 effecten van CS- US interval
 Cruciaal voor associatief leren: hoeveel tijd zit er tussen het begin van de VP en de
presentatie van de OP
 =inter stimulus interval
 Bijna geen evidentie voor leren bij simultane conditionering ( interval = 0)
 Meer evidentie bij uitgestelde conditionering (interval >0)
o Vaak curvilineair verband: tot een bepaald interval stijg VR, daarna is er een
progressieve daling van VR
 Hoe groter het interval wordt, hoe kleiner de evidentie voor leren
 Hoe snel de daling plaats vindt, is afhankelijk van het antwoord systeem dat geconditioneerd
wordt
o Oogknipperreflex: geen effect bij een interval van 0, stijging tot interval van 0,2 tot 0,5
daarna terug daling
o Geconditioneerde suppressie: effect stijgt tot interval van ongeveer 2 minuten, daarna
daling
o Smaakaversie: effect stijgt tot bepaald uur voordat het begint te dalen
14
 Leren over de langste intervallen wordt gezien bij smaak- aversie leren ( intervallen zijn daar
een paar uur groot)
o =lang uitgesteld leren (long delayed): representeert leren met VP-OP intervallen die een
heel stuk langer zijn dan de intervallen welke geconditioneerde suppressie of
oogknipper conditionering steunen.
5.1.5 temporele codering van US optreden
 Pavloviaanse conditionering is hoog sensitief voor tijd factoren
 Tijd is belangrijke determinant van ( de mate van) conditionering
 Maar tijd is ook iets waarover wordt geleerd in klassieke conditionering
o = temporele code
o Je leert DAT de OP komt maar ook WANNEER de OP komt
5.2 signaal relaties tussen CS en US
 = informationele relatie
 Geconditioneerde responsen ontwikkelen sneller met procedures waarin de VP betrouwbare
informatie biedt over het optreden van OP. De VP fungeert als een betrouwbaar signaal voor
de OP
 In typische uitgestelde conditionering
o Elke VP wordt gevolgd door een OP (nooit VP alleen)
o OP wordt steeds voorafgegaan door VP (nooit alleen)
o Er is dus een perfecte statistische contingentie tussen het optreden van de VP en het
optreden van de OP
5.2.1 CS/US contiguïteit en blocking effect
 Hoe kan de signaal relatie tussen VP en OP verstoort worden?
o De VP aanbieden met een andere cue die de OP reeds voorspelt.
 De VP zal redundant zijn en er zal slecht een beetje conditionering plaats vinden
o = Blocking effect
 Voorbeeld
o Stel allergisch voor garnalen
o Als je garnalen eet wordt je misselijk
o Leidt tot aversie voor garnalen
o Op een bepaald moment eet je garnalen samen met shitake, nadien weer misselijk
o Gevolg: je verwerft geen aversie voor de Shitake
 Dus dat gene wat een individu leert over de VP wordt beïnvloed door de aanwezigheid van
andere cues welke voordien geconditioneerd waren met de OP
o Er bestaat al een goede predictor voor misselijkheid. Deze blokkeert het conditioneren
van een nieuwe prikkel
 Experiment
o Fase 1: perfecte contingentie tussen licht (VP) en schok (OP)
o Fase 2:
 Perfecte contingentie tussen licht en schok
 Maar ook perfecte contingentie tussen toon en schok
o Resultaat: geen ( of toch veel minder) conditionering op later toegevoegde toon prikkel
(hoewel die even predictief is)
 DUS contingentie en contiguïteit zijn geen voldoende voorwaarden voor klassieke
conditionering. De VP moet predictief zijn en niet redundant zijn!!
15
5.2.2 CS/US contingentie
 = de mate waarin de aanwezigheid van de ene stimulus kan dienen als basis om de andere
stimulus te voorspellen
 Statistische contingentie tussen VP en OP kan worden uitgedrukt in termen van twee
conditionele probaliteiten
o P (OP │VP)= kans op het optreden van OP gegeven VP
o P (OP│ geen VP)= kans op het optreden van OP gegeven geen VP
o de verhouding tussen deze probaliteiten is een cruciale determinant van klassieke
conditionering
 P (OP│VP) > P (OP│ geen VP): positieve contingentie
o VP is predictor voor aanwezigheid OP
o Exitatorische conditionering
 P (OP │VP) = P (OP│ geen VP): nul contingentie
o VP voorspelt OP niet
o Geen conditionering
 P (OP │VP)< P (OP │geen VP): negatieve contingentie
o VP is predictor voor de afwezigheid van OP
o Inhibitorische conditionering
 Zie cursus functieleer 2de bachelor / notities leerpsychologie voor berekeningen
5.3 hogere orde relaties in pavloviaanse conditionering: geconditioneerde inhibitie
 De focus ligt niet op hoe VP de OP voorspelt maar wel op hoe de VP informatie verschaft over
de relatie van een tweede VP met de OP
 = modulatie van een eenvoudige VP- OP relatie
 [ VP2(VP1OP)]
5.3.1 inhibitorische conditionering procedures
 VP wordt een signaal voor de afwezigheid/ het niet optreden van een op basis van andere
cues verwachte OP
 [ exitatorische conditionering: VP wordt signaal voor aanwezigheid OP]
 Standaard procedure
o A= licht/ B= toon / OP = shock
o A+ trials ( A wordt gevolgd door OP) worden afgewisseld met AB- trials (als A en B samen
voorkomen, volgt er geen shock)
o Op basis van A verwacht je OP
o B wordt een geconditioneerde inhibitor (OP treedt niet op ondanks dat A aanwezig is)
o In het algemeen geldt dat de exitatorische conditionering van A sneller verloopt dan de
inhibitorische conditionering van B
 Negatieve VP-OP contingentie
o P(OP │VP) < P (OP │ geen VP)
o Context cues fungeren als exitatorische VP’ s die de verwachting van OP induceren
o VP wordt een signaal voor het niet optreden van OP
o Nalezen blz. 76
5.3.2 gedragsmatige manifestaties van geconditioneerde inhibitie
 Een exitatorische VP ontlokt de manifestatie van VR
 Een inhibitorische VP onderdrukt de manifestatie van VR
 Probleem: hoe moet je een ‘onderdrukte VR’ onderscheiden van ‘geen VR’ ( wordt in beide
gevallen gedragsmatig op zelfde manier geuit)
 Summatie test
o = op performantie gebaseerde test van inhibite
16
o VP+ is exitatorisch. Hiervan het effect nagaan en gebruiken als baseline
o De effecten van inhibitorische stimuli ( VP-) nagaan door de VP+ en de VP- samen aan te
bieden
 VP+ alleen aanbieden
 VP+ samen met VP- aanbieden
 VP+ met een neutrale prikkel (VP0) aanbieden
o Als VP- inhibitorisch is, dan gaat de tweede conditie nul zijn
o De derde conditie moet kleiner resultaat opleveren dan de eerste conditie, maar groter
dan de tweede conditie
 Vertraagde acquisitie test
o Gebaseerd op de assumptie dat de geconditioneerde inhibitorische eigenschappen
zullen interfereren met de acquisitie van exitatorische eigenschappen van de stimulus
o De geconditioneerde inhibitie zal het daaropvolgend verwerven van geconditioneerde
excitatie bemoeilijken/ vertragen
o Procedure:
 Fase 1: creëren inhibitor vs. neutrale prikkel
 Inhibitor groep: A+/ XA- training of een negatieve contingentie X-OP
 Controle groep: X niet aanbieden of X alleen aanbieden
 Fase 2: excitatorische training
 In beide groepen X-OP training
 Als X actieve inhibitor is, dan is de acquisitie trager dan wanneer X neutraal is
5.4 hogere orde relaties in pavloviaanse conditionering: geconditioneerde facilitatie
 Geconditioneerde facilitatie procedure is gelijk aan de standaard inhibitorische procedure
omdat het 1 OP en 2 VP’ s betreft
 De stimuli worden zodanig aangeboden dat B aantoont of de A-OP relatie al dan niet geldig is
 Het enige verschil is dat bij inhibitie B voorspelt dat A-OP niet opgaat. Bij facilitatie voorspelt B
dat A-OP wel opgaat
5.4.1 stimulus relaties in geconditioneerde facilitatie
 Directe B-OP relatie
o B is de beste predictor van OP
o A is irrelevant
 Door B gefaciliteerde A-OP associatie [B(A-OP)]
o = hogere orde associatieve structuur
o Positieve modulatie= positive occasion setting
5.4.2 onderscheid tussen B-US en B ( A-US) relaties
 Er is evidentie voor beide oplossingen
 Ze zijn niet mutueel exclusief
 Er zijn verschillende determinanten die een rol spelen, maar 1 belangrijke determinant is de
tijdsrelatie tussen de twee VP’ s
o Sequentieel: BA+/A- : hiërarchisch B(A-OP)
o Simultaan: BA+ / A-: rechtstreeks: B-OP
 Hoe kan je onderscheiden of het om B-OP of B(A-OP) gaat?
o Aard van de geconditioneerde respons
 Gebruik maken van het feit dat verschillende soorten VP’ s soms kwalitatief
verschillende VR’ s kunnen ontlokken
 Bv. licht voedsel: key pecks / geluid  voedsel: rondwandelen
 Dus key pecks zijn indicatie voor licht –OP associatie, niet voor toon-OP
associatie
17
 AB+/ B-= geluid+ lichtvoedsel / licht  geen voedsel
 Observatie: key pecks bij geluid+ licht, niet bij alleen licht ( en ook geen
ronddwalen)
 Je krijgt dus een B(A-OP) structuur: het geluid voorspeld dat het lichtje zal leiden
doet voedsel
o Effect van uitdoving (extinctie) feature B
 Als er sprake is van een B-OP relatie dan…
 (B-Geen OP) is een disconformatie van B-OP
 Doet VR op BA trials dalen en discriminatie van A/ BA dalen
 Als er sprake is van B(A-OP) relatie…
 (B-geen OP) is geen disconfirmatie van B(A-OP) ( disconfirmatie zou zijn: B(Ageen OP)
 Doet VR op BA trials niet teniet, en discriminatie A/AB blijft behouden
6. Theorieën van associatief leren
Inleiding
 Van contiguïteit naar contingentie tussen VP en OP als noodzakelijke en voldoende
voorwaarde voor leren
 Blocking effect: ondanks perfecte contingentie B-OP géén gedragsmatige evidentie voor leren
B-OP relatie
o Fase 1: tien keer toonshock
US
USCS
10
0
10
CS0
10
10
10
10
P(US|CS)= 10/10=1
P(US|CS-)=0/10=0
o Fase 2: tien keer toon+lichtshock
US
USCS
10
0
10
CS10
20
30
20
20
P(US|CS)= 10/10=1
P(US|CS-)= 10/30=.33
! in beide gevallen hebben we positieve contingentie
o Licht voorspelt shock niet!
 De ontdekking van het blocking effect stimuleerde een vlaag van theoretische inspanningen
om associatief leren te karakteriseren
o Eerste en meest invloedrijke= Rescorla- Wagner model
o Snel opgevolgd door alternatieve modellen, die bepaalde tekortkomingen van RW model
probeerden op te vangen
 Theorieën spelen een belangrijke rol in de wetenschap want ze helpen ons om verder te gaan
dan het louter beschrijven/ catalogiseren van experimentele resultaten
o Theorieën geven antwoorden op hoe en waarom vragen
o Theorieën helpen om verschillende onderzoeksbevindingen samen te vatten en gidsen
toekomstig onderzoek
o Model of theorie creëren welke hypothetische constructen/ mechanismen gebruikt
 organisatie van en samenhangt tussen verschillende leerfenomenen
 predictie nieuwe bevindingen
18
6.1 het Rescorla- Wagner model
 Basis blocking effect
o Fase 1: experimentele groep: AOP
Controle groep: niets
o Fase 2: beide groepen: (A+B)OP
o Test fase: Bexperimentele groep: B is niet geconditioneerd
Controle groep: B is geconditioneerd
 Waarom blokkeert de aanwezigheid van de voordien geconditioneerde prikkel A het ontstaan
van geconditioneerd gedrag op B?
o Kamin: US moet verrassend zijn om leren te induceren
o A is reeds voorspeller van OP
o Men verwacht dus het optreden van OP bij aanbieden van AB-OP trialsOP is dus niet
verrassend geen vorming van een nieuwe BOP associatie
 Basis RW model: de effectiviteit van een ongeconditioneerde stimulus wordt bepaald door de
mate waarin het verrassend is
o Assumptie 1: iets is verrassend als het verschillend is van wat verwacht werd
 OP kan onverwacht groot/ sterk zijn: basisconditie voor excitatorisch leren en
toename van associatieve sterkte
 OP kan onverwacht klein/zwak zijn: basisconditie voor inhibitorisch leren en afname
van associatieve sterkte
o Assumptie 2: OP-verwachting is gebaseerd op de (reeds verworven) associatieve sterkte
van alle prikkels die op een gegeven trial aanwezig zijn (de OP voorafgaan)
o Assumptie 3:
 Sterke VR= index van een sterke verwachting van OP
 Zwakke VR= index van een zwakke verwachting van OP
 ΔV = k (λ – V)
o ΔV = verandering in associatieve sterkte van een prikkel op een trial
o k = constante = leerparameter die functie is van de saliëntie van de VP en de OP
o λ = asymptoot van leren voor bepaalde OP (= maximaal gesupporteerde associatieve
sterkte)
 λ = 1 als OP aanwezig op trial,
 λ = 0 als OP afwezig
o V = som van (reeds verworven) associatieve sterkte van alle VP’s aanwezig op een trial
o (λ – V) = mate waarin OP verrassend is = mate van “verwachtingsdiscrepantie”
 Ook wel: ΔV = αβ (λ – V)
o α = constante = leerparameter die functie is van de saliëntie van de VP
o β = constante = leerparameter die functie is van de saliëntie van de OP
o beiden variëren tussen 0 en 1
 bv. indien slecht 1 VP-A [ A+ A+ A+]
o ΔVA = αβ (λ – VA)
o Eerste trial: ΔVA= 0.20 (1-0)= 0.20
 VA=0
 Dus (λ – VA) = (λ – 0)= groot (sterke onderpredictie)
 Dus ΔVA is groot sterke toename
o Tweede trial: ΔVA= 0.20 (1-0.20) = .016
o Derde trial: ΔVA= 0.20 (1-0.36) = 0.128 [ 0.36=0.2+0.16]
 VA wordt groter
 Dus (λ – VA) is klein (zwakke onderpridictie)
19
 Dus ΔVA is klein zwakke toename
o verklaring typische acquisitiecurve (negatief versnelde curve)
 Bv. 2 VP’s (A en B) [AB+ AB+ AB+]
o ΔVA = αAβ (λ – VAB) EN ΔVB = αBβ (λ – VAB)
 Waarbij VAB = VA + VB
o Impliceert competitie tussen A en V voor de verwerving van associatieve sterkte, want de
soms van VA + VB is maximaal λ
o Stel αA = αB
 Trial 1: ΔVA = 0.20 (1-0) = 0.2
ΔVB= 0.20 (1-0)=0.20
 Trial 2: ΔVA= 0.20 (1-0.4)= 0.12
ΔVB= 0.20 (1-0.4)=0.12
 Trial 3: ΔVA= 0.20 (1- 0.64)=0.072
ΔVB= 0.20 (1- 0.64)=0.072
 … leren stopt wanneer de som gelijk is aan 1.
 lopen ze gelijk dan stopt leren als VA=VB= .5 λ
 Overshadowing
o Na A+ training zal VR op A groter zijn dan na AB+ training (B overschaduwt de acquisitie
van A)
o Verklaring RW:
 VAB=VA+VB= maximaal λ
 Bij AB+ training verwerft B ook associatieve sterkte
o Dus bij simultane training met VPA en VPB zullen VA en VB steeds kleiner zijn dan wanneer
VPA en VPB elk afzonderlijk worden getraind
6.1.1 applicatie van het blocking effect
 Fase 1: (VPA-OP training)
o ΔVA = αAβ (λ – VA)
o VA benadert asymptoot, dus VA = λ
 Fase 2: ([VPA + VPB]-OP training)
o VB = 0
o ΔVB = αBβ (λ – VAB), waarbij VAB = (VA + VB)
o Maar VAB = (λ + 0) = λ
o Dus (λ – VAB) = (λ – λ) = 0
o Dus reeds correcte predictie door A, er zal dus geen conditionering van stimulus B
plaatsvinden
o En dus ΔVB = αBβ (λ – λ) = 0
 In de controle groep is er nog geen voorspelling van A-OP. Daarom zal OP verrassend zijn, en
zullen zowel A als B conditionering verwerven
 Unblocking kan optreden door een sterkere OP aan te bieden op de VAB trials
o Fase 1: (VPA-OP training) met OP = λ
 ΔVA = αAβ (λ – VA)
 VA benadert asymptoot, dus VA = λ
o Fase 2: ([VPA + VPB]-OP training) met OP = 2λ (bv. dubbel zo intense shock)
 VB = 0
 ΔVB = αBβ (2λ – VAB), waarbij VAB = (VA + VB)
 VAB = (λ + 0) = λ
 Dus (2λ – VAB) = (2λ – λ) = λ
 Dus onderpredictie
 En dus ΔVB = αBβ (λ)  géén blocking, VPB wordt excitatorisch
20
6.1.2 verlies van associatieve waarde ondanks paring met de OP
 Sommige predicties van RW model zijn contra intuïtief maar welk correct gebleken!
 Associatieve sterke van een prikkel kan in bepaalde omstandigheden afnemen ondanks
bijkomende gepaarde aanbiedingen met OP
 Fase 1
o Stimulus A en B worden afzonderlijk aangeboden met OP tot ze beide volledig
geconditioneerd zijn
o VA=VB= λ : ze voorspellen beiden perfect de OP
 Fase 2
o A en B worden samen aangeboden gevolgd door OP
o RW voorspelt dat de eigenschappen van de individuele stimuli A en B zullen afnemen
o Door de training in fase 1 , gaan stimuli A en B beide perfect de OP voorspellen: VA = λ én
VB = λ
o In fase 2 gaan de afzonderlijke verwachtingen samengevoegd worden.
 Gevolg: VAB = VA + VB = (λ + λ) = 2λ = overpredictie
o De verwachtingen van A en B moeten dus af gezwakt worden (verlies van associatieve
waarde) tot VAB = VA + VB = λ
6.1.3 geconditioneerde inhibitie
 Standaard inhibitorische conditionering procedure
o Trials waarbij de US aanwezig is en trials waarin die niet aanwezig is A+/ AB- training
o Doel: op A- trials moet OP verwacht worden, op AB-trials moet OP niet verwacht
worden
o A moet excitatie verwerven en B moet inhibitie verwerven die voldoende sterk is om de
excitatie van A om te keren op AB trials (zodat de verwachting op AB trials= 0)
 A+/AB- training
 op VPA-OP trials λ = 1
o ΔVA = αAβ (λ – VA) = positief
o VPA verwerft excitatie = positieve associatieve waarde voor VA
 op (VPA + VPB)-géénOP trials λ = 0
o ΔVB = αBβ (λ – VAB) = αBβ (0 – VAB) = negatief
o want VAB = (VA + VB) = (positieve waarde + 0) = positief, er is dus overpredictie
o VPB verwerft inhibitie = negatieve associatieve waarde voor VB
o VPA verliest deel van de reeds verworven excitatie
 Bemerk: opbouw (positieve) VA sneller dan opbouw (negatieve) VB
o Onderpredictie (1 – VA) op bekrachtigde trials groter dan overpredictie (0 – VAB) op
onbekrachtigde trials
 Stabiliseert als VA = λ en VB = -λ
 Uitgewerkt voorbeeld zie op slides
6.1.4 uitdoving van excitatie en inhibitie
 In een extinctie procedure wordt de geconditioneerde stimulus herhaaldelijk aangeboden
zonder de US
o Wanneer CS+ eerst aangeboden wordt zonder US in extinctie, zal er een overpredictie
zijn van de US (VA is positief, max. λ)
o Na herhaaldelijke presentatie van de CS zonder US, zal de verwachting gradueel
bijgesteld worden in lijn met de afwezigheid van de US door graduele reductie van de
associatieve waarde van se CS tot 0
 Zodra extinctie begint: geen OP dus λ = 0
 ΔVA = αAβ (λ – VA) = αAβ (0 – VA) = negatief
o De overpredictie wordt bijgesteld
21
 VPA verliest geleidelijk de verworven excitatorische waarde, tot VA =0
o ( deze voorspelling van RW is achteraf fout gebleken)
 Bescherming tegen extinctie
o Ondanks afwezigheid OP (extinctieprocedure) kan een excitator VPA (VA= 1) soms toch
zijn excitatorische waarde behouden…namelijk wanneer excitator VPA aan
extinctieprocedure wordt onderworpen in aanwezigheid inhibitor VPB (VB= -1) !!
o Reden: op AB- extinctietrials:
 ΔVA = αAβ (λ – VAB)
 Waarbij λ = 0, en VAB = (VA + VB) = (1 + (-1)) = 0
 Dus géén overpredictie, dus VPA behoudt excitatie!
 Je krijgt een uitdoving van de angstlokkende prikkel (A), gecombineerd met
veiligheidssignaal
 er zal geen angst uitgelokt worden, maar waarden van variabelen veranderen
niet!
 Uitdoving van inhibitie
o A+/AB- training, gevolgd door herhaalde B- aanbiedingen
o RW voorspelt het analoge als voor extinctie van excitators
o Als B perfecte inhibitor VB = -λ
o Zodra extinctie begint geen OP dus λ = 0
 ΔVB = αBβ (λ – VB) = αAβ (0 – (-λ)) = positief
 De onderpredictie wordt bijgesteld
 VPB verliest geleidelijk de verworven inhibitorische waarde, tot VB =0
 Signaal dat als veiligheid dient, resulteert in het verlies van het veiligheidssignaal bij
herhaalde aanbiedingen van het signaal zonder OP
6.1.5 problemen met het Rescorla- Wagner model
 Uitdoving van inhibite verloopt niet zoals RW voorspelt
o Onbekrachtigde B- aanbiedingen na A+/AB- training blijken géén effect te hebben, of
soms zelfs de inhibitorische waarde versterken
o Inhibitie kan worden afgebouwd door uitdoving van de excitator A !! (bron van gevaar
afnemen)
 Extinctie van excitatie is niet het spiegelbeeld van acquisitie van excitatie
o Het gaat niet om het “afleren” of “afbouwen” van de oorspronkelijke excitatorische
relatie
o Maar om het BIJLEREN van een nieuwe relatie, namelijk dat de OP niet langer volgt op
de VP
 Eenzelfde VP kan tegelijk én excitatorische én inhibitorische eigenschappen hebben
o Volgens RW kan een prikkel slechts één associatieve waarde hebben
 Die kan positief of negatief zijn, maar niet beide tegelijk
o MAAR er is toch evidentie gevonden dat eenzelfde prikkel zowel excitator als inhibitor
kan zijn
o Vb. Tait & Sadlin (1986):
 Shockje rond oogtoon
 Backward conditioning (OPVP) (schok rond ogen  geluid) bij konijnen: suppressie
operant likgedrag door geluid (dus VP excitatorisch)
 Nadien: forward conditioning (VPOP) met geconditioneerde oogknipper als VR:
vertraagde acquisitie (dus VP kenmerken geconditioneerde inhibitor !)
 Antwoord: theorieën die onderscheid maken tussen emotioneel-affectieve en
sensorieel-descriptieve representatie van OP
 RW kan beide effecten op zich wel verklaren, maar niet tegelijk
 Latente inhibitie kan niet worden gevat in RW model
22
o In RW model is α de salience van een VP, een vaste onveranderlijke parameter
o In latente inhibitie zal waarden van α waarschijnlijk dalen
 Opheffen blocking door een zwakkere OP tijdens compound- conditioneringsfase
o Indien er tijdens fase 2 een sterkere OP (bv. 2λ) dan tijdens eerste fase (λ) wordt
aangeboden voorspelt RW (correct) géén blocking
 want (2λ – VAB) is dan > 0, dus ΔVB = αBβ (2λ – VAB) > 0
 VP verwerft excitatie
o Maar ook wanneer omgekeerd (OP = 2λ tijdens fase 1, λ tijdens fase 2) zal er géén
blocking optreden
 VP verwerft excitatie !!
 als RW al iets voorspelde was het inhibitie
6.2 andere modellen van klassieke conditionering
6.2.1 aandachtsmodellen van conditionering
 RW (Amerikaans) focus op de effectiviteit van de OP:
o Hoeveel er geleerd wordt is afhankelijk van de effectiviteit van de OP
o des te meer leren op een trial des te slechter de OP-predictie
o Des te minder leren op een trial des te beter de OP-predictie
 Britse leerpsychologen: focus op de effectiviteit van de VP
o Algemene assumptie: opdat conditionering optreedt moeten subjecten aandacht hebben
voor de CS
o Des te meer leren op een trial des te meer de VP de aandacht trekt (en dus ‘verwerkt’
wordt)
o Des te minder leren op een trial des te minder de VP de aandacht trekt
o Het “aandachtstrekkend vermogen” van een prikkel = de opvallendheid (“SALIENCE”) van
een prikkel
 Aandachtsmodellen verschillen in hun assumpties over wat de opvallendheid van de CS op
een gegeven trial bepaalt
 Pearce & Hall:
o Basisassumptie; opvallendheid van de VP op de trial n wordt bepaald door de mate
waarin de OP verassend was op trial n-1
 Er valt veel te leren als de OP verrassend was veel aandacht voor VP op volgende
trial
 Er valt weinig te leren als de OP niet verrassend was weinig aandacht voor VP op
volgende trial
o Dus: de late waarin OP verrassend is, heeft enkel een pro-actieve invloed op aandacht (en
dus ook op de mate van leren)
 <->RW: mate waarin OP verrassend is, heeft een momentane invloed op de mate van
leren (invloed op zelfde trial)
 RW: ΔVA = αAβ (λ – VA), waarbij αA = constante
 Pearce & Hall: αA = variabel over trials
o αAn = |λn-1 – VAn-1|
 Waarbij αAn = de salience/associeerbaarheid van prikkel A op trial n (waarde tussen 0
en 1)
 λn-1 = sterkte van de OP op trial n-1 (tussen 0 en 1)
 VAn-1 = associatieve sterkte van A op trial n-1
 |λn-1 – VAn-1| = absolute waarde verschil
o De verandering in associatieve sterkte van prikkel A (ΔVA) is dan functie van:
 ΔVA = SA αA λ
 SA = intensiteit van VPA constante (objectieve waarde van bepaalde prikkel)
 αA = associeerbaarheid VPA
23
 λ = intensiteit OP
 efficiëntie van OP wordt constant gehouden (λ) , associeerbaarheid wordt
flexibel (α)
 Of uitgebreid: ΔVAn = SA |λn-1 – VAn-1| λn
o Acquisitie
 Trial1 αA = associeerbaarheid VPA voor nieuwe prikkel positieve waarde verschillend
van nul, ΔVA = SA αA λ = verwerven bepaalde mate van excitatie
 ΔVA = SA αA λ (bv. = 0,1)
o de eerste twee termen zullen positief zijn,
o de laatste is gelijk aan 1
 Een nieuwe prikkel heeft altijd een licht positieve waarde
 Trial2 αAn = |λn-1 – VAn-1| groot want op vorige trial1 was VA nog 0, dus SA αA λ groot
 ΔVA = SA αA λ
o Eerste term is positief
o Laatste term is 1
o Middelste term: |λn-1 – VAn-1|= |1-0| (zeer grote verrassing [!! Kijken naar
begin vorige trial]
n
 Trial3 αA reeds kleiner dan op trial2, want op trial 2 was VA reeds in bepaalde mate
positief, en dus is ook |λn-1 – VAn-1| kleiner dan op trial2. Hierdoor ook SA αA λ kleiner
dan op trial 2
 ΔVA = SA αA λ
o Eerste term is positief
o Laatste term is 1
o Middelste term: |1-0.1|
 Trial laatste: indien op voorlaatste trial (VA = λ) was, is αAn = |λn-1 – VAn-1| = 0
geworden, dus ook SA αA λ = 0
 Als op voorlaatste trial de predictie al optimaal was, dan zal de aandacht op de
volgende trial wegvallen (er zal geen leren meer plaatsvinden)
o Blocking
 Fase 1 (A+ training):
 VA = 1 (einde leerfase)
 en αA = 0 (perfecte predictie)
 Fase 2 (AB+ training)
 Indien meerdere VP’s αBn = |λn-1 – VABn-1|
 Eerste trial:
o αB zal (als nieuwe prikkel) normale startwaarde hebben, groter dan 0, dus
ΔVB = SB αB λ zal niet nul zijn
 ΔVA= αA * SA* λ = 0*SA*λ =0
 ΔVB= αB * SB* λ = pos. *SA*λ =pos (nieuwe prikkel is altijd positief)

o  geen blocking op 1ste trial !!
 Volgende trial(s):
o αBn = |λn-1 – VABn-1|= 0 want
 VABn-1 = 1 omdat VAn-1 = 1, dus geen verder leren meer
o blocking vanaf 2e trial
o Latente inhibitie
 door pre-exposure VP-alleen (zonder OP), zal αAn = |λn-1 – VAn-1| gelijkgesteld worden
aan 0 (zowel λn-1 als VAn-1 = 0)
 Bij eerste VP-OP trial: géén leren !
 “Bijstelling” αA op volgende trials
o Opheffen blocking
24
 door zowel sterkere als zwakkere OP tijdens compound-conditioneringsfase
 |λn-1 – VAn-1| is van belang, onafgezien van “over- of onderpredictie !
 Dus: ook na 1e compound trial verder leren!
6.2.2 temporele factoren en geconditioneerd gedrag
 Noch in het RW model, noch in de aandachtsmodellen wordt expliciet met de factor ‘tijd’
rekening gehouden ondanks het feit dat tijd een belangrijke determinant is bij pavloviaans
leren
o Effecten van de duur van VP en VP-OP interstimulusinterval
 Vaak curvilineair verband, met na “optimum” langer ISI  minder conditionering
 Respons-afhankelijk! (cfr. “general search – focal search – food handling and
ingestion”)
o Effecten duur inter trial interval
 Algemeen: langere ITI’s leiden tot meer/ sterkere VR (bij een gelijk aantal VP-OP
aanbiedingen)
 Bij gelijk aantal trials, maar met grotere intervallen zal een sterker effect optreden
o Verhouding tussen VP en duur ITI
 Niet de duur van de VP of de duur van ITI op zich is van belang, maar wel de ratio
tussen de twee.
 Hoe groter de ratio (duur ITI/ duur VP), hoe sterker de conditionering
 Bv. Experiment Holland
 Proefdier: ratten
 Na een toon volgt er automatisch voedselratten gaan na een tijdje al sneller
naar het voedselbakje gaan
 VP: auditieve ruis
 OP: aanbieding voedsel
 VR: % tijd dat de rat zijn snuit in voedselhouder heeft tijdens VP (=
anticipatorische geconditioneerde respons)
 Eerste OV: duur van VP (10 of 20 seconden)
 Tweede OV: duur van ITI (15 tot 960 seconden, 6 verschillende niveaus)
 Dus je krijgt I/T ratio’s van 1.5 ; 3 ; 6 ; 12 ; 24 ; 48
 Resultaat
o VR was direct gerelateerd aan I/T ratio: hoe groter de ratio, hoe groter VR
o Dus de duur van VP of duur van ITI op zich zijn niet cruciaal
 Bij langere VP(T) kan er toch een even sterke conditionering zijn, door
de verlening van de ITI(T)
 Bij een even lange VP(T) kan er toch sterkere conditionering zijn door
verlening van de ITI(T)
 Waarom is de I/T ratio nu zo van belang?
o Relatieve wachttijd hypothese
 “wachttijd” tot optreden OP in aanwezigheid VP = “VP-wachttijd”
 “wachttijd” tot optreden OP zonder rekening te houden met de VP = “contextwachttijd” (base rate)
 VP is informatief ams VP-wachttijd < context-wachttijd !
 Kleine I/T ratio: VP wachttijd ≈ contextwachttijd
 VP weinig informatief mbt. wanneer OP komt  weinig conditionering
 Grote I/T ratio: VP wachttijd < contextwachttijd
 VP sterk informatief mbt. wanneer OP komt  sterke conditionering
o Rate expectancy theory (Gallistel & Gibbon)
 Uitbreiding ideeën “relatieve wachttijd hypothese”
 Centraal:
25
 organismen hebben notie van “tijdsduur”,
 geheugenrepresentatie van duur verschillende gebeurtenissen in
conditioneringsprocedure
 Decisieprocessen gebaseerd op vergelijking van deze temporele variabelen
bepalen geconditioneerd gedrag
 Performantie-theorie  ‘leer’theorie
6.2.3 de comparator hypothese (Miller)
 Prikkels (én context) verwerven onafhankelijk van mekaar associatieve sterkte, volgens
eenvoudige niet-competitieve op contiguïteit gebaseerde leerregel (! Spiegelbeeld van RW)
 Alle associaties excitatorisch!
 Net als in “relatieve-wachttijd-hypothese” centrale idee: geconditioneerd gedrag tov een VP
is functie van vergelijkingsproces:
o Associatieve sterkte target VP
o Associatieve sterkte “comparator” prikkels
 Contextuele én andere discrete VP’s aanwezig tijdens training
 Mate van excitatorische/inhibitorische respons is functie van uitkomst vergelijking “actuele”
associatieve waarde (= op moment van testen) van target VP en comparator prikkels
o Excitatorische waarde target VP > excitatorische waarde comparator stimuli
 excitatorische VR
o Excitatorische waarde target VP < excitatorische waarde comparator stimuli
 inhibitorische VR
 Tijdens acquisitie: 3 types van associaties
o Target VP – OP associatie (link1)
o Target VP – Comparator Stimuli associatie (link2)
o Comparator Stimuli – OP associatie (link3)
 Op moment test: directe en indirecte activatie OP representatie
o Directe activatie: via link 1
o Indirecte activatie: via links 2 en 3
 Vergelijking mate directe versus indirecte activatie determineert VR
o Deze hypothese is een kwalitatieve respons regel (dus geen berekeningen zoals bij RW)
o Tijdens acquisitie wordt bepaald welke prikkels een rol zullen spelen,
o De waarde die de prikkels hebben op het moment van de vergelijking is cruciaal
 Implicaties
o Performantie verklaring i.p.v. leerverklaring voor o.a. blocking, overshadowing,
contingetie-effecten, …
 Bv. overshadowing
 VR op X kleiner na XA+ training dan na X+ training
 Niét omdat associatie X-OP zwakker is
 Wél omdat sterkte comparator stimuli in geval XA+ training (zijnde context plus
A) groter is dan in geval X+ training (enkel context)
 Bv. blocking
 VR op X kleiner na A+ training gevolgd door XA+ training dan bij XA+ training
zonder voorafgaande A+ training
 Niét omdat X-OP relatie minder goed/niet geleerd in blocking groep dan in
controle groep
 Wél omdat in blocking groep de comparator stimulus A een grotere associatieve
sterkte heeft (voorafgaande A+ training) dan in controle groep (geen
voorafgaande A+ training)
 Pre-training zorgt ervoor dat A-OP associatie sterker wordtminder sterke
respons op doelprikkel X
26
o Predicties van effecten van post- acquisitie manipulatie van de associatieve sterkte van
comparator prikkels, die niet met de traditionele leer theorieën kunnen worden
verklaard (restrospectieve revaluatie)
 Bv. postacquisitie uitdoving context
 A+ training in een bepaalde context
 A-OP en context-OP associaties
 Aangezien context = comparator voor target A, predictie: uitdoving context zal
leiden tot sterkere VR op target A
 Experimenteel aangetoond!
 Kan niet worden verklaard door RW, aandachtsmodellen etc
 Bv. unblocking/ unovershadowing
 Na A+, dan XA+ training mindere respons op X dan wanneer onmiddellijk XA+
training
 Oorzaak: comparator A voor target X is sterker in blocking groep (dan in controle
groep)
o Bij blocking weegt (A+ context) -US meer door
 Predictie: uitdoving A zal leiden tot stijging/verschijnen van VR op geblockte
target X
o Bij unblocking zal (A+ context)- US zwakker worden waardoor X-US sterker
wordt
 Experimenteel aangetoond!!
 Bv. uitdoving ‘inhibitie’
 A+/XA- training, of negatieve contingentie X-OP
 Sterkte comparator stimuli voor target X (A+ context, of context) groter dan
sterkte target X, dus “inhibitie” op X
o A wordt altijd gevolgd door OP, AX wordt zelfde gevolgd door OP
o A + context zal sterke link met OP hebben
o X zal zwakke link met OP hebben
 Predictie: uitdoving comparator prikkels zal leiden tot verdwijnen inhibitie (of
tot lichte excitatorische respons) op X
o uitdoving van A zorgt dat de X-OP band sterker wordt
 Experimenteel aangetoond!
 Bv. Backward blocking
 XA+ training gevolgd door A+ training (omgekeerde sequentie dan bij “forward”
blocking) er zal op X weinig/niet gereageerd worden
 Predictie: comparator A voor target X zou sterker moeten worden (dan in
controlegroep),
 dus VR op X zou zwakker moeten worden (dan in controle groep)  “backward
blocking”
 Experimenteel aangetoond!!
 Bv. post acquisitie versterken door context
 A+ training in een bepaalde context
 A-OP en context-OP associaties
 Aangezien context = comparator voor target A, predictie: versterken context zal
leiden tot zwakkere VR op target A
 Experimenteel moeilijk(er) aantoonbaar…
 Zwakte van het model: 3 soorten associaties, maar de precieze leerprincipes zijn niet echt
gespecifieerd
27
Extra: configuraal leren (Pearce)
 RW, pearce & Hall, Miller hadden een elementele benadering van samengestelde prikkels
(AB=A+B)
 Alternatief: configurale benadering van samengestelde prikkels (AB=C)
o Het geheel is verschillend van de som van de delen
o AB configuratie verwerft associatieve sterkte
o Rol voor generalisatie tussen AB, B en A
 Verandering in excitatorische sterkte van een prikkel (ΔEA) op een trial wordt bepaald als
o ΔEA = β (λ – ĒA)
 β = ‘learning rate’ parameter, afh. van sterkte US
 λ = asymptoot van leren (max = 1)
 ĒA = netto “verworven” (geaggregeerde) excitatorische sterkte, bestaande uit:
o ĒA = EA + e A
 EA = rechtstreeks verworven excitatorische sterkte
 eA = gegeneraliseerde excitatorische waarde vanuit perceptueel gelijkende prikkels
 als er geen andere prikkels zijn die lijken op prikkel A, dan wordt deze term nul
 De gegeneraliseerde excitatorische waarde voor prikkel A (=eA),wordt bepaald als
o eA = Σjn JSA * Ej
 JSA = de similariteit tussen prikkel A en prikkel J
 Varieert tussen 0 en 1
 Zelfs wanneer de stimuli volledig veranderd, zal deze term nog steeds een
positieve waarde hebben
o Op beide trials zijn er een reeks representaties van stimuli welke constant
blijven (bv. experimentele context) en deze stimuli zullen een zorgen voor een
positieve mate van similariteit
 JSA = (Pcom/PΣJ) * (Pcom/PΣA)
o Pcom = gepercipieerde intensiteit van de gemeenschappelijke prikkelelementen
o PΣJ en PΣA = gepercipieerde intensiteit van prikkels J en A in hun totaliteit, resp.
 Ej = de excitatorische waarde van de gelijkende prikkel J zelf
 Wanneer ΔEA = β (λ – ĒA) negatief is (bv. λ = 0 omwille van afwezigheid US, en ĒA > 0),
ontstaat er een afzonderlijke inhibitorische associatie, waarvan de netto sterkte wordt
uitgedrukt als
o ĪA = IA + iA
 IA = rechtstreeks verworven inhibitorische sterkte
 iA= gegeneraliseerde inhibitorische waarde vanuit perceptueel gelijkende prikkels
o ΔIA = |ΔEA|
 Dus meer algemeen geldt: ΔEA = β (λ – VA)
o waarbij VA = (ĒA + ĪA) = EA + eA – (IA + iA)
 ! het model maakt dus een onderscheid tussen excitatorische kracht welke geconditioneerd
is op en stimulus (E) en degene die ertoe gegeneraliseerd is (e)
 formule ASA’ = (Pcom/PΣA) * (Pcom/PΣA’)
o ASAB = 1/1 * 1/2 = .50 (bij intensiteit A=B)
A
(1 blokje)
A B (1vd 2 blokjes)
o BSAB = 1/1 * 1/2 = .50 (bij intensiteit A=B)
o ABSAC = 1/2 * 1/2 = .25 (bij intensiteit A=B=C)
A B
A C
o ASAB = 1/1 * 1/3 = .33 (bij intensiteit B = dubbel intensiteit A)
28
o BSAB = 2/2 * 2/3 = .66 (bij intensiteit B = dubbel intensiteit A)
 Generalisatie van excitatie
o Overshadowing
 AB+ training, test A?
 Acquisitie: VAB = 
 Test: VA = ABSA* VAB, dus VA = 0.5 (want ABSA = .5)
 Conform RW: VA+B = (VA+ VB) = ; en VA= VB= 0.5
 De invloed van prikkelcombinaties op “afzonderlijke” prikkels wordt verklaard via een
systeem van perceptuele generalisatie van de door de “compound” verworven
associatieve sterkte
 Dus: afzonderlijke prikkels verwerven zelf geen signaal- waarde in een
prikkelcombinatie, maar ontvangen gegeneraliseerde signaal- waarde volgens
perceptuele gelijkenis.
 Effect moet reeds zichtbaar zijn na 1 trial
o Summatie
 A+ en B+ training, test AB?
 Acquisitie: VA =  en VB = 
 Test: VAB = ASAB*VA + BSAB*VB = 0.5 + 0.5 = 
 Niet conform RW: VA+B = VA + VB =  +  = 2  !! (cfr. “over-expectation”)
 Generalisatie van excitatie en inhibitie
o Super extinctie volgens RW
 A+, B+ en C+ training, dan AB- extinctie versus C- extinctie
 Acquisitie: VA = VB = VC = 
 Test na acquisitie: VAB = VA + VB = 2 ; VC = 
 Extinctie: VA =  *  * (0 - 2) (idem voor VB)
VC =  *  * (0 - )
 Test na extinctie: (CRA = CRB) < CRC
 R&W (1972) voorspelt sterkere extinctie via de prikkelcombinatie, omdat
 de verrassing van het uitblijven van de US groter is, en
 omdat de signaal-waarden van de afzonderlijke prikkels rechtstreeks aangepast
worden.
o Geen super extinctie volgens pearce
 A+, B+ en C+ training, dan AB- extinctie versus C- extinctie
 Acquisitie: VA = VB = VC = 
 Test na acquisitie: VAB =  (zie ‘summatie’), VC = 
 Extinctie: ΔIAB = β ( – VAB) = β (0 – ), tot IAB = 
ΔIC = β ( – VC) = β (0 – ), tot IC = 
 Test na extinctie:
 VA= de behouden eigen excitatie (EA= ) min gegeneraliseerde inhibitie (iA = ABSA* IAB =
½ ) = ½ 
 VC= behouden eigen excitatie (EC= ) min eigen inhibitie (IC = ) = 0
 Resultaat: (CRA= CRB) > CRC
 Dus: zwakkere extinctie via de prikkelcombinatie, omdat
 de verrassing van het uitblijven van de US gelijk is, en
 omdat de afzonderlijke prikkels slechts gedeeltelijke generalisatie ontvangen van
het extinctie-leren met de prikkelcombinatie.
29
7. Instrumentele of operante conditionering
Inleiding
 Belangrijk gemeenschappelijk kenmerk van habituatie, sensitisatie en pavloviaanse
conditionering is dat ze onafhankelijk van de acties van het organisme bepaald worden
o Het gedrag veranderd in functie van de prikkelaanbieding
o Maar het gedrag heeft geen invloed op de aanbieding/ het optreden van de cruciale
prikkels
o DUS men leert over prikkels en prikkelrelaties waarover men geen controle heeft
 Instrumentele/ operante conditionering:
o Situaties waarbij de aanbieding/ het optreden van een ongeconditioneerde stimulus
afhankelijk is van het gedrag van het organisme
o Controle over prikkel(verandering) in de omgeving
o De consequente uitkomst: bekrachtiger of straf
 Positieve bekrachtiger: iets positiefs toevoegen
 Negatieve bekrachtiger: iets negatiefs wegnemen
 Positieve straf: iets positief wegnemen
 Negatieve straf: iets negatief toevoegen
o Instrumentele conditionering: het gedrag/ respons is het middel waardoor de
prikkelwijziging in de omgeving bekomen wordt
o Operante conditionering: het organisme voert een bepaalde manipulatie/ operatie van of
op de omgeving uit
7.1de tradities van Thorndike en skinner
7.1.1 methodologische consideraties
 De discrete trial methode:
o Thornike
o Geïntreseerd in het bestuderen van intelligentie bij dieren
o Subjecten zijn jonge katten
o Puzzle box: er moeten één of meerdere acties ondernomen worden om uit de box te
geraken
o Een katje wordt in de box geplaatst en er werd gemeten hoe lang ze erover deden om uit
de box te geraken, waarbij ze een stukje vis kregen
 Bij herhaalde aanbiedingen in eenzelfde box, werden de katjes steeds sneller om
eruit te geraken
o De deelnemer heeft slechts op bepaalde momenten de mogelijkheid om de instrumentele
respons uit te voeren, wat getermineerd wordt door de experimentator. (bv. katten
kunnen maar ontsnappen wanneer ze in box geplaats worden. Thorndike bepaalt
wanneer dit plaatsvind)
o Straight alley runway: het dier wordt geplaatst in de start box. De deur van startbox gaat
omhoog, wat het dier toelaat om naar de doel box te gaan aan de andere kant van de
baan ( dus het dier moet gewoon rechtdoor lopen)
o T-maze: nadat het dier vrijgelaten wordt van de start box, kan het naar een keuze punt
gaan, waar het moet kiezen tussen de rechter of de linker kant.
 Geschikt om keuze gedrag te onderzoeken
o Vereist verschillende manipulaties
 Experimentator moet de rat in de box zetten, hem vrijlaten, wachten tot het zijn
doel bereikt heeft, het oppakken en in een wacht ruimte steken voor intertrial
interval
 Experimentator bepaalt hoe lang de deelnemer moet wachten tussen trials
 Free- operant methode
o Skinner
30
o Interesse in het construeren van geautomatiseerde profopstelling waarbij het subject
bepaalt wanneer een nieuwe trial wordt toegediend
o Skinner box: rechte box. Langs één zijde een drukknop en een voedselbakje. Elke druk op
de knop wordt automatisch gedetecteerd en wordt gevolg door eten
o Respons van interesse: frequentie van drukken
o Operante respons kan eender welk moment voorkomen
o Deelnemer kan herhaaldelijk de instrumentele respons uitvoeren
7.2 de oprichting van een instrumentele of operante respons
7.2.1 leren waar en waarvoor te lopen
 Het gedrag zelf ( het lopen) is volledig gekend
 De dieren moeten leer waarvoor (motivatie) en naar waar ze moeten rennen
7.2.2 construeren van nieuwe responsen van familiaire componenten
 Bv. hendeldrukken in skinnderbox
 Verschillende componenten van het gedrag zijn gekend
o Op achterpoten zitten, voorpoten opheffen, uitsteken boven hendel, naar beneden
duwen
 Maar de combinatie/ coördinatie van de componenten is nieuw en moet dus aangeleerd
worden
7.2.3 nieuwe responsen vormen
 Volledig nieuwe gedragingen (= spontaan nooit uitgebracht gedrag) leren is mogelijk door de
variabiliteit in gedrag en het systematisch verschuiven van het criterium voor bekrachtiging
 Shaping: wordt gebruikt wanneer het doel is om een instrumentele respons te conditioneren
welke niet bestaat in het gedragsrepertoire van de participant
o Het uiteindelijk wenselijk gedrag moet duidelijk zijn
o Het bestaande gedragsrepertoire van het proefdier moet gedocumenteerd worden zodat
het startpunt van het proces goed bekend is
o Een sequentie van trainingsstappen moeten opgesteld worden om de deelnemer van zijn
startpunt naar zijn uiteindelijke doekgedrag te leiden
o Gedrag is steeds variabel. Door kleine veranderingen in het gedrag te bekrachtigen, en het
criterium van bekrachtiging telkens een beetje op te schuiven, zal het gedrag opschuiven
in de richting van het gestelde criterium
 Shaping is nuttig voor het aanleren van volledige nieuwe responsen, maar ook voor het
aanleren van nieuwe combinaties van bestaande responsen
 Vaak gebruikte procedure voor het aanleren van nieuwe, complexe handelingen/
vaardigheden
7.3 het belang van onmiddellijke versterking
 Instrumentele conditionering is een respons selectie procedure
 Het is cruciaal voor dit proces dat de bekrachtiger onmiddellijk achter het gewenste gedrag
aangeboden wordt (hoewel dit niet altijd haalbaar is)
 Gedragsactiviteiten stoppen nooit. Bij uitgestelde bekrachtiging is de kans groot dat andere
responsen bekrachtigd worden.
 Geconditioneerde ( of secundaire bekrachtiger): een stimulus die geassocieerd is met (en later
inruilbaar is voor) een primaire bekrachtiger (bv. geld, tokens)
 Markeerprikkel: een korte visuele/ auditieve cue die het subject attendeert op het cruciale
target en deze beter memoriseerbaar maakt
31
7.4 prikkel relaties bij instrumentele conditionering
 Vraag: wat is de inhoud van het geleerde bij operante conditionering
 Drie componenten in instrumenteel gedrag:
o S: de prikkelconfiguratie waarin het gedrag uitgebracht wordt
o R: het uitgebrachte gedrag
o O: de outcome, de consequente omgevingsverandering
7.4.1 de S-R associatie: Thorndike’s wet van effect
 Instrumenteel leren= de associatie tussen de omgevingsstimuli en de respons
o De bekrachtiger zorgt enkel voor het versterken van deze associatie, maar wordt zelf niet
geëncodeerd
o S-R associatie
 Elk operant wordt uitgebracht in een unieke configuratie van omgevingsprikkels
 De bekrachtiger zorgt ervoor dat er een associatie wordt ingestampt tussen deze
omgevingsprikkels en de instrumentele respons
 Er is GEEN leren over, maar door de bekrachtiger ( geen R-O associatie)
7.4.2 S-O en S(R-O) relaties
 Relatie tussen de stimuli en de outcome
 Wanneer in een bepaalde situatie (S), door instrumentele respons (R) een bepaalde outcome
(O) wordt veroorzaakt, is er ook een kans voor S-O leren
 S-O associatie: lijkt op de pavloviaanse VP-OP associatie
 Drie termen contingentie : S signaleert de aanwezigheid van de R-O associatie
o S(R-O) associatie
o Analoog met de B(A-OP) associatieve structuur in Pavloviaanse conditionering
 Experimentele evidentie voor het belang van S-R, S-O, R-O en S(R-O) associaties
 Onderscheid tussen S-R en R-O relaties:
o Outcome van de-/ revaluatie studies (analoog met OP inflatie en OP devalutie)
 Actie: R-O
 Gewoonte: S-R
7.4.3 implicaties voor neurale mechanismen
 Pavloviaans leren: eenvoudige (S-S) associaties of complexe B(A-OP) associaties kunnen
experimenteel afzonderlijk geïnduceerd/ geïsoleerd worden
 Operant leren: meerdere binaire associaties (S-R, S-O, R-O) en complexe S(R-O) associaties
kunnen niet experimenteel geïnduceerd/ geïsoleerd worden
 Gevolg: pavloviaans leren is eenvoudiger te bestuderen dan operant leren wat betreft het
neuronaal substraat
7.4.4 implicaties voor beperkingen van instrumentele conditionering
 Net zoals bij klassieke conditionering gaat niet elke VP even gemakkelijk geassocieerd
worden met om het even welke OP
o OP activeert het gedragssysteem dat relevant is voor de OP in kwestie
o Ieder gedragssysteem wordt gekenmerkt door specifieke responsen en een verhoogde
aandacht voor specifieke prikkels
 Ook bij operant leren is er evidentie voor selectiviteit bij het tot stand komen van S-R, S-O, RO en S(R-O) leren
 Bijvoorbeeld:
o Varkens leren dat het afgeven van een muntstuk leidt tot voedsel
o Mogelijke verklaring:
 muntstuk (afgevenvoedsel) bevat pavloviaanse S-O associatie (munt voedsel)
32
 Pavloviaanse VR= toenadering, manipuleren, bijhouden
 Pavloviaanse VR incompatibel met operante R= afgeven
 Bijvoorbeeld
o Interactie aard R en aard O bij mannelijke stekelbaarzen
o Respons 1: door ring zwemmen
o Respons 2: op staafje bijten
o Outcome 1: mannelijke soortgenoot
o Outcome 2: vrouwelijke soortgenoot
o Resultaat: R1 – O2 > R1-O1
en R2-O1 > R2-O2
 Dus: O activeert een bepaald gedragssysteem. Dit impliceert een verhoogde sensitiviteit voor
een bepaalde stimuli en activatie van een bepaalde respons( MAPS)
 Het al dan niet compatibel zijn hiervan met de gebruikte S en R in sequentie S(R-O) is
medebepalend voor het succes van operant leren
Extra: evaluatieve conditionering
!! extra tekst: meta-analyse Tabellen bekijken!!!
Inleiding
 Mensen zijn niet onverschillig tegenover stimuli: elk object, situatie, gebeurtenis, actie wordt
onmiddellijk en automatisch geëvalueerd
 We interageren met een wereld die beladen is van waarden (positief-negatief continuüm)
 Bepaalde acties resulteren in veranderingen in de omgeving die als goed of als slecht
geëvalueerd worden
o Enkel die acties die resulteerden in positieve veranderingen, zullen frequenter gesteld
worden
o Implicatie van deze fundamentele wet van gedrag : bij organismen die ongevoelig zou zijn
voor de waarde van een stimulus, ook het essentiële criterium voor leren ontbreekt
o Geen gedragsmatige flexibiliteit zonder waarde
 Merendeel van onze voor en af keuren zijn niet vaststaand en aangeboren maar vloeien voort
uit onze ervaring met de stimuli
o Waarde kan komen door een louter herhaalde blootstelling aan een stimuli
o Evaluatieve veranderingen kunnen resulteren door het verstrekken van op taal
gebaseerde symbolische informatie (bv. X is een moordenaar)
o Evaluatieve veranderingen kunnen voortkomen uit de opeenvolgende of contingente
paring van origineel neutrale stimuli met gebeurtenissen die reeds een positieve/
negatieve waarde heeft
 Evaluatief leren is hierop gebaseerd: een neutrale stimulus kan een pos/neg waarde
krijgen door een louter spatio- temporeel samengaan met een stimulus die reeds
een waarde heeft
 Evaluatief leren in eerste instantie bekeken als ene vorm van pavloviaans leren
 Preparatorische conditionering: in welke mate heeft kennis die je opdoet invloed op je
voorbereiding tot het krijgen van een bepaalde prikkel
1. van intrinsieke verandering naar slechts referentiele relaties als het fundament van evaluatief
leren
1.1de intrinsieke veranderingshypothese
1.1.1 Martin en levey’s rudimentaire ideeën over evaluatief leren
 In de geest van de informatieverwerkingsbenadering werd menselijke klassieke
conditionering geconceptualiseerd als een fenomeen waarvan de kern de acquisitie is van
kennis over predictieve relaties tussen stimuli in de omgeving gebracht door een aandacht
vragend , capaciteit gelimiteerde, gecontroleerde verwerking
33
o De belangrijkste functie van klassieke conditionering is de detectie van betrouwbare
predictoren
o =signaal leren
 Het meest fundamentele proces in pavloviaans associatief leren is geen signaal leren of
verwerving van kennis over voorspelbare relaties, maar een directe en automatische
transfer van de waarde van de US tot de CS
 Evaluatieve conditionering bestaat essentieel uit een intrinsieke hedonische verschuiving in
de waarde van de CS door de spatio temporele samenhang van de CS met een US welke
reeds een bepaalde waarde draagt
o De verworven waarde van de CS moet aanwezig zijn zonder referentie naar de US
1.1.2 evaluatieve conditionering: het afbeelding-afbeelding paradigma
 Gebruik van cover story
 Kleur foto’s van menselijke gezichten werden gebruikt als stimulus materiaal
 Eerste fase: proefpersonen moeten deze foto’s evalueren op basis van hun eerste indruk op
een schaal
 Vervolgens selecteert de proefleider voor elke proefpersoon de 12 meest neutrale, 3 meest
positieve en 3 meest negatieve foto’s en construeert 9 paren
 Hypothese: de herhaalde paring van een neutrale foto met een foto welke reeds sterke
negatieve/ positieve waarde had, is een goede conditio om de neutrale foto te veranderen
in een stimulus met een pos/neg waarde
 Fase 2: de paren worden in een random volgorde getoond
 Fase 3: proefpersoon moet de foto’s terug beoordelen
1.1.3 evaluatieve conditionering en CS-US contingentie bewustzijn
 Procedure werd eerst gebruikt voor onderzoek naar de rol van bewustzijn over de
contingentie CS-US
o M&L: evaluatieve conditionering vereist geen expliciete kennis/ bewustzijn van de
contingentie (verschillend bij signaal leren)
 Indien dit bewezen kan worden is het een eerste indicatie dat evaluatief leren
verschillend is van signaal leren
 Dergelijke evidentie zou een plausibele verklaring bieden voor evaluatieve
conditionering in termen van een automatische, intrinsieke waarde verschuiving
 Als op proces niveau een evaluatieve verandering niet gebaseerd is op een
associatieve band tussen CS en US representaties, maar op een modificatie
van de CS zelf,evaluatief leren kan optreden zonder bewuste kennis over
de associatie tussen CS en US (CS-US relationele kennis is niet de
informationele basis voor evaluatieve veranderingen)
 Vervolg afbeeldingsparadigma paradigma: herkenningsprocedure
o Deelnemers moeten na de waarde verschuiving voor elke CS aangeven door welke foto
die gevolgd werd
 Deelnemer was zich bewust van de band tussen CS en US als de US van de juiste
waarde aangeduid werd ( juiste gezicht was niet noodzakelijk)
o Resultaat: ster evaluatieve effecten en duidelijke indicatie dat het verwerven van een
stimulus waarde niet noodzakelijk een bewustzijn van de CS-US associatie vereist
 Kennis over de CS-US associatie had noch een positief effect, noch een negatief
effect
o DUS we kunnen de verklaring van evaluatieve conditionering in termen van het
verwerven van expliciete propositionele CS-US kennis door middel van gecontroleerde
processen
34
 ! dit zorgt er niet voor dat de intrinsieke veranderingshypothese het meest plausibele
alternatief is
 De mogelijkheid dat evaluatieve conditionering gebaseerd is op impliciete kennis over de
CS-US relatie (door automatische processen) blijft open
1.1.4 evaluatieve conditionering en extinctie
 M&L speculeerde dat evaluatieve conditionering bestand is tegen extinctie
o Een CS met verworven pos/neg waarde zal deze waarde niet verliezen als een resultaat
van een daaropvolgende CS alleen representaties
 Experimentele bevestiging van deze hypothese zou meer inzicht bieden in de
representatieve structuur onderliggend evaluatieve conditionering
o Het laat toe te beslissen tussen de intrinsieke veranderingshypothese en de verklaring in
termen van de verwerving van impliciete kennis over de predictieve CS-US relatie
o Als de valentie van de CS intrinsiek veranderdehet feit dat de CS het optreden van US
niet meer voorspeld, mag de voorgaande verworven waarde niet beïnvloeden
o Als de verworven waarde gebaseerd is op impliciete kennis dat de CS de US voorspelt
als de CS positief/negatief werd door de kennis dat het een US voorspelt, moet de
nieuwe ervaringen dat er geen voorspelling meer is, schadelijk zijn voor de verworven
waarde van de CS
 Eerste studie
o Acquisitie fase: 10 trials van elke N-N, N-D en N-L paren
o Gevolgd door een beoordeling van het leer effect
o Between group: CS’en krijgen 5 of 10 trials zonder US
o Vergelijking van de post extinctie beoordelingen met de post acquisitie beoordelingen
maakten duidelijk dat de extinctie procedure geen effect had op de origineel verworven
evaluatieve differentiatie
 Tweede studie
o Kritische within subject vergelijking was tussen de eind beoordeling van de CS welke
acquisitie kregen gevolgd door extinctie en de CS die geen extinctie kende
o Het sterke en betrouwbare evaluatieve conditioneringseffect dat gevonden werd, werd
niet beïnvloed door de extinctie behandeling
 Verwerping van de hypothese dat de geconditioneerde waarde gebaseerd is op impliciete
kennis over de predictieve CS-US associatie
 Combineren we dit met het gegeven dat evaluatief leren geen contingentie bewustzijn
vereist, besluiten we dat evaluatieve conditionering gebaseerd is op een intrinsieke waarde
verschuiving
 Bijkomende hypothese: deze waarde verschuivingen worden veroorzaakt door
automatische processen, welke onafhankelijk werken van de mechanismen die
verantwoordelijk zijn voor de acquisitie van expliciete kennis over stimulus contingenties
1.2 van de intrinsieke veranderingshypothese naar het concept van slecht referentiele CS-US
relaties
1.2.1 het effect van US revaluatie
 Zwaktes intrinsieke veranderingshypothese
o Moeilijk om een intrinsiek veranderingsmechanisme te begrijpen of een verklaring te
bieden voor het proces dat er bij betrokken is
o De conclusie dat evaluatieve conditionering een intrinsieke verandering in de waarde
van CS omvat, is op niets meer gebaseerd dan indirecte argumenten, niet op een directe
test van de hypothese
 Meer directe test: post conditionering US revaluatie techniek
o CS-US associatie vestigen
35
o Waarde van US wordt veranderd in afwezigheid van CS
 Methode om sterke waarden van de US te veranderen: combinatie van verbale
informatie en foto’s (bv. een negatieve persoonsbeschrijving geven)
o De waarde van de CS wordt terug beoordeeld
o Kritieke vraag: had de revaluatie van de US invloed op de verworven waarde van de CS
 Er treedt verandering op: verworven waarde van de CS is gebaseerd op zijn
referentiele waarde van de US
 Er treedt geen verandering op: CS heeft intrinsieke waarde verworven
o Resultaat: US revaluatie heeft een invloed op de verworven waarde van de CS
 We moeten dus concluderen dat geconditioneerde waarde niet intrinsiek is, maar op een of
andere manier afhangt van de associatie tussen CS en US representaties
 Gevolg
o De observatie dat evaluatieve conditionering geen bewustzijn vereisen over de CS-US
associatie betekend NIET dat de verworven waarde niet gebaseerd is op de relatie
tussen CS en US
 Juistere interpretatie: de CS-US relationele kennis onderliggend evaluatief leren is
niet noodzakelijk toegankelijk voor het bewustzijn
o Belangrijkste uitdaging: de geobserveerde gevoeligheid voor US revaluatie verzoenen
met de eerder gedocumenteerde weerstand tegen extinctie van evaluatief leren.
(voorgestelde oplossing: 1.2.2)
1.2.2 de loutere referentiele relatie als de basis van evaluatief leren
 Twee kwalitatief verschillende types van CS-US relaties
o Relatie waarbij CS de verwachting activeert van het optreden van US in het hier en nu of
de onmiddellijke toekomst
 Werkelijke signaal. Verwachtingsrelatie
o Presentatie van de CS activeert een representatie van de US zonder dat die aanleiding
geeft tot het actieve verwachting van echt US optreden in het hier en nu of de
onmiddellijke toekomst
 CS doet louter aan US denken
 Louter referentiële CS-US associatie
 Implicaties extinctie procedure
o In het geval waarin het subject verwacht dat de US zal optreden, leidt het niet optreden
van de US tot frustratie of een staat van opluchting
o Na een aantal extinctie trials zal de verwachting van het optreden van US ontkracht
worden
o In de mate dat CS een waarde verworven heeft en een conditionele reactie welke de
signaal waarde weergeeft gemeten is, zal de nieuw verworven kennis dat CS niet langer
voorspeller is van US gereflecteerd worden in een daling (en uiteindelijk verdwijning)
van de conditionele respons
o Als de CS louter doet denken aan de US is het irrelevant of de US al dan niet optreedt
 Stel nu dat de CS een louter referentiële relatie heeft met de US dan zal een extinctie
procedure de referentiële waarde van de CS niet beïnvloeden. Omdat de CS waarde
verschuiving enkel vereist dat de CS verwijst naar de US, zal de geconditioneerde waarde
niet uitdoven
 Dit allen is gerelateerd aan het volgende:
o In geval van de CS-US verwachting relatie kan de intentionele status die uitgelokt wordt
door de CS bevat worden in termen van een ‘propositionele attitude’
o In termen van louter referentiële CS-US relatie kan de intentionele status gevat worden
in termen van een niet propositionele of een minder dan propositionele attitude
36
o In het eerste geval kan de propositie juist of fout zijn, in het tweede geval kunnen we
deze categorieën niet toekennen
o Dus verwachtingsrelaties (maar niet referentiële relaties) kunnen beïnvloed worden
door de stand van zaken die gevestigd is in extinctie
 Oplossing voor conflicterende bevindingen (weerstand tegen extinctie en sensitief voor US
revaluatie)
o Het verklaard weerstand tegen verandering door erkenning dat de natuur van de CS-US
associatie kwalitatief verschillend is dan is het geval van verwachtingsleren
o US revaluatie effecten omdat de waarde van de CS niet intrinsiek veranderd maar
gemedieerd wordt door de (huidige) waarde van de US
o Geschikt voor instanties van zowel contingentie bewustzijn als contingentie onbewust
zijn in evaluatief leren
2. condities en functionele karakteristieken van evaluatieve conditionering: stand van techniek
2.1 robuustheid en ecologische validiteit van evaluatieve conditionering
2.1.1 thematische variaties op het face-face paradigma
 In alle voorgaande experimenten is dezelfde conditioneringsprocedure gebruikt
(paarsgewijze aanbieding van discrete neutrale/pos/neg stimuli)
 Ander onderzoek demonstreert evaluatieve conditionering met een formeel identieke
procedure maar met een selectie van foto’s met een andere semantische categorie:
reproducties van figuurlijke en abstracte schilderijen of afbeeldingen van sculpturen en
fonteinen
 Ook wanneer de CS en US stimuli waren van een andere semantische categorie,
observeerde men evaluatieve conditionering
 Dus evaluatieve conditionering lijkt effectief te zijn ongeacht de specifieke semantische
inhoudscategorie van de CS en de US, tot zover er gebruik gemaakt wordt van discrete
visuele stimuli
2.1.2 verbale evaluatieve conditionering
 Het verbale of semantische evaluatieve conditionering paradigma vertrekt van de foto-foto
paradigma op twee kritische punten
o De stimulus materialen zijn neutraal (betekenisvol of onzin) of hebben een waarde
o Over de series van acquisitie trials is de conceptuele US de gedeelde waarde van een
serie verschillende woorden in plaats van 1 enkel woord dat telkens met dezelfde CS
gekoppeld wordt
 Typische bevinding: de origineel neutrale CS verwerft een evaluatieve waarde congruent
met de waarde van de geassocieerde US woorden
 Dit soort experimenten belicht dat een serie van verschillende stimuli/ gebeurtenissen , die
niets meer delen dan een positieve/negatieve waarde, kunnen ook aan effectieve US zijn
om de waarde van de neutrale CS te veranderen
2.1.3 cross-modale evaluatieve conditionering
 Discreet en autonoom visueel (verbaal of non verbaal) CS wordt herhaaldelijk gepaard met
een US van een andere sensorische modaliteit dan de CS
 Bv. Us = goede of slechte geur met CS= foto’s van menselijke gezichten (andere
voorbeelden zie extra document blz. 13)
 In elk van deze cross-modale evaluatieve conditioneringsvoorbereidingen welke gebruik
maakt van een visuele CS en een niet visuele US, werden betrouwbare assimierende
evaluatieve leer effect verkregen
2.1.4 evaluatieve conditionering met een invariante eigenschap als CS
37
 In al de voorgaande conditioneringsopzetten was de CS een discrete, autonome stimulus
configuratie
 Er bestaat evidentie dat evaluatieve conditionering ook mogelijk is wanneer de CS een
invariant kenmerk is van een variabel stimulus complex of configuratie
 Bv. CS= kleur van een serie verschillende geometrische figuren met US= goed bevonden
muziek
 In deze studies werd gevonden dat deelnemers een evaluatieve discriminatie verwerven
tussen stimulus configuraties welke het kenmerk bevatten dat gepaard ging met de
positieve US en stimuli die het kenmerk bevatte welke gepaard ging met de negatieve US
2.1.5 het smaak-smaak paradigma
 Dit paradigma behoudt het idee van paarsgewijze presentatie van discrete en waardevolle
stimuli maar maakt gebruikt van het smaak- olfactorisch domein
 Daarboven presenteren ze de CS en de US als elementen van een simultane CS/US
samengestelde stimulus
 Acquisitie fase: deelnemers nemen een serie drankjes in welke water, neutrale kleurloze
fruit smaken en smaakloze kleurstoffen bevatten
 US: bittere smaak
 Het ene drankje bevat een specifieke fruitgeur en is bitter, een andere specifieke fruitgeur
wordt gekoppeld met een goede smaak
 Kleur is een irrelevante variabele om de aandacht af te leiden
 Test fase: geuren worden terug aan geboden zonder de bittere smaak
 Standaard observatie: deelnemers ontwikkelen snel een afkeer voor de geur die gepaard
ging met bittere smaak
 Dit effect is even sterk ongeacht de aan of afwezigheid van de kleur context in de test
2.1.6 evaluatieve conditionering met tonische stimuli
 De US en/of de CS zijn geen korte en discrete stimuli met een duidelijk start- en eindpunt,
maar zijn relatief constante en blijvende contexten/situaties/gebeurtenissen/acties
 Ze vormen bijkomende voorbeelden van cross-modaal evaluatief leren waarbij CS en US
simultaan aangeboden worden
 Bv. CS= neutrale Griekse letters met US= luisteren naar goede/slechte muziek
 Dergelijke experimenten leiden naar het inzicht dat evaluatieve conditionering effectief is in
situaties die dichter bij het dagelijkse leven staan dan het geval was in het originele fotofoto experiment
2.1.7 observeerbare evaluatieve conditionering
 Heeft nog niet veel experimentele aandacht gekregen
 Er bestaan indicaties dat evaluatieve conditionering ook kan optreden op een indirecte,
observationele manier
 De deelnemer wordt niet rechtstreeks blootgesteld aan een CS-US contingentie maar
observeert een andere persoon die hieraan blootgesteld wordt en zijn evaluatie van de
kritische stimuli expliciet maakt
 Kritische vraag: verwerft de CS een waarde die congruent is met de waarde van de CS van
het model?
 Twee paradigma’s laten zien dat dit inderdaad het geval is
2.1.8 affectieve priming als een indirect non verbale meting van evaluatief leren
 Recente tendens is om te proberen indirecte, non-verbale metingen de ontwikkelen voor
verworven stimulus waarde.
o Minder opdringerig
38
o Minder vatbaar voor vraageffecten
 Meest prominente methode: affectieve priming
o Serie van positieve/negatieve stimuli wordt getoond welke zo snel mogelijk
geëvalueerd moeten worden als positief of negatief
o Elk target wordt voorgegaan door een prime stimulus die pos/neg/neutraal kan zijn.
deze prime moet genegeerd worden door de proefpersoon
o Resultaten tonen dat de tijd die nodig is om een target stimulus te evalueren wordt
gemedieerd door de valentie van de primes
 Congruente prime: snellere reactietijden
 Affectieve priming is gebaseerd op automatische verwerking van de waarde van de prime,
wat betekend dat snelle, onvrijwillige en relatief inefficiënte processen onderliggend het
effect te vinden zijn
 Als de conditioneringsfase succesvol de waarde van de CS veranderd heeft in de verwachte
richting, dan zal de aanbieding van een CS die gepaard ging met een positieve US het proces
van een positief target moeten faciliteren en het proces met een negatief target inhiberen
(dit wordt ook teruggevonden!)
2.1.9 evaluatief leren gelijktijdig met verwachtingsleren
 Het is niet omdat evaluatief leren meestal onafhankelijk van verwachtingsleren bestudeerd
is, dat beide niet samen kunnen voorkomen
 De laatste reeks van studies gaan over zowel evaluatief als verwachtingsleren
o Evaluatief leren: differentiële pos/neg beoordelingen van de CS en affectieve priming
data
o Verwachtingsleren: differentiële US verwachtingsbeoordelingen en
huidgeleidingsresponsen op neg/pos CS
 In al deze experimenten was er duidelijke evidentie voor evaluatief leren gelijktijdig met
signaal/ verwachtingsleren
 Het belang van deze bevinding is dat de een experimentele demonstratie bieden dat
evaluatieve conditionering en signaal leren niet als wederzijds exclusief beschouwd moeten
worden
 Ze moeten gezien worden als een potentieel samen bestaand fenomeen welke zal
verschijnen van zodra de condities voor leren in beide gevallen voldaan zijn
2.1.10 addertje onder het gras
 Op basis van al het voorgaande zouden we kunnen besluiten dat evaluatieve conditionering
een doordringend en ecologisch valide fenomeen is welke optreedt in een verscheidenheid
van situaties en een veelheid van stimuli beïnvloed
 MAAR dit treedt niet op in elke situatie waarin een neutrale stimulus gepaard gaat met een
stimulus met bepaalde waarde
 We kunnen speculeren over de oorzaken van het falen, maar het blijven speculaties
2.2 functionele karakteristieken van evaluatieve conditionering
2.2.1contingentie bewustzijn en impliciete/ expliciete kennis dissociaties
 De resultaten van de eerste experimenten die de relatie onderzochten tussen evaluatief
leren en de acquisitie van expliciete CS-US relationele kennis, suggereren een orthogonale
relatie tussen contingentie bewustzijn en de modificatie van een stimulus valentie
o Het is geen implicatie van deze orthogonale hypothese dat evaluatieve conditionering
moet optreden in de afwezigheid van contingentie bewustzijn
o Het impliceert dat het niet uitmaakt of er contingentie bewustzijn is opdat evaluatieve
conditionering optreedt
39
 Het bestaan van onbewuste of impliciet evaluatief leren is overtuigend gedemonstreerd in
verschillende experimenten welke gebruik maakte van subliminale presentaties van de US
 Ook experimenten welke supraliminale CS en US presentaties hanteren bieden bijkomende
evidentie voor de mogelijkheid van evaluatief leren zonder contingentie bewustzijn
 Het lijkt niet enkel mogelijk voor evaluatief leren om op te treden op het niveau van
impliciete, onbewuste informatie verwerking maar de geobserveerde CS-US contingentie
bewustzijn blijkt de conditioneringseffecten niet de versterken
o Bepaalde experimenten laten zien dat er een toename is in de contingentie bewustzijn,
maar niet in een sterkere evaluatieve respons
 Dit opent de mogelijkheid dat in sommige omstandigheden de voorgestelde orthogonaliteit
tussen contingentie bewustzijn en evaluatief leren niet stand houdt, in die zin dat de CS-US
relationele bewustzijn tegen de verschuiving van de CS waarde werkt (werd gevonden in
latere studies)
 In andere conditionele settings werd net het tegenover gestelde gevonden
 Er blijkt dus geen eenvoudige samenvatting te zijn voor de relatie tussen contingentie
bewustzijn en evaluatieve conditionering, toch niet wanneer de verschillende taken en
conditionele situaties mee in rekening gebracht worden
 Een voorzichtige en minimale conclusie van het onderzoek is dat in sommige
omstandigheden evaluatief leren kan optreden in de afwezigheid van
contingentiebewustzijn
2.2.2weerstand tegen extinctie
 De theoretisch en pragmatisch belangrijke claim dat evaluatieve conditionering bestand is
tegen extinctie heeft bijkomende steun verkregen in verschillende conditionering opzetten
o Smaak paradigma
o 6 of 12 trials met de bittere smaak
o Test fase: 2 blokken met elk 4 onbekrachtigde presentaties van CS+ en CSo Resultaten: de verworven evaluatieve CS-/CS+ differentiatie was even sterk in het twee
als in het eerste extinctie blok
o Gelijkaardig experiment: de origineel verworven evaluatieve differentiatie blijven
stabiel en betrouwbaar doorheen elke extinctie fase
 Deze observatie heeft belangrijke klinische/ toegepaste consequenties
o Men kan niet verwachten dat een behandeling die enkel uit extinctie (=exposure)
bestaat volledig effectief is
2.2.3 contiguïteit vs. contingentie: de ineffectiviteit van niet bekrachtigde CS en/ of US alleen
presentaties
 Er is evidentie dat de toevoeging van niet bekrachtigde CS+ presentaties tijdens de
acquisitie fase de ontwikkeling van een evaluatieve CS-US associatie verhinderen/vertragen
 Dit suggereert dat evaluatieve conditionering eerder bepaald wordt door het aantal
spatiaal- temporele opeenvolgende CS-US representaties dan door de mate van statistische
contingentie tussen het optreden van CS en US
o Het aantal trials de zowel de CS als de US bevat lijkt cruciaal te zijn, niet het aantal
trials welke enkel een CS of US presentatie bevatten
 als er twee CS’en gebruikt zijn, waarvan de eerste meer contingent met de US maar minder
spatiaal temporele contigu US dan de andere, dan is het niet de meer contingente CS maar
de meer contigue CS welke associatieve waarde verwerft
2.2.4 tegenconditionering
 een serie onbekrachtigde CS alleen presentaties volstaat niet om de verworven waarde van
een stimulus uit te wissen
40
o dit impliceert niet dat geconditioneerde waarde ongevoelig moet zijn voor eender
welke sub sequentie manipulatie
 empirische evidentie dat evaluatieve conditionering sensitief is voor tegenconditionering
(US andere waarde geven)
 resultaat van dergelijk onderzoek: de origineel verworven waarde van de CS wordt
ingetrokken en neigde te verschuiven in de richting van de meest recente gepaarde US
 tegen conditionering kan ook effectief zijn wanneer een US met tegengestelde waarde
gepaard gaat met een CS tijdens (in plaats van na) acquisitie
2.2.5 codering van specifieke sensorische karakteristieken of algemene affectieve
karakteristieken van US
 post conditionering US alleen presentaties (wat vermoedelijk resulteren in habituatie van
de US) resulteert in een significante afname in de origineel verworven voorkeur voor de
geassocieerde CS foto
 gevoeligheid voor post conditionering US revaluatie impliceert meer dan de louter
referentiele waarde van de US: het vereist ook dat de CS geassocieerd is met een
representatie van de US welke voldoende gedetailleerde informatie bevat over de
specifieke sensorisch beschrijvende karakteristieken van de US
 US moet opgevat worden als een stimulus met minstens 2 kenmerken welke elk
afzonderlijk geassocieerd kunnen worden met CS
o Emotioneel affectieve kenmerken
o Sensorisch beschrijvende kenmerken
o Emotionele representatie wordt meer algemeen bevonden dan de sensorische
representatie van de US
o Als er gevoeligheid is voor US revaluatie: CS is geassocieerd met de emotioneel
affectieve en de sensorisch beschrijvende kenmerken van US
o Als de CS de veranderde waarde van de US niet bij houdt: CS is enkel geassocieerd met
het emotioneel affectieve niveau van US representatie
 US infatie experiment (variant van US revaluatie experiment)
o Men wijzigt het evaluatieve teken van de US niet maar men wijzigt de mate van
afkeer/voorkeur
o De resultaten van post conditionering US inflatie staan dezelfde conclusies toe als die
van US revaluatie
o Flavor- Flavor paradigma:
 Acquisitie fase: CS wordt gekoppeld met licht bittere smaak
 Inflatie fase: hoog bittere smaak
 Post inflatie CS beoordelingen
 Resultaat: post acquisitie evaluatief leer effect verhoogde niet door US inflatie
 Suggereert dat in evaluatief smaak-smaak leren enkel de affectieve
karakteristieken van de US gerepresenteerd en geactiveerd worden door de CS
 Waarom gaat het bij dit type van evaluatief smaak-smaak leren enkel om een codering van
de affectieve US karakteristieken waartegen bij het face- face paradigma bleek dat het
gebaseerd was op de associatieve link met de sensorisch descriptieve karakteristieken van
de US
o Hypothese: dit verschil kan te wijten zijn aan de verschillende aard van de US in beide
paradigma’s
 Foto’s van gezichten bevat meer gedetailleerde sensorische descriptieve
karakteristieken dan een smaak
 Een smaak leidt meer tot affectief emotionele karakteristieken
41
o Hieruit stellen we de hypothese dat US inflatie ongevoeligheid niet noodzakelijk een
karakteristiek is van smaak-smaak leren in het algemeen maar grotendeels afhankelijk
is van de specifieke aard van de US
2.2.6 sensorische pre conditionering
 Sensorische preconditionering betreft een procedure waarin twee CS’en eerst geassocieerd
worden met elkaar waarna één van de twee geassocieerd wordt met de US
 Resultaat: niet enkel CS2 maar ook CS1 ( die nooit rechtstreekst gepaard was met US)
verwierf de valentie van US
 Dus het zijn niet enkel neutrale stimuli die direct gerelateerd zijn afkeur/voorkeur
gebeurtenissen, maar ook andere neutrale stimuli die voordien geassocieerd zijn met de
neutrale stimulus die het doel kunnen worden van evaluatieve verandering
2.2.7 evaluatieve associaties zijn niet sensitief voor modulatie
 Een verworven voorkeur/ afkeur voor stimulus A blijkt vaak gemoduleerd te zijn door de
aan-/afwezigheid van een andere stimulus X of door de specifieke context waarin A
aanwezig is
 Er is onderzocht ov de acquisitie van dergelijke conditionele waarde gemodelleerd kan
worden in een feature positive (FP) discriminatie taak
o Target stimulus A wordt enkel bekracht wanneer A samen aangeboden/ vooraf gegaan
wordt met een andere stimulus X
 Leidt tot totstandkoming A-US associatie die gemoduleerd woord door X
o Toegepast op smaak- smaak paradigma
 Neutrale smaak werd bekrachtigd door bittere smaak als het vergezeld ging van
een bepaalde kleur
 Er was geen evidentie voor modulatie verkregen: men kreeg een afkeur voor A maar die
was niet conditioneel, niet gemoduleerd door X
 Dergelijke studies focuste op:
o De relatieve mate van beloning van bepaalde categorieën van stimuli om te
functioneren als een modulator van een bepaalde categorie CS-US associatie
 Meer specifiek: het idee dat smaak-smaak associaties niet vatbaar zijn voor
modulatie door een kleur, maar door een andere smaak stimulus
o Evaluatieve ambiguïteit hypothese: gelegenheid setting mag enkel optreden wanneer
de target ambigu is wat opgelost kan worden door een ander kenmerk X mee in
rekening te brengen
o Configuraal leren als fenomenologisch verwacht met gelegenheid setting, maar ervan
verschillend in termen van de condities van leren en het betrokken proces
o Het idee dat conditioneel leren enkel optreedt na uitgebreide training
 De data steunde geen enkele van deze hypothesen
3.verwachtingssysteem vs. referentieel systeem
3.1 louter referentiële vs. verwachte relatie: gewogen tegen en bevredigend bevonden
 De observatie dat evaluatieve conditionering geen contingentie bewustzijn suggereert het
construct ‘louter referentiële CS-US relatie’ als de hoeksteen voor evaluatief leren
o We karakteriseren het als een relatie welke een louter activationele associatieve link
tussen CS en US representatie inhoudt, welke geen echte US verwachting genereert
 Deze descriptieve noties blijken valide te zijn om de essentiële en functionele
karakteristieken van beide vormen van klassieke conditionering te vatten
o Het grote verschil tussen verwachtingsleren en louter referentiële relaties is dat de
eerste ontkracht kan worden door het niet optreden van US
42
o Evaluatieve conditionering lijkt ongevoelig te zijn voor de graad van statistische
correlatie tussen CS en US ( verwachtingsleren niet)
 De observatie dat sommige instanties van evaluatieve conditionering gevoelig zijn voor US
revaluatie/- inflatie en andere niet, is niet problematisch voor de notie van louter
referentieel leren
3.2 de systeem benadering
 Het fenomenologisch onderscheid tussen verwachtings- en louter referentiele relaties is een
reflectie van het bestaan van twee functionele systemen welke verschillen wat betreft de
condities die controleren voor associatieve sterkte herziening en wat betreft de expressie van
de associatieve kennis in verschillende types van overt gedrag
3.2.1 het verwachtingssysteem (ES)
 De ES zoekt voor betrouwbare predictoren/ signalen van biologisch significante
gebeurtenissen (US) en bereid het organisme biologisch voor op een kosten efficiënte
manier om optimaal om te gaan met een dreigende US
 Dit vereist een tijdelijke activatie van stimulus en context specifieke autonome en
motorische responsen welke appetitief, defensief of oriënterend kunnen zijn
 Omwille van de grote kost van het voorbereid reageren…
o ES reageert enkel op stimuli (CS) die betrouwbaar , niet redundant en duidelijke
predictors zijn voor het optreden van US
 Vereist gevoeligheid voor CS-US contingentie en voor de relatief informationele
waarde en de relatieve saliëntie van de verschillende kandidaat predictoren (cue
competitie)
o De ES initieert enkel responsen zo lang dat de predictieve CS-US relatie valide is, niet
wanneer het detecteert dat de verwachte US niet langer optreedt
 De ES is gevoelig voor het feit dat sommige predictieve CS-US relaties conditioneel zijn
 Processen welke verantwoordelijk zijn voor de creatie van dergelijke staat hebben een hoge
prioriteut en roepen automatisch voor aandacht.
 Dit kan uitleggen waarom verwachtingsleren en CS-US contingentie bewustzijn hand in
hand gaan
3.2.2 het referentiële systeem (RS)
 Verantwoordelijk voor het vormen van de algemene voorkeuren en afkeuren van een
organisme voor stimuli
 It biedt de representaties van stimuli met affectieve labels welke verondersteld worden in
de meeste theorieën van emoties en gemoed of meer algemeen van affectieve informatie
verwerking
 RS bepaald de algemene richting van het gedrag: creëert een algemene respons tendens
tov bepaalde stimulus
 Deze indirecte manifestatie van de RS vereist een modulatie van mogelijke responsen
 De RS drukt zichzelf uit op een manier die weinig kosten met zich mee brengt
 RS kan zich gedragen als een zeer eenvoudig mechanisme, welke enkel spatiaal temporele
contiguïteit tussen CS en US in rekening brengt
 RS kan werken zonder beroep te doen op kosten besparende mechanismen zoals
gevoeligheid voor statistische contingentie, extinctie, conditionele aard van een bepaalde
CS-US relatie of de relatieve informationele waarde/stimulus saillantie van de CS’en
 Associaties in de RS worden waarschijnlijk gevorm op basis van een simpele hebbian leer
regel welke de kracht van een associatie tussen 2 stimuli doet toenemen wanneer de
stimuli samen voorkomen. Maar laat de associatie sterkte intact wanneer de stimuli apart
optreden
43
 En stimulus valenties blijken een directe vertaling te zijn van deze associaties
3.2.3 adaptiviteit van de RS
 Zo lang er een valide correlatie is tussen CS en US is het vanzelfsprekend dat dit adaptief is
om een voor-/afkeur te vertonen voor de CS, welke keuzegedrag kan leiden of kan een
neg/pos respons tendens aansporen
 Zolang er geen hoge differentiële respons kost geassocieerd is met voor-/afkeur voor een
stimulus, is het waarschijnlijk in bepaalde mate van toepassing dat “als het niet goed is,
schaadt het ook niet”
o Sommige karakteristieken van de RS welke blijkbaar geen duidelijk adaptief voordeel
bieden, kunnen eenvoudigweg niet adaptief zijn. niet in de zin van ‘tegen adaptief zijn’
maar in de zin van extra adaptieve consequentie te zijn van een anders adaptief
mechanisme
 Zo lang de RS omgaat met keuze situaties/ keuze gedrag/ met de activatie van algemene
respons tendenties, kan er op de lange duur een voordeel zijn in de zin dat de RS omgaat
met bijvoorbeeld statistische contingentie of extinctie
3.2.4 de relatie tussen ES en RS
 Deze functionele benadering van het onderscheid tussen verwachtingsleren en evaluatief
leren zegt niets over de vraag hoe beide vormen van leren behandeld worden op proces
niveau noch laat het zich verbinden tot een algoritmische implementatie van deze
systemen
 Het spreekt niet over de relatie tussen ES en RS noch over hoe ze zich verbinden tot een
bepaalde algoritimische uitvoering van deze systemen
 Een mogelijke lezing van het onderscheid zou zijn: accepteren dat verwachtingsrelatie en
referentiële relaties letterlijk gerepresenteerd worden als kwalitatief verschillende
gestructureerde mentale representaties en dus zo betekenisloze associaties te verplaatsen
door gekwalificeerde relaties
o Implicatie: we gaan verder dan het pure niet propositionele associatief kader en
treden een domein toe van klassieke cognitieve theorieën waarin de CS-US associaties
voorgesteld worden als een gestructureerd symbool
 Ondanks dat ze beide gebaseerd zijn op onvoorwaardelijke CS-US associaties, gedrag beide
systemen zich zodanig dat van een puur descriptief zichtpunt ze resulteren in een outcome
die goed gevat kan worden in termen van de notie van kwalitatief verschillende
verwachtings-vs. referentiële relaties
 De werking van de twee systemen is niet mutueel exclusief
8. Bekrachtiging schema’s
Inleiding
 S(RO): soms is de kans op een bepaalde outcome quasi 1 (outcome zal altijd volgen)
 De kans op een bepaalde outcome kan ook kleiner dan 1 zijn
 Of een bepaald optreden van de instrumentele respons resulteert in een bekrachtiging hangt
af van verschillende factoren
o Soms moet de instrumentele respons een aantal keer uitgebracht zijn alvorens er
bekrachtiging komt
o Soms moet er een bepaalde tijd verstrijken na het uitbrengen van de instrumentele
respons alvorens die bekrachtigd wordt
o Soms zijn beide (tijd+ respons herhaling) van belang
44
 Schema van bekrachtiging: de regel welke specificeert welk optreden van de instrumentele
respons bekrachtigt is
 Bekrachtigingsschema’s bepalen:
o Frequentie van het gedrag
o Respons-patroon
o de persistentie van instrumenteel gedrag in extinctie, wanneer er geen bekrachtiging
meer aanwezig is
o De keuze tussen respons- alternatieven R1 en R2
8.1 de cumulatieve record
 Om het effect van bekrachtigingsschema’s te onderzoeken wordt vaak gebruik gemaakt van de
‘free operant methode’
o Automatische registratie van de re responsen en automatische toediening van
bekrachtigers
o Training sessies duren een uur per dag en meestal vinden er meerdere sessies plaats
 Cumulatieve record: soort grafiek (trappatroon)
o X-as: tijdsverloop
o Y-as: cumulatieve frequentie van de responsen op een bepaald tijdsmoment
o Helling: frequentie van uitbrengen responsen binnen een bepaalde tijdseenheid
 Berekend door de verticale verschuiving tussen 2 punten op de grafiek te delen door
de horizontale verschuiving tussen deze 2 punten
 Hoe scherper de helling, hoe meer responsen
8.2 eenvoudige schema’s van bekrachtiging
 Ratio schema
o Frequentie van respons is kritische factor welke de bekrachtiging bepaald
 Interval schema
o Timing van de responsen is kritische factor
 In beide gevallen krijgt het individu geen bekrachtiging voordat het een respons heeft
uitgebracht
8.2.1 ratio schema’s
 Er moeten een aantal responsen uitgebracht zijn sinds de laatste bekrachtiging alvorens het
individu een volgende bekrachtiging krijgt
 Fixed ratio schema (FR)
o Deelnemer moet een vast aantal responsen uitvoeren om een bekrachtiging te bekomen
o Bv. FR4= de 4de respons wordt telkens bekrachtigd, onafhankelijk van de tijd die nodig is
om 4 responsen te stellen
o Vinden plaats in situaties waar er altijd een vaststaande hoeveelheid moeite gedaan moet
worden om een taak te beëindigen/ bekrachtiger te verkrijgen
o Grafiek:
 Getrapt patroon
 Postreinforcement pause: Na een bekrachtiger worden er telkens even geen
responsen uitgebracht
45
 Hoe hoger de ratio vereisten, hoe langer de pauzes duren (bv. bij FR10 zijn er
langere pauzes dan bij FR2)
 Ratio run: Na een pauze krijg je een hoogfrequente responsreeks die leidt tot een
bekrachtiging
 Variabel ratio schema (VR)
o Er moet een bepaald aantal responsen uitgebracht worden alvorens er een bekrachtiging
komt. Het aantal varieert over verschillende bekrachtigingen heen
o Bv. VR4: gemiddeld zijn er 4 responsen nodig voor er een bekrachtiging komt,
onafhankelijk van de tijd die nodig is om de responsen uit te brengen
o Grafiek
 Lineair patroon
 Er is een regelmatige en hoogfrequente responsreeks
 Er zijn geen voorspelbare pauzes na een bekrachtiging
8.2.2 interval schema’s
 Tijd is de kritische factor
 Of een respons bekrachtigd wordt is afhankelijk van wanneer de respons optreedt na het
begin van de interval cyclus
 Fixed interval schema (FI)
o Een vaststaande hoeveelheid tijd moet gepasseerd zijn voordat een respons bekrachtigd
word
o Vinden plaats in situaties waarin het een zekere hoeveelheid van tijd vereist voordat de
bekrachtiger bereid is/ opgezet is
o Bv. FI4: het moeten altijd 4 minuten verstrijken voordat een nieuwe respons bekrachtigd
wordt
o Maar de bekrachtiger wordt niet automatisch gegeven na het einde van het interval! De
instrumentele respons moet uitgebracht zijn
 Een het kritische interval verstreken is, blijft de bekrachtiger beschikbaar tot de
eerst volgende respons
o Te vroeg uitgebrachte responsen hebben geen effect. Ze worden noch beloond, noch
bestraft
o Grafiek:
 Schelpjes/ golfjes patroon
 postreinforcement pauze: Weinig/ geen reactie in het begin van een interval
 uitbrengen van responsen neemt toe naarmate het einde van het interval dichterbij
komt, hoge mate van uitbrengen respons
 Variabel interval schema (VI)
o De hoeveelheid tijd varieert van trial tot trial
o Bv. VI4: gemiddeld moeten er 4 minuten verstreken zijn voor een nieuwe respons
bekrachtigd wordt
o Grafiek:
 Regelmatige en hoogfrequente responsreek ( wel minder hoge respons rates dan bij
VR)
 Geen voorspelbare pauzes na bekrachtiging
 FI/VI met limited hold
46
o Eens het kritische interval verstreken is, blijft de bekrachtiging normaal beschikbaar tot de
eerstvolgende respons
o Bij limited hold: zodra de bekrachtiger beschikbaar is, blijft hij slechts een beperkte tijd
beschikbaar
o Het effect hiervan is dat de response- rate hoger is
8.3 mechanismen van schema performantie
 De aanbieding/ het optreden van een bekrachtiging geeft feedback over de operante respons
 Verschillende bekrachtigingsschema’s verschillen in de aard van de feedback die ze
verschaffen
 Feedback functie: kijken hoe de mate van bekrachtiging gerelateerd is aan de mate van
uitbrengen response
8.3.1 feedback functies van ratio schema’s
 Hoe snel een organisme beloond wordt, wordt bepaald door hoe snel het vereiste aantal
responsen uitgebracht wordt
o Hoe sneller het organisme reageert, hoe sneller het bekrachtigd wordt
 Feedback functie van een ratio schema is altijd een lineaire functie
 Hoe meer responsen er uitgebracht worden, hoe meer bekrachtiging
 Hoe hoger het ratio vereiste, hoe lager het lineaire verband
8.3.2 feedback functies van interval schema’s
 Als het organisme geen respons uitbrengt, zal het geen bekrachtiging krijgen
 Tot op een bepaalde hoogte zal een toegenomen aantal responsen gepaard gaan met hogere
mate van bekrachtiging
 Wanneer alle responsen waarop men bekrachtigd kan worden gesteld zijn, krijg je geen extra
bekrachtiging door nog meer responsen te stellen ( je krijgt dus een afvlakking van de curve)
 Niet enkel hoeveel responsen gesteld worden is van belang, hoe wanneer de responsen
gestel worden
o Er is geen lineaire toename
o Het moment van de afvlakking van de curve is afhankelijk van wanneer de responsen
uitgebracht worden
8.3.3 feedback functies en gedrag op bekrachtigingsschema’s
 Ratio schema’s resulteren in hogere mate van respons dan interval schema’s (ook bij
vergelijkbare bekrachtigingsfrequentie)
 Hypothese: het verschil in feedbackfunctie is de oorzaak
o Soort meta- leren: organisme weet wanneer het beloond zal worden
o Ratio schema: hoe meer responsen, hoe meer bekrachtiging
 Differentiële bekrachtiging van hogere mate van respons
o Interval schema: vanaf een bepaald moment leiden meer responsen niet tot meer
bekrachtiging
 Vanaf dat punt is er geen differentiële bekrachtiging van hogere mate van respons
 Feedback functies zijn soms moeilijk te karakteriseren
8.4 chained bekrachtigingsschema’s
 Bij FR, VR, FI en VI gaat het om slechts één type respons
 Veel instrumentele respons situaties omvatten een sequentie van responsen/ respons
componenten
 Chained bekrachtigingsschema’s
o Sequentie van verschillende responsen
47
o Alle responsen moeten in een bepaalde volgorde uitgebracht worden voordat de finale
uitkomst volgt
o Elk respons component heeft een eigen geassocieerde stimulus
8.4.1heterogene ketens
 Sequentie van verschillende responsen (kwalitatieve verschillenà, waarvan elke respons
uitgevoerd wordt in de aanwezigheid van een andere stimulus
 Elke respons component van de ketting produceert een nieuwe stimulusconfiguratie
(tussentijdse outcome) die de stimulus vormt voor de volgende respons component
 Bv. pull aantrekken
 Er is geen bevrediging door bekrachtiging wanneer de respons sequenties halverwege
onderbroken wordt
8.4.2 homogene ketens
 De verschillende componenten bevatten dezelfde respons maar elke component vindt plaats
in de aanwezigheid van een eigen stimulus en heeft een eigen bekrachtigingsschema
 Komen minder frequent voor in het dagelijkse leven
 Een persoon moet dezelfde respons uitvoeren in verschillende contingenties gedurende
verschillende delen van de taak
 Elke component van de keten produceert een patroon van responsen welke karakteristiek is
voor het eenvoudige schema dat feitelijk van kracht is in dat component
8.4.3 trainen van respons ketens
 Backward chaining
o De laatste respons van de ketting wordt eerst aangeleerd omdat het zich het dichtste
bevindt bij de bekrachtiger
o Vroegere responscomponenten worden toegevoegd eens het organisme het einde van de
ketting onder de knie heeft
o Primaire bekrachtiger duidt de laatste repons van de keten aan
o Secundaire/ geconditioneerde bekrachtigers duiden het einde aan van een component
respons
o Kan zeer effectief zijn
 Forward chaining
o Starten bij het begin en aanvankelijk de eerste respons in de ketting bekrachtigen
o Eens de eerste respons aangeleerd is, kan de tweede volgen enz.
o Elke component van de ketting moet aanvankelijk bekrachtigd worden met de primaire
bekrachtiger
o Erna wordt de bekrachtiging pas gegeven als het gedrag gesteld wordt die nodig is voor
het verkrijgen van de volgende discriminatieve stimulus
8.5 concurrerende (gelijktijdige) schema’s
 Bij eenvoudige en chained schema’s: het organisme heeft de keuze: ofwel stelt het de vereiste
respons, ofwel niet (= iets anders doen)
 In het echte leven moet er continu gekozen worden tussen verschillende mogelijke
gedragingen/ activiteiten
 De analyse van het keuzegedrag vereist meer controle over of registreerbaarheid van het ‘iets
anders doen’
 Bij gelijktijdige schema’s staat de analyse van de keuze tussen twee/ meer gecontroleerde
gedragsalternatieven centraal
 Of je het ene of het andere gedrag stelt, is afhankelijk van de voordelen die je krijgt bij elk van
de alternatieven
48
 Concurrerende schema’s vereisen minsten 2 respons alternatieven
o Respons A en respons B gaan gepaard met een verschillend bekrachtigingsschema
o Beide alternatieven zijn tegelijkertijd beschikbaar
o Deelnemer kan op eender welk moment van de ene activiteit op de andere overschakelen
 Verschillende factoren beïnvloeden hoe organismen hun gedrag verdelen tussen de twee
respons alternatieven
o Aard van de verschillende responsen
o Tijd/ moeite die verbonden is aan switch van de ene naar de andere respons
o Aantrekkelijkheid van de verschillende bekrachtigers
o Verschillende bekrachtigingsschema’s
 Meestal bestudeerd men situaties waarin enkel de aard van de bekrachtigingsschema’s
verschilt bij beide alternatieven
o Vaak uitgevoerd met duiven
o 1 muur heeft 2 respons sleutels op dezelfde hoogte van het hoofd van de vogel met
eronder een voedselbakje
 De twee responsen vereisen dezelfde moeite
 Bekrachtiging is de zelfde (voedsel)
 Dieren kunnen makkelijk overschakelen van de ene naar de andere respons
 Matching law
o In een situatie van gelijke bekrachtigers, gelijke responsen en een lage switch kost geldt dat
de relatieve mate van antwoorden op een respons alternatief gelijk is aan de relatieve mate
van bekrachtiging die verkregen wordt door deze respons alternatief
o
 R1 en R2: frequenties voor de respons alternatieven
 r1 en r2: frequenties van de (verdiende) bekrachtiging op beide alternatieven
o Dus: als er twee mogelijke gedragingen kunnen worden gesteld, alternatief 1 en 2, en
alternatief 1 heeft dubbel zoveel bekrachtigingen opgebracht dan alternatief 2, dan zal het
organisme dubbel zoveel kiezen (in termen van frequentie of tijd) voor alternatief 1 dan
voor alternatief 2
9. Theorieën over bekrachtiging
Inleiding
 Elke goede theorie moet consistent zijn met de bevindingen die ze willen verklaren
 Goede theorieën moeten nieuw onderzoek stimuleren welk dient om de precisie van de
theorie te evalueren en te doen toenemen
 Goede theorieën bieden inzicht in nieuwe manieren van denken over vertrouwde fenomenen
 Een theorie over bekrachtiging moet 2 vragen beantwoorden over instrumentele
conditionering
o Wat maakt iets een bekrachtiger en hoe kunnen we voorspellen of iets een succesvolle
bekrachtiger is?
 Vraag naar identiteit van bekrachtigers
o Hoe produceert een bekrachtiger zijn effecten of hoe produceert die een toename in de
waarschijnlijkheid van de bekrachtigde respons
 Vraag naar het mechanisme van bekrachtiger
9.1Thorndike en de wet van effect
 Eerste systematische theorie over bekrachtiging
 Een positieve bekrachtiger is een stimulus welke een ‘bevredigende stand van zaken’
produceert
 Maar hij geeft geen antwoord op de wat vraag
49





o Waarom is iets bevredigends?
o Enkel empirisch vast te stellen door het effect van een potentiele bevredigende stimulus X
na te gaan: stijgt de probabilitiet/ frequentie van het operant dat resulteert in X?
Thorndike geeft een label voor bekrachtigers, maar hij geeft geen verklaring voor wat iets een
effectief maakt als bekrachtiger
Law of effect (antwoord op de hoe vraag)
o Een bekrachtiger maakt een associatie/ connectie tussen de instrumentele respons R en
de stimuli S in de aanwezigheid waarvan de reactie uitgevoerd wordt
 Positieve bekrachtiger versterkt een S-R associatie
 Sterkere S-R relaties zullen leiden tot een hogere probaliteit van R in aanwezigheid
van s
o Bekrachtiger is niet iets waarover men leert, maar iets waardoor men leert
Ondanks het feit dat de wet van effect een toegenomen instrumentele respons voorspelt in de
training omgeving, het doet het door ‘een beetje magie’ in plaats van door een goed gevestigd
proces
Dus Thorndike biedt weinig meer dan een naam als antwoord op de vraag ‘wat maakt iets een
positieve bekrachtiger’
Zijn antwoord op de hoe vraag was succesvol in die manier dat het het gedragsmatige effect
van de bekrachtiger voorspelt. Maar het antwoord was oppervlakkig omdat het louter stelde
dat een S-R associatie gevormd werd zonder te specifiëren hoe dit kwam
9.2 Hull en Drive reductie theorie
 Hull accepteerde het S-R versterkingsmechanisme dat gespecifieerd werd in de wet van effect
 Maar concentreerde zich meer op de vraag ‘wat maakt iets een effectieve bekrachtiger’
 Homestase:
o Organismen verdedigen een stabiele staat ten opzichte van bepaalde kritische biologische
factoren
 Bv. voedseldeprivatie leidt tot een toegenomen honger toestand
 Voedselconsumptie reduceert deze honger toestand
o De psychologische consequentie hiervan is een motivationele of behoefte toestand
o Wat een stimulus een bekrachtiger maakt is zijn effectiviteit om een behoeftetoestand te
reduceren
9.2.1 primaire bekrachtigers
 Deprivatie procedures die biologische homeostatische systemen uitdagen, maken bepaalde
prikkels automatisch (zonder training of leerervaringen) tot efficiënte bekrachtigers
o Bv. voedsel, warmte, drinken
 Met dit soort bekrachtigers zal gradueel de behoefte bevredigd worden en zal de prikkel
steeds meer mate van bekrachtiging verliezen
 Primaire bekrachtiger: stimulus welke effectief zijn in het reduceren van een biologische
nood zonder een eerdere training
9.2.2 secundaire bekrachtigers en verworven drives
 Stimuli die geen behoefte toestand reduceren maar hun bekrachtigingskenmerken verkrijgen
door associatie met een primaire bekrachtiger
o De stimuli zijn via Pavloviaans leren geassocieerd met een primaire bekrachtiger
 Bv. geur (VP) van voedsel (OP)
o Ze reduceren op zich geen biologische behoefte toestand
o Maar ze verwerven een bekrachtigend vermogen door de associatie met prikkels die
wel rechtstreeks een biologische behoefte toestand reduceren
50
 Stimuli die geassocieerd worden met een primaire behoefte toestand worden veronderstelt
een conditionele / verworven toestand ontlokken
 Prikkels die een verworven behoeftetoestand reduceren, zijn ook effectieve bekrachtigers
o Dit concept is vooral gebruikt in de context van aversief- gemotiveerd gedrag (negatieve
bekrachtiging)
o Bv. geconditioneerde vrees en ontsnappings-/vermijdingsgedrag
9.2.3 sensorische bekrachtigers
 De theorie was succesvol uitgebreid naar situaties welke geen primair biologische behoeften
bevatten
 Maar theorie was niet in staat om al de instanties van bekrachtiging te verklaren
 Bepaalde gedragingen worden in stand gehouden door prikkels die noch als primaire noch als
secundaire bekrachtiging kunnen worden geconceptualiseerd
o Bv. hendeldrukkenlicht/ donker voor ratten die lange tijd in het donker/licht
verblijven
o Allerlei vormen van prutsen, bewegen
 Hiervoor wordt de term sensoriële bekrachtiging gebruikt
o In veel situaties, kan een sensorische stimulatie, zonder duidelijke relatie met een
biologische nood of behoefte toestand dienen als een effectieve bekrachtiger (bv.
muziek)
9.3 bekrachtigers als responses
 David Premack: zag bekrachtigers van en volledig verschillend perspectief
 Hij kaderde het probleem van bekrachtiging in termen van activiteiten/gedrag niet in termen
van de stimuli
o Bv. hendel drukkenvoedsel
 Vroeger: voedsel: bekrachtiger
 Premarck: het opeten van het voedsel: bekrachtiger/ bekrachtigde respons
9.3.1 het Premack principe
 Wat maakt eten anders dan hendel drukken?
o Hendel drukken moet aangeleerd worden, eten niet
o Eten kan overal plaats vinden, hendel drukken niet
o Vereisen andere spieren
o…
 De kritische preconditie voor bekrachtiging is niet een behoefte toestand. Het is het bestaan
van twee responsen die verschillen in hun probabiliteit van optreden wanneer het organisme
vrije toegang krijgt tot beide activiteiten
 Premarck principe: de gelegenheid om de respons met de hoogste probabiliteit uit te voeren
zal dienen als bekrachtiger voor de respons met de lagere probabiliteit
o = differentiële probabiliteit principe
o Bv. als hendel drukken (lage probabiliteit)eten (hoge probabiliteit) dan zal eten
fungeren als bekrachtiger voor hendel drukken
o De specifieke aard van de instrumentele respons en bekrachtiger maakt niet uit
o De enige vereiste is dat de ene respons meer waarschijnlijk is dan de andere
9.3.2 de Premack revolutie
 Premack principe
o Noodzakelijke en voldoende vorowaarde voor een bekrachtiging is dat er een
contingentie bestaat tussen een laag- waarschijnlijke en een hoog- waarschijnlijke
activiteit
51
o Irrelevant
 Onderscheid tussen primaire en secundaire bekrachtigers (HULL)
 Onderscheid tussen reductie van behoefte toestand vs. sensoriële bekrachtiging
(HULL)
 Biedt handig hulpmiddel voor de toepassing van instrumentele conditionering in een
verscheidenheid van educationele setting
9.3.3 toepassingen van het Premack principe
 Educationele contexten: studenten worden aangemoedigd om nieuwe responsen te leren en
uit te brengen
o Doel: de probabiliteit van lage probabiliteit responsen te verhogen
o Instrumentele conditionering is hier uitermate geschikt voor, maar men moet eerst een
geschikte bekrachtiger vinden
 Volgens Premack is een bekrachtiger eender welke activiteit die de participant meer
waarschijnlijk zal uitvoeren dan de instrumentele respons
 Alles wat je moet doen is toegang te bieden tot de hoge probabiliteit respons enkel als de
student eerst het gedrag met de lage probabiliteit uitvoert
9.3.4 theoretische problemen
 Twee tekortkomingen met het differentiële probabiliteitsprincipe
o Hoe meet je en bereken je precies de baseline- probabiliteit van een respons?
 Daarboven op is de probabiliteit van een respons geen constante maar kan
fluctueren
 In praktijksettings kan het omzeild worden met token systeem
o Dit principe biedt enkel een antwoord op de wat vraag, niet op de hoe vraag
 Hoe/ via welk mechanisme zorgt contingentie tussen laag waarschijnlijk en hoog
waarschijnlijk gedrag voor een toename in de probabiliteit/ frequentie van het laag
waarschijnlijk gedrag
9.4 de respons deprivatie hypothese
 Timberlake & Allison
 Poging om een antwoord te bieden op de theoretische problemen die het Premack principe
niet kon oplossen
 Ze denken aan bekrachtigers als responses ipv als stimuli (PREMACK)
 Startpunt: verschil tussen een instrumentele respons en een bekrachtigende respons
 Ze suggereerde dat het kritische verschil tussen instrumentele responsen en
bekrachtigersresponsen is dat de deelnemers vrije toegang hebben tot de instrumentele
respons maar beperkt zijn om de bekrachtigende respons te stellen
o Instrumentele conditionering situaties ontnemen de deelnemers de vrije toegang tot de
bekrachtigende respons
o Bv. hendel drukken is vrij beschikbaar, eten is beperkt en conditioneel beschikbaar
 De restrictie op de beschikbaarheid van de bekrachtigende respons, maakt deze tot
bekrachtiger
o Eten wordt bekrachtiger, niet omwille van een behoefte reductie of omdat het een hoog
waarschijnlijke respons is maar omwille van de door de operante contigneties ingevoerde
restrictie op eetgedrag
9.4.1 Respons deprivatie en de wet van effect
 Bv. 1 keer op hendel drukken voldoende voedsel voor 1 week
o Thorndike: “een positieve bekrachtiger is een prikkel die een bevredigende toestand
teweeg brengt”
52
 Het zou dus een sterke bekrachtiger moeten zijn, dus een sterke S-R connectie,
dur P(R) stijgt sterk
o Respons deprivatie analyse: er is geen restrictie op de bekrachtigende respons (eten)
dus is er een weinig bekrachtigende waarde, dus P(R) stijgt weinig
 Er is geen restrictie meer op eetgedrag, dus de motivatie tot hendel drukken valt
weg
 De kritische factor is dat een instrumentele conditionering procedure een restrictie plaats op
het eten
 Deze respons deprivatie maakt van eten een bekrachtiger
 Wanneer de respons deprivatie verwijderd wordt, zal instrumenteel reageren niet
toenemen; de instrumentele respons zal niet bekrachtigt worden
9.4.2 respons deprivatie en respons probabiliteit
 Respons deprivatie hypothese vereist geen berekening van respons probabiliteiten
 Om respons deprivatie toe te passen moet iemand slecht de rate van responsen tijdens een
baseline periode te bepalen in de afwezigheid van eender welke restrictie en dan moet men
de toegang tot de bekrachtigende respons beperken tot onder het baseline niveau
 Voorspelling: zelfs een respons met een lage waarschijnlijkheid kan een bekrachtiger worden
o De mogelijkheid om een lage probabiliteit respons uit te brengen kan gebruikt worden
om een gedrag met een hogere respons probabiliteit te bekrachtigen wanneer de
toegang tot de laag probabiliteit respons reeds beperkt is tot onder de baseline
o Tegengesteld aan Premack principe, maar wel evidentie voor gevonden!
9.4.3 respons deprivatie en de locus van bekrachtigers effecten
 In eerdere theorieën werd bekrachtiging verklaard in termen van factoren buiten de
instrumentele conditioneringsprocedure zelf
 Respons deprivatie theorie: de locus van bekrachtiging blijft bij hoe de instrumentele
conditioneringsprocedure de activiteiten van het organisme beperkt
o Dus in de verklaring van ‘wat iets tot bekrachtiger maakt’ vindt er een verschuiving
plaats van factoren gelegen buiten de operante contingentie naar factoren die intrinsiek
verbonden zijn aan de operante contingentie zelf
 Net zoals het Premack principe biedt de respons deprivatie hypothese enkel antwoord op de
Hoe vraag
9.5 de gedragsregulatie benadering
 Veel gelijkenissen met de respons deprivatie hypothese
o Bekrachtigers niet zien als prikkels, maar als responsen / activiteiten
o Geen speciale soort activiteiten, maar elke soort activiteit die ingeperkt is onder de
baseline frequentie kan als bekrachtiger fungeren
 Wil ook een antwoord geven op de HOE vraag
o Maakt gebruik van het begrip homeostase en breid het uit tot respons keuze
o Gedragsmatige homeostase in analoog aan psychologische homeostase
 Zijn beide gericht op het behouden van een optimale toestand van een systeem
 Bij afwijking van de optimale toestand worden processen geactiveerd die een
terugkeer naar de optimale toestand moeten bewerkstelligen
9.5.1 het gedragsmatige bliss point
 = distributie van gedrag over verschillende respons alternatieven in de afwezigheid van
eender welke restrictie
o Bliss= opperste vreugde, extase
53
o Wat iemand zou doen op een dag indien hij zonder enige beperking van welke aard ook
zou kunnen doen waar hij zin in heeft
o De geprefereerde respons keuze voordat een instrumentele conditionering procedure
opgelegd is
9.5.2 instrumentele contingentie opleggen
 De realiteit staat haaks op het gedragsmatige bliss point
 Instrumentele contingenties leggen restricties op op de beschikbaarheid van verschillende
respons alternatieven
 Instrumentele contingenties maken verschillende respons alternatieven conditioneel op,
afhankelijk van elkaar
o ‘schedule line’: afhankelijke relatie tussen twee alternatieve gedragingen, welke het
gedragsmatige bliss point niet kruist
o Zie schematische voorstelling blz. 147
 Dit veroorzaakt afwijking van het gedragsmatig bliss point. Het zal een aanpassingsproces
activeren die gericht is op de terugkeer naar de optimale toestand
o Aanpassingsproces: verschuivingen in de distributie tijd/ activiteit die besteed wordt aan
verschillende respons alternatieven
o Gericht op het zo dicht mogelijk benaderen van het gedragsmatige bliss point
o Vaak is er slecht een benadering van het bliss point mogelijk, nooit echt een bereiken
van de optimale toestand
9.5.3 reageren op schema beperkingen
 Afhankelijk van de (relatieve) kosten en vaten die verbonden zijn aan de verschillende
mogelijke verschuivingen in distributie
o Bv. als schoolwerk maken erg vervelend is, zal ze niet meer schoolwerk doen, en minder
muziek beluisteren
o Als muziek erg belangrijk is, en schoolwerk niet echt aversief, zal ze meer schoolwerk
doen en zo ook meer muziek kunnen luisteren
 Afhankelijk van de aan-/afwezigheid van substituten voor ingeperkte activiteit
o Bv. als muziek beluisteren onvervangbaar is, zal ze meer schoolwerk doen
o Als tv kijken een goed substituut is voor muziek, zal ze niet meer schoolwerk maken,
minder muziek beluisteren en meer tv kijken
o ! men moet zeer voorzichtig de toegankelijkheid van substituten beoordelen wanneer
men een applicatie van instrumentele conditioneringsprincipes ontwerpt
o Het is belangrijk om de volledige rang van activiteiten van het individu te controleren
wanneer een instrumentele conditioneringsprocedure opgelegd wordt om een
gewenste verandering in gedrag te bekomen
9.5.4 bijdragen van gedragsregulatie
 Gedragsmatige regulatie benadering heeft onze begrijpen van instrumenteel gedrag
bevorderd omdat het denken over instrumentele conditionering en bekrachtiging
aangemoedigd heeft binnen de context van het totale gedragsmatige repertoire van de
participant
 Instrumentele conditioneringsprocedures treden niet op in een gedragsmatig vacuüm, ze
verstoren de vrije doorgang van gedrag
 Focust de aandacht op het feit dat beperkingen op respons keuze niet enkel effecten kan
hebben op instrumentele en bekrachtigende responsen. Kan ook resulteren in veranderingen
aan gerelateerde responsen welke niet onmiddellijk deel uit maken van de instrumentele
procedure
 Moedigt aan om te denken over instrumenteel gedrag van een breder perspectief
54
10. Extinctie van geconditioneerd gedrag
Inleiding
 Extinctie gaat om het weglaten van de bekrachtiger of ongeconditioneerde stimulus
 In klassieke conditionering: herhaalde presentaties van geconditioneerde stimulus zonder US
 Instrumentele conditionering: de bekrachtiger niet meer aanbieden als een consequentie van
de instrumentele respons
 Resultaat: afname van conditionele respons
 Geen spiegelbeeld van acquisitie
 Extinctie ≠vergeten
o Vergeten resulteert uit het verloop van de tijd
o Extinctie treedt op als gevolg van herhaalde presentatie van CS alleen of door herhaalde
gevallen van de instrumentele respons zelf
10.1effecten van extinctie procedures
 Bv. thuis komen en sleutel werkt niet meer in het slot
o Na S(RO) krijg je S(R/)
 Twee soorten effecten
o Primair gedragsmatig effect van extinctie:
 Eerst R een tijdje blijven herhalen
 Dan afname/ verdwijnen van R
 Toename in de variabiliteit van R
o Emotioneel effect
 Frustratie/ agressie
10.2 extinctie en het oorspronkelijk geleerde
 Voornamelijk binnen het Pavloviaans leren zijn er duidelijke aanwijzingen dat de
extinctieprocedure de voordien geleerde VP-OP associatie niet uitwist
10.2.1 spontaan herstel
 Eén van de kenmerkende eigenschappen van extinctie is dat het verdwijnt met de tijd
 Het louter verstrijken van de tijd zorgt vaak voor een terugkeer van de voordien uitgedoofde
geconditioneerde responsen
o Acquisitie gevolgd door extinctie gevolg door periode van rust
o Terugkeer is vaak partieel
o De respons na een rust periode is hoger dan het was op het einde van de eerste reeks
extinctie trials
 Dit effect vinden we terug bij zowel klassieke als bij operante conditionering
 Te vergelijken met “spontaan herstel” na habituatie
 Dit effect toont aan dat de oorspronkelijke associatie niet uitgewist wordt
 Dit is één van de redenen waarom slechte gewoonten kunnen terugkeren na een poging om
ze uit te wissen
10.2.2 renewal van originele exitatorische conditionering
 Bouten e.a
 Verwijst naar het herstel van VR wanneer de contextuele cues die aanwezig waren tijdens
extinctie veranderd zijn
 ABA renewal
o Acquisitie wordt in context A gegeven, extinctie in context B
o In de test wordt terug gekeerd naar de acquisitie context
o Resultaat: R was hersteld na terugkeer naar de acquisitie conditie
 ABC renewal
55




o Acquisitie wordt in context A gegeven, extinctie in context B
o De test wordt in een nog andere context C gegeven (neutrale context)
AAB renewal
o Extinctie en acquisitie worden in dezelfde context A gegeven
o De test vind plaats in een nieuwe, neutrale context
Renewal effecten treden op omdat het geheugen specifiek is voor cues die aanwezig waren
tijdens de extinctie fase
Implicaties
o Extinctie effecten zijn specifiek
o Extinctie effect impliceert niet dat de associatie verleerd is
o Assymetrie: acquisitie generaliseert goed naar nieuwe contexten, extinctie niet
o Hypothese bouton: extinctie is een functie van de context- gecontroleerde inhibitorische
VP-OP associatie
Bouton
o In de acquisitie fase wordt een exitatorische associatie aangeleerd tussen CS en US
 VP is eenduidig en voorspelt OP
o Tijdens extinctie wordt een inhibitorische associatie aangeleerd
 VP heeft twee betekenissen: voorspelt zowel de aanwezigheid als de afwezigheid
van OP
o Een prikkel die zowel acquisitie als extinctie heeft gekend is ambigu
 Op deze ambiguïteit op te lossen wordt gebruik gemaakt van de context
 Acquisitie: VP voorspelt OP
 Extinctie: VP voorspelt OP, maar niet in context X
 extinctie leren is specifieker dan acquisitie leren
 Belangrijke implicaties voor gedragstherapie :
o exposure behandeling: in therapie kan angst overwonnen zijn, maar buiten therapie
terugkeer
o Problemen die gecreëerd werden door conditionering lijken meer verspreid te zijn dan
de oplossingen voor deze problemen
 Experiment
o Acquisitie fase: angst ontwikkelen voor gezichten (gezichtshock)
o Extinctie fase: gezichten aanbieden zonder shock
o Test fase: angst meten bij CS
 Bij AAA is er geen terugkeer van verwachting
 Bij ABA is er een terugkeer van verwachting
o De CR neemt toe na een switch in de context
 ABA>ABC>AAB
10.2.3 reinstatement van geconditioneerde bekrachtiging
 Terugkeer van VR door post extinctie ervaringen met de OP alleen
 Procedure
o Acquisitie in context A (CSUS)
o Extinctie in context A (CS/)
o US ongesignaleerd alleen aanbieden (US)
o Terug CS aanbieden (CS)
56
 Cruciaal dat de test plaatsvindt in dezelfde context waarin de reinstating OP
ervaren werd
 Als de US in de test kwalitatief verschilt maar emotioneel gelijk is aan de US in
acquisitie, kan het zelfde effect bekomen worden
o Resultaat: enorme terugkeer naar geconditioneerde respons
 Experiment
o Acquisitie fase: cirkelshock
o Extinctie fase: cirkels aanbieden zonder shock
o Fase 3: onvoorspelbare US aanbiedingen
o Test fase:
o Resultaten:
 Toename van geconditioneerde angstrespons na het aanbieden van een
onvoorspelbare US
 Men is wel angstig voor CS+, niet voor CS- (dit komt doordat CS+ ambigu is)
10.2.4 gevoeligheid aan post extinctie OP/bekrachtiger devaluatie
 Uitgangspunt: proefopstelling waarbij postconditionerings- OP devaluatie effect aantoonbaar
is
o Fase 1: CSUS+
o Fase 2: US-: betekenis US veranderen in afwezigheid CS
o Fase 3: reactie op CS nagaan
 Als extinctie een intacte CS-US associatie overlaat, dan zal US devaluatie de reactie op een
uitgewiste CS verstoren net zoals het de reactie op een CS die niet uitgewist was verstoort
 Probleem: na extinctie is er geen observeerbaar gedrag meer
o Oplossing: er is terug een hoge VR door de associatie van VP met een andere OP
 Resocorla:
o appetitieve conditionering ratten
 VP1-OP1 (lichtvoedsel)
 VP2-OP2 (toonsucrose)
 VR= magazine behavior
o Extinctie van VP1 en vP2 in de extinctie groep (niet in controle groep)
 Uitdoving tot gedrag helemaal niet meer getoond wordt
o Training met nieuwe OP3
 VP1-OP3 (licht – polycoce)
 VP2-OPR (toon-polycose)
o OP1-devaluatie
 Voedsel-LICL
o Test: VP1? VP2?
o Resultaat:
 Het algemene niveau van CR ligt lager in de extinctiegroep dan in de controle groep
 In beide groepen is er een even sterke gevoeligheid aan OP devaluatie
 Het post extinctie revaluatie effect is even groot als het post acquisitie revaluatie
effect
 extinctie laat de associatie intact
o Kritiek: geconditioneerde stimulus bleef gevoelig voor devaluatie van zijn geassocieerde
US omdat er te weinig extinctie trials uitgevoerd werden
 Gelijkaardig experiment met operante R-O associatie
o R1-O1 en R2-O2 training
o Extinctie van R1 en R2 (niet in controle groep)
o R1-O3 en R2-O3 training
o Devaluatie O1
57
o Test: R1 is kleiner dan R2 ook zo in controlegroep
 R-O associaties zijn relatief ongevoelig voor modificatie eens ze getraind zijn
10.3 wat wordt er geleerd in extinctie
10.3.1 Inhibitorische S-R associaties
 Onderzoekers kwamen tot de conclusie tan niet bekrachtiging produceren een inhibitorische
S-R associatie
o Het niet bekrachtigen van een respons in de aanwezigheid van een specifieke stimulus
produceert een inhibitorische S-R associatie welke dient om de respons te onderdrukken
als S aanwezig is
o Deze hypo voorspelt dat de effecten van extinctie hoog specifiek zijn voor de context
waarin de respons uitgewist werd
 Extinctie gaat over een specifiek type van niet bekrachtigen, namelijk niet bekrachtigen na
een geschiedenis van bekrachtigen
o Niet bekrachtigen zonder deze voorgeschiedenis is geen extinctie maar eerder
habituatie
 Extinctie gaat gepaard met gedragsmatige en emotionele effecten
o Frustratie wordt uitgelokt wanneer een verwachte bekrachtiger uitblijft
o Men verwacht dat het uitblijven van een bekrachtiger in het licht van de verwachting
van een beloning ene ongeconditioneerde aversieve frustratie reactie uitlokt
 Dit dient om het reageren te ontmoedigen tijden de extinctie door de oprichting
van een inhibitorische S-R associatie
 Experiment
o Fase 1: discriminatie training
 Bepaalde respons (Rc) leidt tot voedsel in de aanwezigheid van licht (L) of toon (N)
 Doel: bij beide discriminatieve stimuli de verwachting van voedsel installeren zodat
tijdens de extinctie fase frustratie opgewekt kan worden
o Fase 2: nieuwe respons leren in afwezigheid van discriminatieve stimuli
 Hendeldrukken (R1)voedsel
 Touw trekken (R2)voedsel
 Doel: de target responsen voor de extinctie fase installeren zonder dat S-R leren
met betrekking tot L en N een rol kan spelen bij acquisitie
o Extinctiefase
 Presentaties van L en N met R1 en R2
 Bij N zal R1 niet leiden tot beloning
 Bij L zal R2 niet leiden tot beloning
 Doel: nagaan of er tijdens extinctie ene inhibitorische S-R associatie onstaat tussen
(N-R1) en (L-R2)
o Test fase
 L aanbieden en dier kan kiezen tussen R1 of R2 uitbrengen
 Als inhibitorische associatie zal R1 minder frequent uitgevoerd worden dan R2
 N aanbieden en dier kan kiezen tussen R1 of R2 uitbrengen
 Als inhibitorische associatie zal R2 minder frequent uitgevoerd worden dan R1
o Resultaten
 ITI= basislijn
 De stimuli welke extinctie ondergingen: (uitbrengen van de respons bij de prikkel
waarbij uitgedoofd werd): aantal R2 bij L en aantal R1 bij N
 Stimuli die geen extinctie ondergingen: aantal R2 bij N en aantal R1 bij L
 De reacties bij extinctie waren duidelijk lager dan die zonder extinctie
58
 Deze resultaten duiden aan dat de extinctie procedure een inhibitorische S-R
associatie tot stand bracht elke specifiek was voor een bepaalde stimulus en
respons
10.4 paradoxale beloningseffecten
 Algemeen idee: als extinctie veroorzaakt wordt door het frustrerende effect van de
afwezigheid van de verwachte bekrachtiging, zou men des te sneller extinctie bekomen
naargelang tijdens acquisitie een grotere/ sterkere verwachting van de bekrachtiging
gecreëerd werd
10. 4.1 overtraining extinctie effecten
 Effect van extensieve bekrachtigde training gevolgd door extinctie
 Hoe meer training (acquisitie) met bekrachtiger, hoe sterker de verwachting voor een
beloning gecreëerd wordt
o Overtraining: bij het bereiken van plafond toch verder aanbieden
o Controle groep: bereiken ook criterium maar geen voertraining
 De frustratie effecten zullen groter zijn
 De daling in respons in extinctie is te wijten aan frustratie effect. Daardoor zal een meer
extensieve training een snellere extinctie veroorzaken
 Paradoxaal: minder responsen in extinctie na een meer extensieve training (dus de respons
is niet in meerdere mate bestand tegen extinctie)
10.4.2 omvang van bekrachtiging extinctie effecten
 Respons neemt sneller af in extinctie wanneer een sterkere bekrachtiger gebruikt werd,
zeker wanneer training een continue bekrachtiging inhoudt
 Meer frustratie wanneer men een grote beloning verwachtte dan wanneer men een kleine
beloning verwachtte
10.4.3 partiële bekrachtiging extinctie effecten
 Dit effect is het meest extensief onderzocht
 Een sleutel begrip welke de kracht van zowel de emotionele als de gedragsmatige effecten
van extinctie bepaald is het schema van bekrachtiging dat voor extinctie geïntroduceerd
wordt
 Het dominante schema kenmerk welke extinctie beïnvloed is continue bekrachtiging vs.
partiële/ onderbroken bekrachtiging
o Bevinding: extinctie is trager en betreft minder frustratie reacties als er gebruik gemaakt
werd van gedeeltelijke bekrachtiging in plaats van continue bekrachtiging
 Bv. bij FR5 heb je trager extinctie dan bij FR1 (hoe frequenter bekrachtiging, hoe sneller
extinctie
10.4.4 mechanismen van partiële bekrachtiger extinctie effecten
 Discriminatie hypothese: na een continue bekrachtiging is het veel eenvoudiger om de
overgang van de bekrachtigde fase naar extinctiefase te detecteren dan na partiële
bekrachtiging
o Discriminatie tussen beide fasen is eenvoudige
o Maar de hypo klopt niet : EXP
 Fase 1
 Groep 1: partiële bekrachtiging
 Groep 2: continue bekrachtiging
 Fase 2
 Continue bekrachtiging voor beide groepen voordat extinctie wordt uitgevoerd
59
 Als er sprake is van discriminatie zouden beide groepen even snel extinctie
moeten vertonen
 Fase 3: resultaat van extinctie
 Bij partiële bekrachtiging daalt de respons trager dan bij continue
bekrachtiging
 Het lijkt dus dat subjecten iets lang durend leren van de partiële bekrachtiging
wat overgedragen wordt door de fase van continue bekrachtiging
 Discrimineerbaarheid blijkt dus niet cruciaal te zijn
o Ondanks een episode van continue bekrachtiging krijg je tragere extinctie
o Tijdens de partiële bekrachtigingsfase leerde men om niet op te geven bij een
mislukking, deze aangeleerde volharding overleeft de episode van continue
bekrachtiging
o Hoe zorgt partiële bekrachtiging ervoor dat een stop in de bekrachtiging niet nefast
hoeft te zijn? twee alternatieven welke complementair zijn
 Frustratietheorie
 Sequentiële theorie
 Frustratietheorie
o Gebaseerd op wat subjecten leren over de emotionele effecten van niet beloond te
worden tijdens partiële bekrachtigingsfase
o Leren gebeurt in verschillende stadia bij partiële bekrachtiging
 Initieel krijg je bij partiële bekrachtiging tegenstrijdige verwachtingen wat leidt tot
een responsconflict (de ene keer wel bekrachtiging, de andere keer niet)
 Soms verwacht je geen beloning bij het uitbrengen van de respons, maar krijg je er
toch één (beloning is niet voorspelbaar)subject leert het gedrag te stellen
ondanks dat ze verwachten geen beloning te zullen hebben
 Zo wordt het conflict opgelost: altijd een respons stellen. Wat leidt tot een trage
extinctie
o Bij een continue bekrachtiging is het onmogelijk om te leren dat het nuttig is om gedrag
te blijven stellen
 Sequentiële theorie
o Gebaseerd op wat subjecten leren over geheugen over niet beloond worden
o Aanname 1: subjecten herinneren of ze al dan niet bekrachtigd werden voor het
uitbrengen van de instrumentele respons in het recente verleden
 ze herinneren zich zowel trials met bekrachtiging als zonder bekrachtiging
o Aanname 2: tijdens partiële bekrachtigingstraining wordt de herinnering aan de nietbekrachtigde trials een cue op de operante respons uit te brengen
 Dit produceert volharding tegen extinctie
 Hoe dit precies gebeurt hangt grotendeels af van de sequentie van de beloonde en
onbeloonde trials welke toegediend waren in het partiële bekrachtigingsschema
o Bv. RNNRRNR
 Met R: bekrachtiging en N: geen bekrachtiging
 4e trial is cruciaal: bekrachtigd worden na twee keer niet beloond te worden
 Subject herinnert zich de voorbij 2 trials
 Herinnering aan NN wordt een cue om de respons uit te brengen
 Laatste trial cruciaal:
 Herinnering aan N wordt cue om respons uit te brengen
o Algemene regel: als op de vorige trials geen bekrachtiging verkregen is, dan gaat men
respons uitbrengen  biedt weerstand tegen extinctie
60
Extra: context en conditionering
1. Inleidende gevalsstudie: Lucy
 Fictieve beschrijving van een klinische case van paniekstoornis
o Eerste paniekaanval in auto terwijl ze onderweg was naar sterfbed grootmoeder
o Nu heeft ze herhaaldelijk paniek aanvallen welke in ernst en frequentie toenemen
 Klinische beeld van paniekstoornis bevat twee unieke aversieve emotionele fenomenen: vrees/
paniek en angst
o Bv. eerst vrees voor de paniekaanvallen, daarna angst dat er een paniekaanval zou kunnen
komen
 Vanuit pavloviaans leren zijn onvoorspelbare stressoren gekend voor hun mogelijkheid om een
conditioneringen aan contextuele kenmerken te installeren
2. angst versus vrees: een klinisch onderscheid
 Vanuit een evolutionair perspectief zijn vrees en angst adaptieve (automatische, aangeboren) en
noodzakelijke functionele gedragssystemen die overleving van een organisme bevorderen in
schadelijke of bedreigende situaties
o Deze adaptieve verdedigingstoestanden kunnen nefast worden wanneer ze
 Te vaak optreden
 Optreden buiten iemands controle om
 Significante disstress veroorzaken welke interfereert met het dagelijkse leven
 Vanuit een klinisch perspectief is het algemeen aanvaard dat vrees en angst unieke aversieve
emotionele toestanden zijn welke verschillende aspecten van angststoornissen representeren
o Vrees:
 Een fasische respons uitgelokt door de blootstelling aan of anticipatie met een
aversieve, goed gedefinieerde en onmiddellijk bedreigende stimulus
 Het subjectieve gevoel van intense vrees wordt typisch vergezeld met
 Een sterke automatische arousal
 Sterke tendens tot vermijdingsgedrag
o Angst
 Meer aanhoudende, toekomst georiënteerde, en algemene vorm van disstress in de
afwezigheid van een objectieve bron van gevaar
 Geassocieerd met de ongeruste anticipatie van opkomende potentieel gevaar en volgt
een meer persistente weg
 Gegeneraliseerde angststoornis: prototypische angst pathologie
 Paniekstoornis
 Bestaat zowel uit vrees als angst
 Paniek aanval: een plotse ervaring van intense vrees/ onbehagen welke gepaard
gaat met een aantal fysische en mentale symptomen
 Daarnaast is er een substantiële en aanhoudend niveau van angst, zorgen maken
en spanning, veroorzaakt door de anticipatie op mogelijk terug optreden van
onvoorspelbare paniek aanvallen en hun potentiële desastreuze consequenties
 Post traumatische stress stoornis
 Ontwikkelt na de blootstelling met een hoge fysisch of psychologisch
traumatische gebeurtenis
 Ontwikkelen symptomen van vrees voor discrete aanwijzingen welke als
herinnering fungeren aan de traumatische gebeurtenis
 Patiënten vertonen ook persistente symptomen van angst
 Obsessief compulsieve stoornis
 Terugkerende obsessies/ compulsies welke in grote mate interfereren met het
dagelijks functioneren
61
 Obsessies: terugkerende en aanhoudende ideeën, gedachten, impulsen en
impressies welke ervaren worden als opdringerig en ongepast (Angst)
 Compulsie: herhaaldelijke en rigide rituele/mentale acts met als doel om de
obsessieve gedachten te voorkomen/neutraliseren (vrees)
3. vrees conditionering als een model voor geactiveerde vrees
3.1 vrees conditioneringsprocedure
 Een initieel neutrale stimulus (CS) (bv. geometrische vorm) wordt herhaaldelijk aangeboden
met een aversieve outcome (US) (bv. elektrische shock)
 Na een aantal gepaarde presentaties wordt de CS en een betrouwbare voorspeller voor de US
en begint anticiperende vrees responsen uit te lokken (CR)
 Associaties worden gevormd tussen de mentale representaties van de CS en de US
 Door de herhaalde paring, verwerft de CS de mogelijkheid om de mentale representatie van de
US te activeren, wat zal resulteren in de productie van de CR door de presentatie van de CS
alleen
 De vorming van de associatie tussen US en CS wordt gezien als het sleutel mechanisme
onderliggend de oorsprong van vrees en fobieën
3.2 extinctie van verworven vrees
 Pavloviaanse extinctie procedures zijn sterk capabel in het reduceren van specifieke angst
leren
 Geconditioneerde vrees reacties zwakken/ verdwijnen na een herhaalde exposure aan de
vrees ontlokkende stimulus in de afwezigheid van de aversieve outcome
 Exposure= basiselement van de behandeling van fobie en angststoornissen
= de herhaalde confrontatie met het object van vrees
 Uitwissen van vrees
o Consolidatie: korte termijngeheugen opslaan in lange termijn geheugen
o Reconsolidatie: een adaptief update mechanisme waarbij nieuwe informatie
samengevoegd wordt met oude, volledige geconsolideerde herinneringen
o Na retrieval (= heractivatie) van vrees herinneringen worden deze herinneringen tijdelijk
vatbaar voor veranderingen
 Farmacologische blokkade van het reconsolidatie proces
 Medicijn (propranolol) op zicht zorgt niet voor een effect. Maar de daling in
angst is te wijten aan de combinatie van het medicijn samen met het terug
aanbieden van foto’s
 Het introduceren van nieuwe informatie tijdens het reconsolidatie venster
 Er is een bepaalde periode waarin goede exposure kan plaatsvinden
 Ook hier geldt dat het 10 minuten interval niet voldoende is, er is ook een
reminder van de spin nodig
3.3 herstel van verworven vrees
 CR kan herstellen door
o het verstrijken van de tijd
o na een verandering in context
o of volgend op een ongesignaleerde aversieve gebeurtenis
 Extinctie wist het voordien verworven vrees geheugen niet uit, maar brengt het leren van een
nieuwe, contextueel gecontroleerde veilig geheugen met zich mee, welke tijdelijk de voordien
verworven vrees geheugen onderdrukt
 Er is dus nood aan nieuwe methodes die de originele angst/vrees herinnering meer permanent
kunnen veranderen
o Retrieval cues
62
 Experiment
 Conditie 1 (ABA)
o CS+ en CS- aanbiedingen samen met een cue
o In extinctie fase de CS aanbieden zonder de cue en zonder de US
o In test fase CS en cue aanbieden
 Conditie 2 (ABA)
o CS+ en CS- aanbiedingen
o In extinctie fase de CS aanbieden met cue en zonder de US
o In test fase CS en cue aanbieden
 Resultaten: sterke renewal wanneer getest met een acquisitie retrieval cue dan
met een extinctie retrieval cue
o Extinctie in meerdere contexten
 Als je in meerdere contexten extinctie toepast heb je een grotere kans dat de
testcontext en de extinctiecontext gemeenschappelijke kenmerken hebben
4. onvoorspelbaarheid en context conditionering: een model van angst
 Angst wordt niet uitgelokt door discrete stimuli welke de aanwezigheid van een stressor
signaleren, maar wordt gekarakteriseerd door de afwezigheid van specifieke predictoren van
bedreiging
4.1 onvoorspelbaarheid van angst
 Voorspelbaarheid van bedreiging is inherent voor de oorsprong van specifieke vrezen en
fobieën
 Onvoorspelbaarheid = de afwezigheid van een objectieve voorspeller van gevaar
o Heeft centrale rol in de ontwikkeling en het behoud van een meer chronische
anticiperende angst respons
 Onvoorspelbaarheid is karakteristiek voor verschillende angststoornissen
4.2 empirisch onderzoek over onvoorspelbaarheid
 Onvoorspelbare aversieve gebeurtenissen zijn meer verstorend/ stressvol dan situaties waarin
de aversieve gebeurtenissen voorspelbaar zijn
 Labo studies met dieren
o Onvoorspelbare aversieve condities ontlokken meer negatieve somatische stress reacties
o Dieren geven voorkeur aan voorspelbare situaties ipv onvoorspelbare aversieve situaties
 Empirische studies met mensen
o Inconsistente resultaten
o Meerderheid van de studies rapporteren dat mensen meer chronische angst, fysische
arousal en verminderde performantie ervaren wanneer ze geconfronteerd worden met
onvoorspelbare stressors dan met voorspelbare stressors
o Mensen verkiezen over het algemeen voorspelbaarheid boven onvoorspelbaarheid
 In het algemeen is het vastgesteld dat onvoorspelbare aversieve gebeurtenissen zowel bij
dieren als bij mensen een variëteit van cognitieve, affectieve en somatische verstoringen kan
produceren welke dicht gerelateerd zijn een psychopathologische symptomen zoals
geobserveerd bij gegeneraliseerde/ chronische angst
4.3 veiligheidssignaal hypothese
 Selingman en Binik
 Een organisme kan makkelijk leren om gevaar of een bedreiging te voorspellen wanneer er
betrouwbare predictoren beschikbaar zijn.
 Tegelijkertijd leert het organisme dat de afwezigheid van het signaal de afwezigheid van
gevaar voorspelt
63
o Voorspelt een stress vrije periode waarin het organisme kan ontspannen en zich veilig
voelt
o Dit zal leiden tot een reductie van de totale hoeveelheid van aversiviteit geproduceerd
door de grotere episode/ experimentele context
 Wanneer er geen discrete signalen beschikbaar zijn om de bedreiging te voorspellen, kan het
organisme veiligheidssignalen niet identificeren en blijft het in een toestand van chronische
angst in deze context
4.4 context conditionering als een model voor angst
 Vrees
o Stimulus specifiek- discreet
o Directe bedreiging
o Prototypische pathologie: fobie
 Angst
o Niet stimulus specifiek- ongebonden
o Constant onbehagen/ stress/ spanning
o Prototypische pathologie: GAS
 Leren over predictors voor bedreiging is een goed model voor de oorzaak van specifieke vrezen
en fobieën
 Dit kan gemodelleerd worden door een geactiveerde vrees conditioneringsprocedure waarin
een aversieve US herhaaldelijk gepaard gaat met een discrete CS. Na herhaalde paringen zal de
CS een fasische CR ontlokken welke lijkt op vrees
 Vanuit associatief leer perspectief
o Contextuele stimuli kunnen
 Directe exitatorische kenmerken verwerven en contextuele vrees uitlokken
 Directe inhibitorische kenmerken verwerven
o RW: simultaan gepresenteerde stimuli concurreren voor de beschikbare associatieve
sterkte
 Stimulus competitie perspectief
 Stimulus welke de US het beste voorspelt zal het grootste deel van de beschikbare
associatieve sterkte verzamelen
 Uitdoving is te wijten aan het feit dat de associatieve sterkte van de CS afneemt
o De context zal de meeste associatieve sterkte verwerven in situaties waarin de US
onvoorspelbaar is
 De experimentele context is de enige gebeurtenissen welke systematisch samen
gepresenteerd word met de onvoorspelbare aversieve US
 Bestudering van contextconditionering verdient specifieke aandacht voor verschillende
redenen
o Context conditionering en stimulus conditionering verschillen in de manier waarin ze het
optreden van de aversieve gebeurtenis voorspellen
 Voorspelling op basis van stimulus is veel preciezer dan voorspelling op basis van
context
 Stimulus voorspelt dat US zal optreden
 Context voorspelt alleen dat het mogelijk is dat US optreedt
5.menselijk onderzoek op onvoorspelbaarheid, context conditionering en angst
5.1 laboratorium gebaseerde conditionering procedure om angst in mensen te bestuderen
 Grillon en Davis: innovatief shock conditioneringsprocedure
o Gebaseerd op startle reflex paradigma
 Vrees versterkende startle reflex
o Operationele en solide meting van vrees en angst in dieren en mensen
64
o Automatische respons po een hoog intensieve en indringende stimulus met een abrupt
begin (= startle probe)(bv. sterk geluid)
o Als de startle probe gegeven wordt in een neutrale context, dan zal er geen systematische
verandering zijn in de amplitude van de startle respons
o Wanneer de context voordien gepaard was aan een aversieve ongeconditioneerde
stimulus zal de amplitude van de startle reflex versterkt worden
o Startle probes kunnen zowel aangeboden worden in de aanwezigheid van discrete stimuli
als in de aanwezigheid van de experimentele context
 Experiment Grillon en Davis
o 2 sessies die identiek zijn
 Habituatie fase
 Pre- conditioneringsfase (om startle op de CS te boordelen)
 Conditioneringsfase (CS en US worden aangeboden)
 Gepaarde conditie: Discrete CS (neutrale visuele stimulus) werd aangeboden
met een aversieve shock (US)
 Ongepaarde conditie: De shock werd ongepaard aangeboden met de zelfde CS
(dus was temporeel onvoorspelbaar)
 Postconditioneringsfase (beoordelen van conditionering op CS in afwezigheid US
 In sessie 2 fungeert dit als een retentie test
 Startle versterkt door de specifieke cues was een index voor ‘cued vrees’
 basislijn van startle respons : Angst ontlokt door de experimentele context werd
bekomen door startle probes aan te bieden in afwezigheid van CS
o resultaten:
 gepaarde conditie
 startle respons was toegenomen in de aanwezigheid van een discrete stimulus
onmiddellijk na acquisitie training en na het retentie interval
 geen substantiële toename van de baseline respons
 ongepaarde conditie
 toegenomen baseline respons
o suggereert dat de contextuele stimuli die geassocieerd waren met het
experiment, werden ontlokker van chronische angst in mensen na een
administratie van onvoorspelbare shock aanbiedingen
 geen toegenomen startle respons voor de CS
5.2 context conditionering, associatief leren en online US- verwachting metingen
 onderzoek naar de ontwikkeling van cue- en context conditionering door online US
verwachtingen ratings toe te voegen naast de vrees toenemende startle metingen
 online US ratings laten onderzoekers toe om de graduele ontwikkeling van US-(CS/context)
contingentie leren op een trial bij trial basis te bestuderen
 in de afwezigheid van een betrouwbare voorspeller van bedreiging, verwerft de context
gradueel associatieve sterkte over de trials heen
 dit suggereert dat context conditionering gebaseerd is op een associatief leer proces
5.3 vrees en angst conditionering in angststoornissen
 de vrees / angst distinctie is herhaaldelijk bevestigd in laboratorium gebaseerd onderzoek bij
angstpatiënten
 verbeterde aanhoudende of contextuele angst is overvloedig aanwezig in individuen die lijden
aan een zekere vorm van angststoornissen zoals PTSS en PS
o patiënten vertonen angst om dreigend gevaar maar zijn oversensitief voor contextuele
informatie
65
o vertonen ook significant toegenomen baseline startle respons vergeleken met gezonde
personen
 mogelijke verklaring voor de toegenomen angst tijdens anticipatie van onvoorspelbare
predictor is dat de patiënten abnormaal sensitief zijn voor onvoorspelbaarheid
 kinderen waarvan de ouders een geschiedenis van angststoornissen hebben, kennen een
verhoogde magnitude van startle reflex
 individuen welke bewust waren van de CS-US contingentie vertonnen een toename van
basline startle respons bevestiging veiligheidssignaal hypothese
5.4 de neurobiologie van vrees vs. angst in (dieren en) mensen
 veel dier onderzoek verricht om inzicht te krijgen in de neurobiologische basis van vrees en
angst
 amygdala is betrokken in de acquisitie en expressie van vrees conditionering
 hippocampus is betrokken bij angst conditionering
 procedure
o zowel stimulus en context conditionering werden geïnstalleerd in ween within subject
design
o deelnemers worden geconditioneerd op een neutrale stimulus door herhaalde CS-US paren
aan te bieden in een voorspelbare context
o in een tweede onvoorspelbare context werd de context geïnstalleerd door US aanbiedingen
zonder CS
 vrees en angst zijn neurobiologische dissocieerbare aversieve toestanden
Extra: conditionering angstgenese
Inleiding
 klassieke conditioneringsvisie op het ontstaan van angst:
o neutrale stimulus wordt herhaaldelijk aangeboden met een aversief gevolg
o resultaat: de neutrale stimulus verwerft angst
o dit is een vrij blind proces:
 dergelijke associatie kan ontstaan tussen eender welke stimuli
 angsten en fobieën vinden plaats op eender welke random groep van objecten die
geassocieerd zijn met trauma
 4 kritieken op deze visie
o Hoe kan een angstreactie ontstaan zonder een directe traumatische ervaring meegemaakt
te hebben? (bv. ontwikkeling hondenfobie wnr je nog nooit gebeten bent)
o Een zelfde traumatische ervaring kan verschillende uitkomsten hebben (bv. hondenbeet
leidt niet altijd tot fobie)
o Waarom kan je niet voor elke stimuli even makkelijk een fobie ontwikkelen?
o Hoe kunnen interindividuele verschillen geplaats worden binnen de theorie?
1. Kritiek 1: geen rechtstreekse traumatische ervaring
 Naast directe conditionering blijkt er ook sociaal leren te zijn van angst
o Conditionering moet niet gaan over het instampen van een associatie tussen een stimulus
en iets aversief.
o Het gaat eerder om een proces van betekenisverwerving
 Kan verworven worden door observationeel leren en door leren via instructies
 Observationeel leren
o Exp. Cook e.a: apen worden bang van slangen na het observeren van de fobische reactie
van een andere aap
o Exp. Helsen e.a.
66
 Proefpersonen krijgen een filmpje te zien van iemand die meedoet aan een cold
pressure taak
 Wanneer deze een hand in een roze bak steekt, vertoont die persoon een
angstreactie
 Wanneer een hand in de gele bak gaat vertoont die persoon een neutrale reactie
 Wanneer de proefpersonen achteraf zelf hand in de bakjes moeten steken, valt op
dat ze angstiger zijn bij het roze bakje
 Leren via instructies
o Exp. Field e.a.:
 In een klasje worden 2 nieuwe stimuli (2 poppen aangeboden)
 De kinderen moeten aangeven hoe angstig ze zijn ( basislijn van angst)
 Daarna wordt een verhaal verteld over de knuffels
 Over knuffel 1 wordt een positief verhaal vertelt
 Over knuffel 2 wordt een negatief verhaal vertelt
 Achteraf terug een meting van angst
 Resultaat: angst voor knuffel 2 is hoger dan angst voor knuffel 1
 Zijsprong: signaal leren kan gebruikt worden voor extinctie of voor het selectief maken van
vrees
o Bv. exp. Boddez e.a
 Fase 1: training waarbij CS1 en CS2 gevolgd worden door dezelfde US
 Fase 2: proefpersonen krijgen de instructie dat CS1 gevaarlijk is
 Fase 3: meting van angst
 Resultaat: afname van angst voor CS2
 Als je identificeert wat de oorzaak is van het gevaar, dan gaan de andere prikkels
hun potentieel om angst uit te lokken verliezen
o Backward blocking procedure
 Fase 1: AB+/AC+ training
 Fase 2: proefpersonen krijgen te horen dat stimulus A de shock veroorzaakte tijdens
de training
 Resultaat: meer angst voor prikkel A dan voor prikkel B terwijl ze beiden even
informatief waren voor het voorspellen van shock
2. Kritiek 2: traumatische ervaring met verschillende uitkomsten
 Eenzelfde traumatische ervaring leidt de ene keer wel en de andere keer niet tot een
angstpathologie
 Mensen verschillen in levenservaringen
 We moeten hierbij niet enkel kijken naar de traumatische leerervaring op zich maar ook naar
o Ervaringen voor de traumatische gebeurtenissen
o Situationele kenmerken tijdens de traumatische gebeurtenis
o Ervaringen na de traumatische gebeurtenis
2.1 leerervaringen voor de traumatische ervaring
 Stress enhanced leren
o Exp. Rau e.a
 Controle groep: proefpersonen krijgen een milde shock in context B
 Experimentele groep: proefpersonen kregen eerst 15 shock aanbiedingen in context
A waarna een milde shock in context B
 In de experimentele groep wordt de milde shock in context B gevolgd door een
buitensporige angstreactie
o Welk proces zou hier aan de grondslag van kunnen liggen?
 Is er sprake van een generalisatie en summatie van de verschillende contexten?
67
 Zou de angst van conditie 1 gegeneraliseerd worden naar conditie B?
 Zou de angst in A optellen met de angst in B?
 NEEN: als we voordat we de milde shock in context B aanbieden, de angst voor
context A doen uitdoven, dan nog is er een buitensporige angst op te merken
 Is er door de aanbieding van 15 pijn shocken een verhoogde pijn reactiviteit?
 Als je al veel pijn gehad hebt, zal een nieuwe shock meer pijn doen
 NEEN: het gedrag van ratten vertoont geen verhoogde pijn reactiviteit
 Er is sprake van een sensitisatie effect waarbij men gevoeliger wordt voor de prikkels
 Het gaat dus om een niet associatief effect
o Implicatie voor post traumatische stress stoornis
 Na een zeer traumatische gebeurtenis kunnen milde trauma’s ook zeer hoge angst
opwekken
 Patiënten kennen een hogere gevoeligheid om ook voor andere stimuli fobieën te
ontwikkelen
 Latente inhibitie
o X- gevolg door X+: de voorafgaande X- training vertraagt de acquisitie
o Bv. kinderen die een aantal keer naar de tandarts gaan zonder dat ze daarbij pijn ervaren
zullen minder snel angst krijgen na een blootstelling van pijn bij tandarts
 Voorafgaande ervaringen kunnen dus kwetsbaar maken (stress enhanced leren) of
immuniseren (latente inhibitie)
2.2 situationele kenmerken tijdens de traumatische gebeurtenis
 Bv. exp. Meulders et a.e
o Marsmannetjes
o Als je op spatie drukt, schiet je op marsmannetjes en krijg je punten
o In de US alone conditie hebben marsmannetjes een schild. Als je dan schiet, verlies je
veel punten
o Conditie 1: door op andere knop te drukken kan je de invasie van marsmannetjes
beëindigen
o Conditie 2: geen controle over de invasie van marsmannetjes
o Resultaten: minder contextconditionering als je controle hebt over het beëindigen van
de US
 Exp. Sanderson e.a.
o Proefpersonen moeten CO2 inademen
o In beide condities wordt gezegd dat als er een lampje brand, ze de toevoer van CO2
kunnen toedraaien
 Conditie 1: lampje brandt altijd
 Conditie 2: lampje brandt nooit
o Resultaat: minder subjectieve angst wanneer je controle hebt
 Klinisch voorbeeld:
o Meisje 1 wordt gebeten door een hond maar kan de hond zelf van zich afduwen voor ze
ernstig gewond raakt
o Meisje 2 wordt gebeten door de hond maar kan de hond niet wegduwen
o Resultaat: het tweede meisje ontwikkeld een fobie voor honden, het eerste meisje niet
 Controle hebben over een traumatische gebeurtenis heeft een grote impact om hoe sterk
angst geconditioneerd is door de CS paring met het trauma
2.3 leerervaringen na de traumatische ervaring
 Exp. Rescorla: US inflatie
o Dieren krijgen eerst een toon-shock paring
o Daarna worden ze blootgesteld aan ongesignaleerde shocken
68
 Zelfde intensiteit
 Iets hogere intensiteit
 Veel hogere intensiteit
o Resultaat: dieren welke blootgesteld werden aan shocken met een hogere intensiteit
dan de originele toon-Shock paring vertoonden een toegenomen angst
 US hoeft zelf niet opnieuw aangeboden te worden
o Het is voldoende om (mondelinge) informatie te geven over de stimuli
o De mentale representatie van de US kan veranderen door info te geven over de US
o Bv. US-inflatie:
 pukkelpop: veel mensen zijn aan het drama ontsnapt zonder ernstige gevolgen.
Door achteraf de erge gebeurtenissen te horen, ontwikkelen ze meer angst
o Bv. US- devaluatie:
 behandeling van paniek: info geven dat paniekervaring niet levensbedreigend is
en de patiënten dat laten ervaren  vermindering in het potentieel van
paniekaanvallen (minder angst voor de stimuli)
 Exp. Joos e.a.
o Effecten van rumineren nagaan
o Acquisitie fase: CS1 en CS2 worden gekoppeld aan zelfde US (een luide schreeuw)
o Onmiddellijke rehaersal: vlak na acquisitie moet proefpersoon terug denken aan de
paring van CS1 met US
o Na een week volgt een tweede test
o Tijdens de week moet de proefpersoon terugdenken aan de associatie tussen CS1 en US
o Resultaat: tijdens de tweede rehearsal test is er een daling in de angst voor CS2 maar de
angst voor CS1 blijft hoog
o Verklaring
 US inflatie proces
 Door ruminatie begin je te catastroferen
 Als dit klopt zou je dezelfde angst moeten zien op beide CS’ en
 Dit is niet het geval, dus geen sprake van US inflatie
 Gaat om louter versterken van de associatie
3. Kritiek 3: verschillen tussen stimuli
 Als neutrale stimuli blind gepaard gaan met aversieve stimuli, waarom komen dan niet alle
fobieën even frequent voor en ontwikkelen voor sommige stimuli geen fobieën
3.1 niet equipotentionaliteit voor CS-US
 Equipotentionaliteits principe gaat ervan uit dat om het even welke CS-US associatie met het
zelfde gemak geleerd kan worden
o Gaat niet op!
 Exp. Garcia e.a.: smaak aversie leren
o CS bestaat uit een smaak of een audiovisuele stimulus
o De US bestaat uit misselijkheid of een shock
o De smaak-misselijkheid en de audiovisuele stimulus- shock kennen sterkste associatie
o Dus niet elke associatie wordt even gemakkelijk aangeleerd
3.2 angst relevante stimuli
 Öhman e.a.
o Evolutionaire theorie: evolutie zorgt ervoor dat we snel angst ontwikkelen voor stimuli
die een bedreiging vormen voor ons voortbestaan
o Het gaat niet om aangeboren fobieën maar wel om zeer snel aan te leren en moeilijk af
te leren fobieën
69
3.3 prikkelcompetitie
 Verschillende stimuli worden samen gepresenteerd met de aversieve stimuli: alleen voor
sommige van deze stimuli wordt er angst ontwikkeld
 Prikkelcompetitieprocedure: meerdere CS’ en gaan vooraf aan de US
 Bv. Blokking
o A+ training gevolgd door AB+
o De angst voor B blijft laag ondanks paring met US
 Klinisch: als je paniekaanvallen steeds vooraf gaan door interne stimuli en je dan een
paniekaanval krijgt in een winkel met deze interne stimuli. Dan ga je doorgaans geen vrees
ontwikkelen voor de winkel, maar wel voor de stimuli
4. Kritiek 4: interindividuele verschillen
 Er zijn een groot aantal interindividuele verschillen die niet erkent worden door de klassieke
conditioneringsvisie
 De psychologische interindividuele verschillen verklaren voor 41% angstresponsen
 De effecten van interindividuele verschillen zijn niet altijd aanwezig
o Er moet voldaan zijn aan bepaalde grensvoorwaarden opdat individuele verschillen een
impact hebben
 Wat is de rol van veiligheidsleren
o Angstpatiënten kunnen CS+ niet goed onderscheiden van CSo Ze kunnen veilige situaties dus niet goed onderscheiden van gevaarlijke situaties
 Conditionele inhibitie
o Chan en Lovibon
 A+ /AB-training
 Hoog angstige personen vertonen meer angst op AB-trials dan controle personen
 Dus ook in veilige situaties hebben ze angst
 Inhibitie van delay
o Gebruik maken van een erg lange CS (bv. toon) gevolgd door een US
o In het begin van het aanbieden van de trials zien we een angstrespons optreden
gedurende de volledige duur van de CS
o Na verloop van tijd leert het individu dat in het begin van de CS het nog veilig is, en krijg je
pas een verhoogde angst respons gedurende de laatste 5 seconden van de CS
o Sociale angststoornis
 Minder inhibition of delay: patiënten hebben angst tijdens ze een speech moeten
geven, maar ook lang voordien kennen ze al angst
 Kennen een hoge mate van trait worry: piekeren over aversieve gebeurtenissen die
zouden kunnen plaatsvinden
 Blokking
o Exp. Boddez e.a.
 A+/ AB+ studie
 Bij een hoge mate van trait angst vertoon je minder blokkering  het
veiligheidsleren is dus verstoort
 Generalisatie studie: Lissek e.a.
o Proefpersonen krijgen cirkels te zien van verschillende grootte
 CS-= kleine cirkel
 Cs+= grote cirkel
o Wat is de mate van generalisatie?
 Controle groep: bij de gegeneraliseerde stimuli (de cirkels tussen in) vindt een daling
plaats van de angstrespons
 Angstpatiënten vertonen meer generalisatie
70
 Gaat het wel om een goed model? De CS heeft bewezen dat hij gevaarlijk is, dus automatisch
wordt er angst voor ontwikkeldis dit dan wel een goed model voor angstpatiënten
5. nieuwe poging
 Hoe kan een bijgespijkerde theorie tegemoet komen aan de kritieken?
 We hebben ontdekt dat interindividuele verschillen een rol spelen maar welke mechanismen
liggen hierbij aan de grondslag?
 RW verklaart blocking met weinig ruimte voor individuele verschillen
o
o Een US moet verrassend zijn/ onverwacht zijn opdat het effectief is om leren te
produceren
o Nieuwigheid van de US hangt af van de associatieve waarde van al de stimuli die de US
voorafgaan op een gegeven trial
o Vorming van de associatie tussen A en US op AB+ trials is geblokkeerd, doordat de US niet
verrassend meer is gegeven de eerdere A+ trials
 Alternatief: cognitief stadia model
o Stimulus competitie in associatief leren kan verkregen worden, ongedaan worden of
beïnvloed worden door een variëteit van cognitieve processen welke kunnen spelen in 3
fasen in blokking
 Encoding fase: A+ / AB+ training
 Retentie fase
 Performantie fase (test fase)
o Het model claimt recht te doen aan de plasticiteit van stimulus competitie
o De processen komen ook aan bod in andere disciplines binnen de psychologie, maar door
ander woordgebruik viel dit niet op
o Evidentie gevonden voor een hele hoop cognitieve processen die een rol spelen bij
blokking
 Aandachtsregulatie (tijdens encoding)
 Aandacht afwenden van redundante stimuli (stimulus B)
 Mensen met hoge trekangst hebben minder aandachtscontrole
 Werkgeheugen
 Dual task condities: andere taak interfereert met blokking
 Hoge mate van trekangst, minder capaciteit van werkgeheugen
 redeneren
11. Straffen
Inleiding
 in een straf procedure wordt een aversieve gebeurtenis geleverd contingent op de
performantie van een instrumentele respons
 straf kan zeer effectief zijn in het onderdrukken van gedrag zolang ze correct toegepast wordt
 aversieve gedragscontrole
o positieve straf: positieve contingentie tussen de respons en een negatieve outcome
o negatieve straf: negatieve contingentie tussen respons en positieve outcome
 hier in eerste instantie focus op positieve straf
o verwachte effect: vermindering/ verdwijnen van de bestrafte operant
o effectiviteit: afhankelijk van een hele reeks factoren, vaak intuïtief niet zo vanzelfsprekend
 maatschappelijk/ ethisch/ pedagogisch controversieel
o straf is niet noodzakelijk lichamelijk pijnlijke prikkels
o veel vormen van straf: verbaal straffen/ beripsen, boetes, time- out, verlies privileges,
blaam,…
71
o onderscheid tussen toegediende en natuurlijke straf
Positieve (R-O) contingentie
Negatieve (R-O)
contingentie
Positieve, gewenste,
voordelige outcome
Positieve bekrachtiging
Negatieve, ongewenste,
schadelijke outcome
Positieve straf
Negatieve straf
Negatieve bekrachtiging
11.1effectieve en ineffectieve straf
11.1.1 wanneer straf faalt
 voorbeelden
o verkeer en verkeersboetes
o gevangeniswezen en recidive
o straf in pedagogische context
o…
 In al deze gevallen wordt straf uitgevoerd door een individu ipv dat het automatisch gebeurt
 Straf vindt plaats met tussenpozen
 Straf wordt uitgesteld
 Straf is initieel mild en neemt dan toe in ernst na herhaalde overtredingen
 Straf wordt vaak aangekondigd door een discriminatieve stimulus
11.1.2 wanneer straf werkt
 Voorbeelden
o Kachel aanraken, elektrische afsluiting van een weiland
o Omkiepen kajak bij te ver naar zijkant leunen
o…
 Straf vindt consistent plaats
 Straf vindt onmiddellijk plaats
 Vanaf de eerste overtreding is de straf intens
 Straf wordt niet aangekondigd
11.2 experimentele evidentie van straffen
11.2.1 Respons- outcome contingentie
 Straf betreft een positieve contingentie tussen de instrumentele respons en de outcome
(~positieve bekrachtiging)
 Fundamentele variabele in straf is de respons-outcome contingentie
 Hoe sterker de respons- outcome contingentie, hoe meer specifiek de respons supressie is
die geproduceerd wordt straf
 Straf is effectiever en specifieker naarmate P(O|R) >P(O| niet R)
 Effecten van de manipulatie van P(O&R) bij constant houding van P(O| niet R)
o Fase 1: acquisitie: keypeckvoedsel
o Fase 2: keypeckshock/voedsel (per conditie andere probabiliteiten)
o Resultaten:
 Straf leidt tot een daling van het uitbrengen van het gedrag
 Bij een volledige contingentie tussen het gedrag en de straf verdwijnt het gedrag
 Dus hoe meer straf, hoe beter vermindering gedrag
 Wat als P(straf | niet R) ≠0
o O| nietR: pavloviaanse vreesconditionering
 CER op context of specifieke prikkels
72
o Bij een lage R-O contingentie krijg je soms een algemene suppressie van het gedrag door
contextuele angst
o Is er dan nog een onderscheid tussen Respons onafhankelijke en respons afhankelijke
toediening van de aversieve stimulus? JA
 Rechtstreekste vergelijking respons-onderdrukking door respons- contingente straf
vs. pavloviaanse CER
 Hendeldrukken voedsel
 CS1 (visuele prikkel)+ hendelshock (om de 3 hendel drukken)
 CS2 (toon)+ hendelshock (onafhankelijk van hendeldrukken)
o Als er bv. op 20 en op 50 seconden een shock werd gegeven bij CS1, dan zal
dit ook op die tijdstippen gegeven worden bij CS2
o Hier is dus enkel contextconditionering mogelijk
 Resultaten
o In beide gevallen krijg je een onderdrukking van hendel drukken
o Bij contextconditionering is er minder onderdrukking
11.2.2 respons- outcome contiguïteit
 Belang van onmiddellijke straf
 Interval tussen de doelrespons en het aanbieden van de straf is van cruciaal belang
o In sommige omstandigheden veroorzaakt een gedrag automatisch een bepaalde
consequente aversieve prikkel
o In laboproeven/training/ therapeutische toepassingen is het de proefleider die bepaalt
of en wanneer een aversieve prikkel wordt toegediend
 Straf is het meest effectief als de aversieve stimulus gepresenteerd wordt zonder vertraging
na de doelrespons
 Bij uitgestelde bekrachtiging is de kans groot dat een ander gedrag dan het doelgedrag
bestraft gaat worden
11.2.3 intensiteit van de aversieve stimulus
 De respons suppressie effecten van straf zijn direct gerelateerd aan de intensiteit van
aversieve stimuli
 Lage intensiteit van straf produceert slecht milde suppressies van gedrag
 Dramatische suppressie van gedrag kan resulteren uit het gebruik van intense aversieve
stimuli
 De effecten van de intensiteit van straf hangt grotendeels af van de eerdere ervaringen met
straf
o In het algemeen reageren individuen op een nieuw niveau van straf op dezelfde manier
als hoe ze reageerde gedurende eerdere ontmoeting met straf
 Als er eerst een milde straf is aangeboden zal een sterke straf slecht geringe effecten hebben
in tegenstelling tot wanneer er direct een sterke straf gegeven wordt
 Als er eerst een zeer intense straf gegeven wordt en erna een milde straf, dan zullen de
effecten bij de milde straf veel groter zijn dan wanneer er onmiddellijk milde straf gegeven
wordt
11.2.4 gesignaleerde straf
 Discriminatieve straf: straf welke gesignaleerd wordt door een discriminatieve stimulus
 Algemene principes van prikkelcontrole op operant leren zijn ook geldig bij straf
 Discriminatieve straf procedures resulteren in discriminatieve suppressie van gedrag
 Discriminatieve controle van straf responsen kan problematisch zijn maar niet altijd
o Als je wil dat de respons altijd uitblijft, moet je zorgen dat ze niet gesignaleerd wordt
door een bepaalde prikkel
73
11.2.5 straf en mechanismen voor het behoud van de bestrafte respons
 Straffen worden toegepast op responsen die reeds voorkomen door een of andere reden
 Bestrafte responsen worden soms behouden door een vorm van positieve bekrachtiging
 De effecten van straf zijn afhankelijk van het type bekrachtiging en bekrachtigingsschema
welke de doelrespons steunt
o Je krijgt een kosten baten probleem
o Gedrag dat vaak/altijd bekrachtigd is, is minder gevoelig voor straf dan gedrag dat
slechts gedeeltelijk wordt bekrachtigd
o VI of FI schema’s: het algemene niveau van het gedrag daalt maar de temporele
distributie blijft behouden
o FR: post- reinforcement pauzes zullen langer duren, weinig effect op ratio run
11.2.6 straf en bekrachtiger van alternatief gedrag
 De effecten van het bestraffen van een bepaald gedrag hangt sterk af van het al dan niet
aanwezig zijn van een alternatief gedrag welke tot dezelfde outcome leidt
o Is er geen alternatief aanwezig, dan zal er relatief weinig effect zijn van straf
o Is er een alternatief aanwezig dan zal er een sterk effect zijn van straf
 Men heeft een alternatief, dus men bekomt zeker het gewenste gedrag, het heeft
geen nut meer om straf te blijven krijgen voor een bepaald gedrag
 Dus bekrachtiging van een alternatief gedrag zorgt voor een sterkere onderdrukking van het
bestrafte gedrag
 Zeker indien het alternatieve gedrag incompatibel is met het bestrafte gedrag
 Experiment mannelijke rokers
o Fase 1: hendel drukken R1 en R2 bekrachtigd met de aanbieding van een sigaret
o Fase 2: introductie van straf contingentie R1- aversief geluid, bovenop de bekrachtiging
contingentie
 Conditie 1: enkel R1 is beschikbaar
 Conditie 2: R1 en R2 zijn beschikbaar
o Resultaten
 Is er een alternatief aanwezig, dan verdwijnt het doelgedrag bij straf
 Is er geen alternatief aanwezig, dan krijg je een afzwakking van het gedrag maar de
respons rate is nog steeds relatief hoog
11.2.7 paradoxale effecten van straf
 Straf zal niet effectief zijn wanneer de bestrafte respons behouden wordt door een sterk
positief bekrachtigingsschema
o Het bestrafte gedrag zal juist meer uitgebracht worden
 Straf als een signaal voor een positieve bekrachtiging
o Bv. een kind dat gestraft wordt, krijgt ook aandacht
o Experiment
 Fase 1: keypecks worden bekrachtigd met voedsel
 Fase 2: indroductie van strafcontingentie, milde shock tot er een reductie is van de
respons rate tot 50%
 Fase 3: alternatie tussen 2 periodes, niet gesignaleerd
 Keypeckbekrachtiging voedsel en straf
 Keypeckgeen bekrachtiging en geen straf
 Resultaat: meer keypecking tijdens de straf dan tijdens de veilige periodes
 Straf werd een signaal voor de beschikbaarheid van een positieve bekrachtiging
 Straf van vermijdingsgedrag
74
o Vermijdingsgedrag dient om een aversieve stimulus te beëindigen (voorbeeld van
negatieve bekrachtiging)
o Negatieve bekrachtiger: een respons beëindigd een aversieve stimulus en doet daarbij
de probabiliteit van de respons toenemen
o Vermijdingsgedrag wordt uitgebracht in aanwezigheid van aversieve stimulus. Dit maakt
de aanwezigheid van de aversieve stimulus een discriminatieve cue voor het
vermijdingsgedrag
o Bv. een kooi met 2 delen. Het dier zit in 1 deel waar het shock’s krijgtmen springt
naar andere kant. Als dit gedrag ook bestraft wordt door shock zal het die het geleerde
gedrag (naar andere kant springen) toe passen
o Straf is inefficiënt bij ontsnappingsgedrag
11.3 kunnen en moeten we een samenleving creëren die vrij is van straf
 We kunnen geen straf vrije omgeving creëren
o Straf is een onoverkomelijke consequentie van verschillende aspecten van de fysische en
biologische omgeving
 Het soort straf dat het meest verwerpelijk is, is fysische pijn toegebracht door een persoon
met als doel het gedrag van iemand anders te controleren
 Als straf voortvloeit uit frustratie of woede, dan wordt het meestal niet gelinkt aan een
ongewilde respons
o Vaak niet systematisch gestraft
o Niet temporeel contigu op het ongewenste gedrag
o Frustratie straffen is meestal onder discriminatieve stimulus controle waarbij de SD
ongerelateerd is aan het bestrafte gedrag
o Is wordt zelden vergezeld van een positieve bekrachtiging van alternatief gedrag
o Straf als uiting van agressie of frustratie doet schade aan veel van de parameters van
effectieve straffen en daardoor produceert het geen constructieve veranderingen in
gedrag
11.4 Alternatieve voor straf
11.4.1 time- out
 Time out: tijdelijk ontzeggen van bronnen van positieve bekrachtiging, consequent op het
stellen van het gedrag
 De consequentie van een ongewild gedrag vertonen is heen fysisch aversieve gebeurtenis
maar een time-out van bronnen van positieve bekrachtiging
 De effectiviteit van deze procedure hangt af van het tijdsinterval tussen het doelgedrag en de
time out consequentie. En op hoe consequent het gehanteerd wordt
 Of een substantiële reductie in bekrachtiging ervaren wordt, hangt af van hoe veel
bekrachtiging op voorhand beschikbaar was vergeleken met de hoeveelheid bekrachtiging
die aanwezig is tijden de time-out
o Hoe meer bekrachtigers aanwezig voor time- out, hoe effectiever
o Hoe minder bekrachtigers aanwezig tijdens Time- out, hoe effectiever
11.4.2 differentiële bekrachtiging van ander gedrag
 Differentiële bekrachtigingsprocedure (DRO) betreft een negatieve contingentie tussen een
doelrespons en een bekrachtiger
 Negatieve straf: negatieve contingentie tussen doelrespons en positieve prikkel
o Hoe meer het gedrag gesteld wordt, hoe minder je de positieve prikkel krijgt
 DRO veronderstelt dat indien ongewenst gedrag niet wordt gesteld, de positieve prikkel wel
gegeven wordt
 Impliceert dat ander gedrag dan het ongewenste gedrag wel wordt bekrachtigd
75
 En impliceert dat indien ongewenst gedrag achterwege blijft, de positieve prikkel blijvend
gegeven moet worden
11.5 Theorieën over straf
 CER theorie van straf (Estes)
o Pavloviaanse vreesconditionering van (contextuele) prikkels die bestrafte R voorafgaan 
freezing/ suppressie  niet compatibel met R onderdrukking R
o Bv. onzichtbare elektrische afsluiting (halsband hond)
o Conform effecten intensiteit straf
o Conform effecten respons- contingent vs. niet respons- contingent toedienen van straf
 Bij respons contingentie toediening: prikkels die CER uitlokken hebben meer kans om
nauw verbonden te zijn met R en dus krijg je suppressie van R
 Vermijdingstheorie van straf (dinsmoor)
o Vertrekt van CER assumptie: aversieve klassieke conditioneringsprikkels die bestrafte R
voorafgaan
o Organisme leert te ontsnappen aan deze vrees ontlokkende prikkels door alternatief
gedrag te stellen dat niet compatibel is met het bestrafte gedrag
o Het organisme leert deze prikkels te vermijden
o Het effect van de straf is niet het afzwakken van het bestrafte gedrag maar het versterken
van het alternatieve, niet compatibele ontsnappings-/vermijdingsgedrag
o Problemen: post hoc karakter, wat zijn ‘vrees ontlokkende prikkels’, wat zijn de
‘alternatieve , niet compatibele responsen’ precies?
12. Vermijdingsleren
Inleiding
 In straf procedures leidt de performantie van de instrumentele respons tot de presentatie van
een aversieve stimulus
 In vermijdingsleren voorkomt/ blokkeert de performantie van de instrumentele respons de
representatie van het aversieve gebeuren
o Dus de motivatie is een aversieve stimulus
o De contingentie tussen instrumentele respons en de motivationele stimulus is negatief
o Het stellen van de vermijdingsrespons zorgt ervoor dat de negatieve outcome niet optreedt
 Voorbeelden
o Leuning van trap vasthouden niet vallen
o Afremmen met autogeen aanrijding
o Jas aantrekkenniet ziek worden/ geen kou hebben
o …
 Klinisch voorbeeld: smetvrees
o Schrik voor bacillen
o Handen wassenvorkomen van ziekte
o Respons geen US / geen respons US
12.1 Belangrijkste vragen in de analyse van vermijdingsleren
 Wat bekrachtigt een vermijdingsrespons?
o Vermijdingsgedrag wordt gevolgd door het uitblijven van een aversieve prikkel
o Hoe kan ‘niets’ een gedrag bekrachtigen en leren produceren
o De grootste verklaringen verwerpen het idee dat vermijdingsresponsen optreden omdat ze
het optreden van de aversieve stimulus voorkomen
 Op welke manier zijn pavloviaanse processen betrokken bij vermijdingsleren
o Historisch wordt vermijdingsleren beschouwt als een speciale vorm van pavloviaans leren
o Nu is dit ontkrachtigd
76
o Maar de meeste theorieën erkennen nog steeds een belangrijke rol van Pavloviaanse
conditionering
12.2 oorsprong van de studie van vermijdingsleren
 Bechterev
 Procedure
o Mensen moeten vinger op metalen elektrode plaatsen
o Een milde shock wordt toegediend via de plaatproefpersoon heft vinger op
o Na een tijdje wordt de shock voorafgegaan door een toon
o Resultaat: de proefpersonen heffen hun vinger op bij het horen van de toon
 In eerste instantie beschouwt hij dit als pavloviaanse conditionering
 Later bleek het eerder om instrumentele conditionering dan op pavloviaanse conditionering te
gaan
o De pavloviaanse contingentie wordt doorbroken door het opheffen van de vinger (terwijl
dit juist zou moeten optreden onafhankelijk van het gedrag
o Deelnemers hebben controle over de presentatie van de ongeconditioneerde stimulus
12.3 hedendaagse procedures van vermijdingsleren
12.3.1 gediscrimineerde/gesignaleerde vermijding
 De contingentie tussen bekrachtiging en contingentie is niet altijd in werking
o Negatieve bekrachtigingscontingentie onder stimulus controle
o Enkel bij de aanbieding van CS geldt dat R geen US
 Respons uitbrengen verhinderd de aanbieding van de bekrachtiger niet enkel tijdens discrete
periodes/ trials wanner een CS of waarschuwingssignaal aanwezig is
 Het uitbrengen van respons is enkel effectief in het voorkomen van de aversieve stimulus
wanneer de respons optreedt tijdens de trial periode, wanneer het waarschuwingssignaal
aanwezig is
 Wat er gebeurt hangt af van het gedrag van de deelnemer
o Shuttle box met twee delen.
o Proefdier wordt in één deel van de kooi geplaatst
o Toon voetshock
o Als het proefdier tijdens de CS (toon) naar de andere kant loopt, dan stopt de CS en treedt
US niet op
o Actieve vermijding: proefdier loopt naar andere kant voor einde CS
o Ontsnappingsgedag: proefdier loopt naar andere kant tijdens aanbieding US
 One way avoidance:
o Proefdier wordt altijd aan zelfde kant geplaatst
o De vermijdingsrespons houdt altijd in dat je naar de zelfde kant moet gaan
o De kant waar proefdier start is altijd potentieel gevaarlijk
o De andere kant is altijd veilig
o Redelijk eenvoudig aan te leren
 Two way avoidance
o Trials kunnen zowel links als rechts starten
o Het dier moet altijd naar de andere kant lopen om veilig te zijn
o Beide kanten van de box zijn potentieel gevaarlijk
o Moeilijker te leren
12.3.2 niet gesignaleerde of vrij opperante vermijdingsprocedure
 Sidman
 Trials zijn niet beperkt tot perioden waarin een discrete stimulus aanwezig is
 Het proefdier kan de instrumentele respons op eender welk moment uitbrengen
77
 Er wordt geen expliciet waarschuwingssignaal gebruikt en er zijn geen discrete trials
o Vermijdingsrespons kan op eender welk moment uitgevoerd worden en levert altijd een
voordeel op
 Procedure
o Een milde shock wordt geprogrammeerd zodanig dat het telkens optreedt na een bepaald
interval (bv. om de 15 seconden een shock)
o S-S interval (Shock- Shock interval): tijd tussen optreden van twee shocks zonder
vermijdingsgedrag
o Performantie van vermijdingsgedrag creëert een periode van veiligheid waarin geen shocks
aangeboden worden
 Bij het uitbrengen van vermijdingsrespons blijft de eerst volgende shock achterwege
 Bij uitbrengen van vermijdingsrespons wordt het R-S interval gereset en start opnieuw
 R-S interval (respons- Shock interval)
 Wanneer de shock optreedt wordt niet voorafgegaan door veiligheidssignaal
o Elk optreden van het vermijdingsgedrag geeft voordelen
 De mate van voordeel hangt af van wanneer de respons gesteld wordt
 Treedt het gedrag vroeg op in R-S interval, dan heb je minder voordeel dan wanneer
het gedrag optreedt tegen het einde van R-S interval
12.4 theoretische benaderingen voor vermijdingsleren
12.4.1 test voor de rol van instrumentele contingentie
 Bechterev: de vermijdingsrespons is een pavloviaanse CR en het voorkomen van het optreden
van US is irrelevant
 Het idee dat de aversieve stimulus voorkomen irrelevant is voor vermijdingsleren in contraintuïtief en werd fout bevonden
 Exp. Brogden e.a.
o Marmotjes in loopwiel
o Elke trial start met een CS (toon)= waarschuwingssignaal
o Pavloviaanse groep
 CSshock (op elke trial)
o Instrumentele groep
 CSshock tenzij ze beginnen te lopen tijdens aanbieding CS
o Als pavloviaanse conditionering volledig verantwoordelijk was voor vermijdingsleren, dan
moet de pavloviaanse groep hogere responsratio’s vertonen
 Want in pavloviaanse groep is er perfecte contingentie
 En instrumentele groep niet
o Resultaten
 Pavloviaanse groep hebben lagere responsratio’s dan instrumentele groep
 Dus de instrumentele contingentie levert een belangrijke bijdrage voor
vermijdingsleren
 Toch blijven de twee hoofdvragen onbeantwoord door dit experiment
 Kon de rol die pavloviaanse conditionering speelt in vermijdingsleren niet verduidelijken
12.4.2 de twee factoren theorie van vermijding
 O.H. Mowrer
 Vermijdingsleren betreft zowel klassieke als instrumentele conditioneringsprocedures
 Klassieke conditionering resulteert in een emotionele toestand, namelijk vrees
o Op trials waar het vermijdingsgedrag niet optreedt: CSaversieve US
o Dit resulteert in de conditionering van angst op de CS
 De reductie/ eliminatie van angst wordt als bekrachtiger gezien
 Tweede proces: angstreductie
78





o Als het vermijdingsgedrag plaatsvindt, zorgt het gedrag ervoor dat de CS stopt en dat US
niet optreedt. Er wordt verwacht dat dit leidt tot een daling in de geconditioneerde angst
o Dus de tweede factor is instrumentele conditionering van de vermijdingsrespons door
vreesreductie
Dus vermijdingsgedrag wordt niet bekrachtigd door ‘niets’ maar door angstreductie
Angstreductie is een vorm van negatieve bekrachtiging
Interacties tussen klassieke en instrumentele factoren
o Zowel pavloviaanse als instrumentele processen leveren bijdrage een vermijdingsleren
o De twee processen zijn wederzijds afhankelijk op verschillende manieren
 Klassieke conditionering van angst is een noodzakelijke voorwaarde voor de
instrumentele component
 Vrees kan niet gereduceerd worden als er in eerste instantie al geen vrees is
 Het instrumentele proces is afhankelijk van de integriteit van het pavloviaanse
proces
 Het pavloviaanse proces wordt beïnvloed door de instrumentele contingentie, maar de
invloed is verstoren
 Instrumentele respons zal leiden tot een extinctie van de vrees welke
geconditioneerd werd door het waarschuwingssignaal
 Frequent vermijdingsgedrag zal resulteren in pavloviaanse extinctie van
geconditioneerde angst
 Extinctie van angst ondergraaft e effectiviteit van angstreductie als een bron van
instrumentele bekrachtiging
 Als de instrumentele vermijdingsrespons niet langer gevolgd wordt door
angstreductie, dan zal de respons extinctie ondergaan
 Gevolg is dat het waarschuwingssignaal na verloop van tijd dus terug zal eindigen
in de presentatie van de aversieve US
 Dit zal op zijn beurt de conditionering van het waarschuwingssignaal reactiveren
 Vermijdingsgedrag wordt bepaald door een continu veranderend dynamische
interactie van pavloviaanse en instrumentele processen
Experimentele evidentie pro de twee factoren theorie
o Er is sprake van pavloviaanse vreesconditionering t.o.v. signaal/CS
o Exp. Brown & Jacobs
 Fase 1:
 in shuttle box wordt pavloviaanse conditionering aangeleerd
 CS (toon)US (shock)
 Controle groep krijgt enkel CS aanbiedingen
 Er is geen ontsnappen/ vermijden mogelijk
 Fase 2
 Aanbieding van CS
 CS wordt beëindigd door ontsnappingsrespons (nmlk naar ander compartiment
gaan)
 Resultaat
 De controle groep leert de ontsnappingsrespons niet
 In de experimentele groep is er een duidelijke leercurve te zien
 Dus het ophouden van het signaal voor de geconditioneerde vrees fungeert als een
effectieve bekrachtiger
Uitdagingen voor de twee factoren theorie
o Wat doen met vrij operante vermijding?
 Shocken vinden periodisch plaats zonder waarschuwingssignaal
 Elk optreden van de vermijdingsrespons initieert een periode van veiligheid
 Twee factoren theorie vereist een waarschuwingssignaal
79
 Hoe kan de theorie dan vrije operant vermijdingsgedrag verklaren?
 rol temporele cues
o Observatie: eens het goed geleerd is, blijft vermijdingsgedrag bestaan op hoog niveau voor
langer periodes, zelfs wanneer de shocks niet langer gegeven worden
 Een lange periode van vermijdingsresponsen zou resulteren in pavloviaanse extinctie
van vrees wat op zijn beurt zou leiden tot extinctie van instrumenteel
vermijdingsgedrag
 Dit lijkt niet te gebeuren
 rol serieel vermijdingsleren
o Succesvol vermijdingsgedrag gaat gepaard met een daling en uiteindelijke een afwezigheid
van vrees
 Toch blijft vermijdingsgedrag bestaan
 Exp. Kamin e.a. :
 Onafhankelijke assessment sterke vreesconditionering tijdens het vermijdingsleren
 Fase 1: conditionering: hendel drukken voedsel
 Fase 2
o Eerst: toonshock (tenzij ze naar andere kant lopen)
o Daarna: na een aantal succesvolle trials (1,3,9,27 – afhankelijk van groep) stopt
de trial fase
 Fase 3: suppressie hendeldrukken door CS (want ze lopen telkens naar andere kant
 Resultaten
o Er vindt suppressie plaats, welke toeneemt in functie van het aantal
vermijdingstrials van 1-9
o Maar bij 27 trials zien we terug een afname (tot verdwijnen) van de suppressie
o Succesvol vermijdingsgedrag gaat samen met het ophouden van vrees
 rol veiligheidssignalen
12.4.3 geconditioneerde temporele cues
 Aannemen dat interne cues die gerelateerd zijn aan het verloop van tijd geconditioneerde
aversieve kenmerken verwerven
 Shocks worden niet voorafgegaan door waarschuwingssignaal, maar ze treden wel op op
voorspelbare tijdstippen
 Het tijdsverloop is voorspeller voor wanneer de volgende shock zal optreden
 Vrij operant vermijdingsleren kan verklaard worden in termen van de twee factoren theorie
door aan te nemen dat individuen de tijd gebruiken als een cue voor wanneer de shock zal
optreden
 Temporele cues karakteristiek voor het einde van de S-S en R-S intervallen zijn anders dan de
temporele cues die karakteristiek zijn voor het begin van deze intervallen
o In het begin kunnen proefdieren het einde en begin van S-S en R-S intervallen niet
onderscheiden
o Ze leren snel het verschil vermits vroege en late temporele cues andere consequenties
hebben
o Temporele cues karakteristiek voor begin van interval gaan nooit gepaard met een shock
o Shocken treden altijd op op het einde van het interval
 Temporele cues die karakteristiek zijn voor het einde van S-S of R-S interval worden gepaard
met een shock en verwerven geconditioneerde aversieve kenmerken
 Elk vermijdingsgedrag start een nieuw R-s interval en reduceert daarbij de geconditioneerde
aversiviteit welke gecreëerd wordt door temporele cues die karakteristiek zijn voor het einde
van de intervallen
 Een vermijdingsrespons kan zo resulteren in de reductie van geconditioneerde vrees en
voldoen aan de grondbeginselen van de twee factoren theorie
80
12.4.4 veiligheidssignalen bij vermijdingsleren
 In plaats van te focussen op signalen welke gevaar voorspellen, focust de veiligheidssignaal
hypothese op de afwezigheid van de shock, of het signaal voor veiligheid
 In een vermijdingsprocedure zijn periode van veiligheid het best voorspelbaar door het
optreden van de vermijdende respons
 Vermijdingsgedrag verhinderd het optreden van aversieve stimulus
 Focus op interne proprioceptieve signalen (= feedback cues) die geassocieerd zijn met het
uitbrengen van de vermijdingsrespons
o Feedback cues gegenereerd door vermijdingsgedrag worden gevolgd door voorspelbare
periode zonder aversieve US(dus veiligheidsperiode)
o Stimuli welke betrouwbaar de afwezigheid van US voorspellen, kunnen pavloviaanse
geconditioneerde inhibitorische kenmerken verwerven
o Feedback cues die gegenereerd worden door vermijdingsgedrag kunnen pavloviaanse
geconditioneerde inhibitorische kenmerken verwerven
 Feedback cues van de vermijdingsrespons verwerven pavloviaanse geconditioneerde
inhibitorische kenmerken en worden zo signalen van veiligheid
o In een situatie met potentieel gevaar worden veiligheidssignalen gezien als een
bekrachtiger
o Vermijdingsgedrag wordt positief bekrachtigd door geconditioneerde inhibitorische
veiligheidssignalen
 Exp. Toedienen van een externe cue (toon) op het moment dat de veronderstelde
proprioceptieve signalen optreden ( dus bij het uitbrengen van de respons)
o De externe cue wordt een pavloviaanse geconditioneerde inhibitor voor vrees
o Externe cue wordt een positieve bekrachtiger
o Toevoeging van experimentele cues faciliteert vermijdingsleren
 De introductie van een externe respons feedback stimulus (welke meer saliënt is dan de
interne proprioceptieve cues)vergemakkelijkt vermijdingsleren
 De veiligheidssignaal hypothese is eerder een aanvulling van de twee factoren theorie
o Pavloviaanse conditionering van vrees voor signalen/temporele cues
o Negatieve bekrachtiging door vreesreductie
o Pavloviaanse conditionering van geconditioneerde inhibitors voor vrees
o Positieve bekrachtiging door veiligheidssignalen
Extra: serieel vermijdingsleren
 Waarom is er geen of een trage extinctie van pavloviaanse vrees uitdoving van
vermijdingsgedrag?
 Levis
o Hogere orde conditionering van VP’s (reeks prikkels ipv 1 VP)
o Blootstelling aan VP3 (niet aan VP2-VP1) is een effectieve vermijdingsrespons
o Uitdoving van VP3 treedt wel op, dier blijft zitten tot VP2, maar angst voor VP2 treedt
onmiddellijk terug op en conditioneert opnieuw angst voor VP3
o Vicieuze cirkel en nooit uitdoving van primaire VP1
o Implosive therapy: achterhalen van en blootstelling aan VP1
12.4.5 vermijdingsleren en ongeconditioneerd defensief gedrag
 Geleerde responsen zijn het product van een interactie tussen de conditioneringsprocedure
die gebruikt werd en de voordien bestaande gedragsmatige structuur van een organisme
 Twee factoren theorie en veiligheidssignaal mechanisme zijn gebaseerd op een eenvoudig
zichtspunt over wat een organisme meebrengt in een aversieve conditioneringssituatie
o Alles wat veronderstelt wordt is dat het organisme iets aversief vindt
81
 Maar het is duidelijk geworden dat de voordien bestaande gedragsmatige tendenties die een
organisme meebrengt in een conditioneringssituatie van vermijding, veel complexer zijn dan
eerst voorgesteld.
o Naast het feit dat ze iets aversief vinden hebben ze ook een rijk gedragsmatig repertoire
om met een aversieve situatie om te gaan
 Bolles
o Organismen kunnen niet overleven met enkel de mogelijkheid om aversieve stimuli te
detecteren en de mogelijkheid om er over te leren via pavloviaanse en instrumentele
conditionering
o De twee factoren theorie en veiligheidssignaal leren vereist een extensieve training om
vermijdingsresponsen te genereren
o Maar in natuurlijke habitat hebben dieren geen tijd om dit aan te leren
o Dus organismen reageren op aversieve situaties met een hiërarchie van
ongeconditioneerde defensieve reacties
o SSDR: species specific defense reactions
 De SSDR theorie van vermijding
o Bv. SSDR: vluchten, vechten, freezing,…
o Welke particuliere SSDR optreedt is afhankelijk van de natuur van de aversieve stimulus
en de respons kenmerken aangeboden door de omgeving
 Als een gekende en effectieve manier van ontsnappen voorhanden is, zal het dier
vooral vluchten
 Zonder gekende respons, zal freezing het meeste voorkomen
o Defensieve responsen worden gevormd en geselecteerd door middel van positieve straf
 Als US optreedt gaan ze overschakelen naar een volgende SSDR uit de respons
hiërarchie net zolang tot ze effectief US vermijden
 Focus ligt op het uitschakelen van ineffectieve responsen
o Interessant perspectief
 Het benadrukt dat vermijdingsleren beïnvloed wordt door reeds bestaande
defensieve gedragingen van het organisme
o Weinig experimentele ondersteuning
 Straf bleek weinig effectief te zijn op SSDR’s te onderdrukken
 Selectie van SSDR’s is minder bepaald door situationele mogelijkheden dan door de
probabiliteit/ nabijheid van een mogelijk letsel
 De predatory imminence continuüm
o Fanselow
o Verschillende toestanden van defensief gedrag worden geactiveerd, afhankelijk van de
gepercipieerde kans op een letsel en de fysieke nabijheid van het gevaar
o Vermijdingsleren bouwt op en interageert met dit genetisch bepaalde gedragssysteem
 Pre encounter mode: het defensieve gedrag van een dier voordat het een roofdier
tegenkomt
 Predator encounter mode: defensief gedrag wanneer het dier een roofdier
tegenkomt
 Dominante gedrag: freezing
 Predator contact mode: het gedrag nadat het roofdier fysiek contact gemaakt heeft
 In de lucht springen en uithalen naar het roofdier= circa strike response
 Conditionering betreft het opnemen van nieuwe stimuli in een bestaand
gedragssysteem
 Aversieve US (Shock): predator contact mode
o rat gaat o.a. opspringen
 Signaal voor shock (CS) : predator encounter mode
o Rat gaat freezing vertonen
82
o Of als het gaat om een temporeel verder verwijderde cue: pre encounter
mode dier gaat veiliger oord opzoeken
 Het al dan niet compatibel zijn van een (experimenteel) vereiste
vermijdingsrespons faciliteert (of inhibeert als het niet aanwezig is)
vermijdingsleren
 Er wordt dus een grotere rol toegekend aan de bijdrage van pavloviaanse
conditionering bij vermijdingsleren
o Reeds bestaande gedragsmatige tendenties predomineren tijdens vroege conditionionele
vermijdingstrials voordat (veel) leren heeft plaatsgevonden
o Met herhaalde training zullen de pavloviaanse en instrumentele mechanismen een rol
spelen
o Zelfs wanneer een organisme leert over een aversieve situatie, wordt hun gedrag sterk
beïnvloed door de bestaande organisatie van defensief gedrag
 Cognitieve verklaringen
o Seligman & johnston
o Analyse van vermijdingsgedrag louter in termen van propositionele kennis/ regels/
verwachtingen en inferenties op basis van deze kennis
o VP wordt gevolgd door OP
o Als (vermijdings)respons gesteld, dan volgt OP niet op VP
o OP is aversief en moet dus worden verhinderd
o Dus vermijdingsrespons stellen wanneer VP aanwezig is
Extra: conditionering en causaal redeneren bij mensen en ratten
1.algemene achtergrond
 Voor Darwin: discontinuïteit tussen mens en dier:
o Mensen zijn niet het verlengde van dieren
o Dieren hebben gewoonten en instincten
o Mensen hebben een ratio, hanteren taal, hebben inzicht (en een ziel)
o Onderscheid heeft te maken met geloofskwesties (mens geschapen naar evenbeeld van God)
 Sinds Darwin
o Strikte tweedeling tussen mens en dier is niet meer te handhaven
o Doel Darwin: aantonen dat er geen fundamenteel verschil is tussen mens en andere
zoogdieren.
o Volgens hem gaat het eerder om graduele verschillen dan om fundamentele verschillen
o Vloeit noodzakelijkerwijs voort uit theorie van geleidelijke evolutie door selectie
o Dit idee is lange tijd min of meer geaccepteerd geweest
 Toch zijn er blijvende pogingen om een (nieuwe) basis voor het fundamenteel verschil te vinden
o Vooral bij comparative psychology
o Voorstellen over wat uniek menselijk is en wat (andere) dieren niet zouden kunnen
 Slingerbeweging aan de gang tussen benadrukken van gelijkenis en benadrukken van verschillen
tussen mens en dier
 Discussie focust op verschillende domeinen
o Tool use: kunnen dieren gereedschap gebruiken op zelfde manier als mensen?
o Taal
o Symbolische relaties
o…
2. inleiding causaal leren
 Over het algemeen zijn mensen (en dieren) erg goed in het detecteren van causale relaties en
het onderscheiden van causaliteit en correlatie
 Vraag: hoe doen we dat? En verschillen we daarin van andere dieren
83
 De mechanismen die hieraan ten grondslag liggen zijn al erg lang het onderwerp van onderzoek
en discussie
3. zijn mensen precies als dieren?
 Hoe wordt causaal leren bij mensen onderzocht
o Deelnemers krijgen informatie over de aan-/afwezigheid van een aantal potentiële oorzaken
en mogelijke effecten, en moeten daarna de relatie tussen oorzaken en effecten beoordelen
o Bv. tank explosie taak
 Proefpersoon krijgt 5 vakjes te zien.
 Er rijdt een tank over het scherm
 1 vierkantje licht op en de tank ontploft/ er gebeurt niets
 Na een aantal trials: hoe groot is de kans dat als dit vierkantje oplicht, dat de tank
ontploft?
o Tot 1984 was het idee dat mensen deze taken oplosten door intuïtieve wiskunde te doen
 Dominante theorie: probalistisch contrastmodel: causale oordeel gebaseerd op
vergelijking van de kans op het voorkomen van het effect in aanwezigheid van de
potentiële oorzaak en de kans op het voorkomen van het effect in afwezigheid van de
potentiële oorzaak
 Dus causale oordeel afleiden van geschatte conditionele probaliteiten
 Verschil [P(O|A)-P(O| niet A)] is indicator voor de sterkte van het causale verband
 Onderliggende idee: mensen zijn soort van intuïtieve statistischi
o Na 1984: Procedurele gelijkenis tussen causale leertaken bij mensen en taken voor klassieke
conditionering bij dieren
 Potentiële oorzaak al dan niet gevolg door effect. Wat doet dit met de inschatting van
causale sterkte van potentiële oorzaken (mensen)
 VP gevolgd door OP wat is het effect hiervan op reactie op VP (dieren)
 Is er misschien sprake van een gelijkaardig onderliggend mechanisme?
 Kunnen theoretische modellen voor dierconditionering ook toegepast worden op
causaal leren bij mensen?
 Steun voor het idee: forward blocking treed zowel op bij causaal leren en klassieke
conditionering
 dierexperimenten
o Fase 1: AUS
o Fase 2: AXUS
o Test: X?  lagere conditionele respons dan in controle groep
 Een van de belangrijkste ontwikkelingen van RW model (associatief leren): meest
invloedrijke model van klassieke conditionering bij dieren
 Omdat we voor blocking iets gelijkaardigs vinden bij mensen, suggereert dat RW
misschien ook een goed model is voor causaal leren bij mensen te begrijpen
 Causale leertaak bij mensen
o Within subject design
o Fase 1: AUS
o Fase 2: AXUS
o Fase 3: KLUS
o Test: causale sterkte van X,K en L
 Lagere inschatting voor X dan voor K en L
 (US was reeds voorspelt door A dus voegt niets toe. Op de KL trials, was er
nog geen voorspelling mogelijk, dus beide stimuli verwerven evenveel
associatieve sterkte)
84
 Kruisbestuiving tussen onderzoek bij mensen en dieren
o Cross over tussen onderzoek naar causaal leren bij mensen en onderzoek naar klassieke
conditionering
o Cross-validatie van empirische fenomenen die eerder aangetoond waren bij dieren. En
omgekeerd werden procedures eerst uitgetest bij mensen vooraleer een toetsing plaatsvond
bij dieren
o In eerste fase was input van dier naar mens onderzoek het meest duidelijk
o Andersom werd bij mensen eerst het fenomeen van backward blocking aangetoond en pas
aantal jaren later is soortgelijk fenomeen bij dieren aangetoond
 omkering leerfasen: eerst leren AX+/ KL+/ M- en in fase 2: A+ en M effect: causale sterkte van X lager inschatten dan die van K en L
 om backward blocking te verklaren kan je niet meer toekomen met RW model
 na eerste fase is er geen reden waarom X minder sterkte zou hebben dan K of L
 na tweede fase geen reden waarom associatieve waarde van X zal veranderen (want
niet meer aangeboden)
 aanleiding tot ontwikkeling nieuwe associatieve modellen
 conclusie van deze paragraaf: mensen zijn precies als dieren. Hoe mensen causale relaties leren
tussen prikkels verloopt groso modo het zelfde als hoe dieren associaties verwerven
conclusie hield echter niet stand (zie punt 4.)
4. mensen zijn niet precies als dieren
 vertrekpunt: vaststelling dat associatieve modellen ervan uit gaan dat causale oordelen puur en
louter afhankelijk zijn van het samen voorkomen van stimuli
o causaal leren zou enkel berusten op het verwerven van assocaties
 probleem: ondertussen zijn er meer aanwijzingen dat causale oordelen ook gevoelig zijn voor
redeneerprocessen en allerhande voorkennis die mensen hebben bij causaal leren
 hoe blocking begrijpen als een redeneerfenomeen
o je zou het kunnen begrijpen als uitkomst van een syllogisme
o als P dan Q: algemene premisse: stel dat er 2 potentiële oorzaken (A en X) aanwezig zijn. stel
dat ze beide effectief oorzakelijk resulteren in een bepaald effect, dan zouden ze samen
moeten resulteren in een sterker effect dan elk afzonderlijk
o niet Q: in typische blocking procedure geldt dat AX+ en A+ trials een even sterk effect hebben
o daarom niet P: A en X kunnen niet allebei effectieve oorzaken zijn
o A is een effectieve oorzaak (want leidt altijd tot effect)
o Daarom is conclusie dat X geen effectieve oorzaak is, dus geven mensen een lage causale
rating aan X wat leidt tot blocking
o Dus blocking is het logische gevolg van een logische redenering ( manier om formeel naar
dergelijke situatie te kijken)
 Hieruit vallen een aantal predicties af te leiden
o Blocking treedt enkel op als mensen uitgaan van eerste algemene permise (twee effectieve
oorzaken leiden tot een groter effect)
o Blocking treedt enkel op als mensen kunnen zien dat het effect even sterk is bij AX samen
dan bij A en X afzonderlijk
o Blocking treedt enkel op als mensen de mogelijkheid en motivatie hebben om te redeneren
 Toetsing door food alergy taak (causale leertaak)
o Procedure
 Proefpersonen krijgen verschillende soorten voedsel (en combinatie van voedsel) te zien
al dan niet gevolgd door allergische reactie
 Voor elk soort voedsel afzonderlijk wordt bevraagd hoe waarschijnlijk het is dat
allergische reactie volgt bij het eten van dit voedsel
o Toetsing predictie 1:
85
Pre-training
Fase 1
Fase 2
Additief
G+ H+ GH++ I+ ZA+ ZAX+ KL+ ZNon additief
G+ H+ GH+ I++ ZA+ ZAX+ KL+ Z Fase 1 en fase 2: blocking procedure
 Blocking zou betekenen dat ze minder allergie verwachten bij X alleen dan bij K of L
alleen
 Pre-training: info over andere soorten voedsel
 Additief: 2 oorzaken van effect hebben samen een sterker effect dan de oorzaken
afzonderlijk
 Non additief: 2 oorzaken van effect hebben samen geen sterker effect
o Hiermee spreek je actief het idee tegen dat wee oorzaken samen resulteert in
groter effect (zeker omdat proefpersonen zien dat een sterkere reactie wel
mogelijk is bij inname van ander soort voedsel)
 Als assumptie 1 cruciaal is om tot blocking te komen. Dan moet er in non additieve
groep minder blocking moeten zijn
 Voorspelling 1: vanuit associatieve verklaring verwacht je dat pre training irrelevant is
(want andere stimuli)
 voorspelling 2: vanuit redeneeranalyse verwacht je dat in non additive groep minder
blocking krijgt
 Resultaat: evidentie gevonden voor voorspelling 2: blocking effect aanwezig in additieve
groep, niet in non additieve groep
 Dit suggereert dat blocking enkel optreedt als mensen ervan uitgaan dat oorzaken
additief zijn
o Toetsing predictie 2:
Pre- training
Fase 1
Fase 2
Maximaal
+ ++ A++ MAX++ KL++ MSub maximaal + ++ A+ MAX+ KL+ M Fase 1 en fase 2 is weer gewone blocking procedure
 Pretraining: info over allergische reactie zonder info over voedsel
 Blocking gebruikte
 Sterkste allergische reactie
 Minst sterke allergische reactie
 Als A gevolgd wordt door niet maximale reactie en combinatie van AX daar ook toe leidt,
dan weet je met zekerheid dat X niets heeft toegevoegd
 Als A leidt tot maximale reactie en combinatie van A en X ook, kan je eigenlijk niet met
zekerheid zeggen dat X er niets aan toevoegd
 Dus in maximale conditie zou je veel minder blocking moeten observeren volgens
redeneeranalyse
 Associatieve analyse maakt deze voorspelling niet
 Resultaat: blocking effect bij submaximale groep maar geen blocking bij maximale
intensiteit
o Toetsing predictie 3:
 Causale leertaak (tank taak) oplossen en tegelijkertijd een secundaire taak uit voeren
 Makkelijke taak: bij toon op spatiebalk duwen (tonen kwamen voorspelbaar)
 Moeilijke taak: bij hoge toon op knop 1 duwen en bij lage toon op toetst 2
drukken (tonen waren onvoorspelbaar
 Voorspelling: minder blocking bij moeilijkere taak dan bij makkelijke taak
 Resultaat: meer belasting van werkgeheugen leidt tot minder blocking
 Moeilijk uit te leggen vanuit associatieve verklaring
 Voorlopige conclusie
86
o Meer en meer aanwijzingen dat causaal leren bij mensen kenmerken heeft die te verwachten
zijn vanuit een redeneer analyse van causaal leren en die moeilijk te verzoenen zijn met het
idee dat causaal leren enkel gaat over het verwerven van associatieve relaties
o Dus mensen zijn niet precies als dieren
5. zijn dieren precies als mensen?
 Meest voor de hand liggende conclusie op basis van het voorgaande is dat leren bij mensen
berust op fundamenteel andere mechanismen dan leren bij dieren. En dat het optreden van
blocking nog fundamenteel anders is bij mensen als bij dieren – ondanks dat het plaatsvindt in
gelijkaardige procedures
 Associatieve modellen zijn nooit ontwikkeld om causaal leren bij mensen te verklaren. Ze
hadden als doen om klassieke conditionering bij dieren te verklaren.
o Het feit dat ze tekort schieten om causaal leren bij mensen te verklaren suggereert dat
causaal leren en dierconditionering berusten op fundamenteel andere processen
 Andere conclusie mogelijk: ook bij dieren berust blocking ten delen op niet associatieve
processen, op meer redeneer achtige processen
o Probleem: veronderstelt veel complexere cognitie bij dieren dan over het algemeen wordt
aangenomen
 Voorspellingen vanuit een redeneeranalyse
o Blocking treedt op omdat dieren additiviteit veronderstellen. Dus blocking moet
verminderen door additiviteit tegen te spreken
o Blocking treedt op omdat dieren kunnen vaststellen dat de geblokkeerde prikkel X niets
toevoegt bovenop het effect van A. dus een niet maximale outcome zou blocking moeten
versterken
 Toetsing eerste voorspelling
o Fase 2 en fase 3 zijn blocking training
o 3 blocking groepen en 3 controle groepen
o Blocking zou betekenen dat X minder angst uitlokt in experimentele groepen en meer angst
in controle groepen
o 3 dagen training fase 2, 1 dag training fase 3 parameters waarvan we weten dat ze over
het algemeen sterke blocking effect oproepen
o Fase 1: pre training met andere voorwaardelijk prikkels
 Meeste van de dieren kregen informatie die verder weinig implicaties hadden
 2 groepen (1 experimentele en 1 controle groep) hadden niet additieve pre training:
GH samen leiden niet tot groter effect dan G en H afzonderlijk.
o Als assumptie cruciaal is voor blocking zou je in niet additieve groepen een kleiner blocking
effect moeten bekomen
o Resultaat:
 Blocking fenomeen: sterk verschil tussen controle groepen en experimentele groepen
 Geen blocking effect bij non additieve training: geen verschil tussen controle groep en
experimentele groep
o Conclusie experiment 1:
87
 Resultaat lijkt in tegenspreek met het idee dat blocking een gevolg is van vaste,
ingebakken associatieve leerprincipes
 Suggereert dat blocking berust op assumptie van additiviteit waardoor ratten iets doen
dat doen wat lijkt op redeneren
 Toetsing tweede voorspelling
o
o 3 experimentele en 3 controle groepen
o 1 dag training fase 2 en 1 dag training fase 3parameters waarvan we weten dat ze tot
beperkt blocking effect leiden
o Fase 1: pre exposure: onvoorspelde shocks van verschillende intensiteiten (4 keer
zwaardere en 4 keer lichtere shock
o Blocking met de minst sterke of met de sterkste shock intensiteit die ze ooit meegemaakt
hadden
 Minst sterke intensiteit: dieren zijn er zeker van dat effect op A+ trials en AX+ trials
groter had kunnen zijn. dus X voegt niets toe
 Deze conclusie kan niet gemaakt worden in groepen met maximale intensiteit
o Voorspelling van RW:
 Sterkere shock meer saillant (beta parameter)
 Sterkere shock laat een hogere asymptoot van leren toe (lambda parameter)
 Sterkere shock zou leiden tot sterker blocking effect dan bij zwakkere shock
(omgekeerde van wat redeneeranalyse voorspelt
o Resultaten in lijn met redeneervoorspelling
 Geen blocking effect bij maximale shock intensiteit
 Bij lagere intensiteit treedt er blocking op
o Conclusie experiment 2:
 Komt overeen met redeneeranalyse
 Moeilijk te verklaren vanuit associatieve verklaring van blocking
 Blocking in dierconditionering lijkt aan dezelfde wetmatigheden onderhevig te zijn als
blocking in causaal leren bij mensen
 Dieren lijken toch precies als mensen
 Regels en uitzonderingen
o Als je ervan uitgaat dat blocking bij dieren en mensen typisch gebeurt omdat ze vertrekken
van de assumptie van aditiviteit dan zeg je dat aditiviteit de basisregel is. met subadditieve
training spreek je die algemene regel tegen (uitzondering op regel).
o De vraag is dan: wanneer zal men die uitzondering toepassen /generaliseren op de blocking
die erop volgt en wanneer niet
o Parallel met extinctie (afhankelijk van context= contextverandering na uitdoving zorgt dat
oorspronkelijk geconditioneerde respons terug opdaagt.)
 Je leert tijdens acquisitie een regel. Extinctie biedt hier een uitzondering op die
gevoelig is voor context
 Stel dat dit ook zo is bij blocking: subadditive training is dan misschien aan hetzelfde
onderhevig als extinctie
o Experiment: context shift
88
 Gelijkaardig experiment met subadditieve training in blocking procedure als voorheen

 Twee condities
 Shift: pre-training en blocking training vinden plaats in verschillende contexten
 Noshift: pre-training en blocking training vinden plaats in dezelfde context
 In de testfase wordt een nieuwe context aangeboden zodat die even nieuw is voor
iedereen
 Fase 1: A (of B) wordt gevolgd door shock
 Fase 2 : AX wordt gevolgd door shock
 Deze twee fases vinden plaats in dezelfde context
 Pre-training: met andere cues: irrelevante pre-training in zelfde context als blocking of
subadditieve training in een zelfde of in een andere context
 Resultaten
 Geen context shift: na irrelevante training krijg je standaard blocking effect
 Geen context shift: geen blocking effect na additieve training
 Context shift: additieve training kent wel een blocking effect
 Dus de uitzondering die geleerd is op algemene regel van additiviteit overleeft
geen contextshift
o Analoog aan renewal effect bij extinctie
o Gelijkaardige effecten door het variëren van stimulusduur tussen pre-training en blocking
training (geen gerenalisatie als er verschillende duur is) of door invoegen van retentie
interval tussen pre- training en blocking training (na retentie is er geen generalisatie
o Dus het effect van pre-training is beperkt tot gelijkaardige stimuli die in dezelfde context
worden aangeboden in het zelfde tijdskader
6. zijn kinderen net als dieren?
 Blijkbaar is blocking bij dieren en mensen gevoelig voor gelijkaardige fenomenen
 Lijkt aan te sluiten bij redeneer verklaring
 Recent zijn er claims dat je dergelijke effecten toch ook associatief kan verklaren. De theorieën
die dit tot nu toe postuleren, zijn niet geslaagd een goede verklaring te bieden. Maar dit wil niet
zeggen dat er geen enkele andere manier is op het associatief te verklaren
 Je kan gaan kijken naar hoe causaal leren zich ontwikkeld
o Idee: als blocking berust op redeneer processen. Dan zou het ontstaan van blocking hand in
hand moeten gaan met ontwikkeling van redeneervaardigheden
o Dus onderzoeken of blocking optreedt bij kleuters (want minder goed in causaal redeneren)
 Procedure regenvoorspeltaak
o Kind krijgt kaartjes. Op voorkant staat symbool en om achterkant staat wolk met
regendruppels
o Taak: op basis van symbolen op voorkant voorspellen hoeveel regen er te zien was op
achterkant
o Twee mogelijke scenairios
89
 Causale variant: dit zijn knoppen van regenmachine: als mannetje op knop duwt, dan
regent het. Jij krijgt te zien op welke knop het mannetje duwt en hoeveel regen er
komt
 Predictieve variant: mannetje gebruikt deze knoppen om te voorspelen of het zal
regen. Je krijgt te zien welke knoppen het mannetje ziet en of het daarna al dan niet
regent
o Blocking kan je enkel verwachten in de causale leertaak, niet in de predictieve leertaak
o Deelnemers zijn 4 of 8 jaar oud
o Fase 1: A+ Z- training
o Fase 2: AX+ KL+ Zo Test: voor elk symbool afzonderlijk aangeven hoeveel regen ze verwachten
o ! ze hadden altijd een antwoordkaartje waar meer regen opstond dan dat ze ooit gekregen
hadden ( dus submaximaal)
o Blocking zou betekenen dat ze minder regen verwachten bij X dan bij K of L
o Resultaten
 Blocking treed op in causale scenario, niet in predictieve scenario
 Resultaten zijn identiek voor 4 en 8-jarigen
 Kan 2 dingen betekenen
 Lijk in tegenspraak met het idee dat blocking berust op redeneerprocessen
 Lijkt in lijn met het idee dat blocking berust op causaal redeneren
 Vervolg experiment: kijken naar link tussen additiviteitsassumptie en blocking
o Robot waar voedsel in kan en waarvan buik oplicht/geluid maakt (telkens 2 intensiteit)
o 3 tot 6-jarigen
o Ahalf oplichten
o AXhalf oplichten
o KLhalf oplichten
o Vraag:
 licht de buik op door A?
 Als je buik moet oplichten, kies je dan voor A of voor K?
 Achteraf redeneervragen om te kijken of ze denken of oorzaken moeten optellen
 2 soorten nieuw voedsel tegelijk in robot, welke half oplicht
 Vraag: denk je dat dit alle 2 soorten voedsel zijn die de robot doet oplichten, of is er
maar eentje dat de buik doet oplichten?
 [redenering: als ze alle twee buik doen oplichten, moet die helemaal oplichten. Dat
was niet het geval dus kan er maar eentje de buik oplichten]
o Verwachting: correlatie tussen mate van blocking en mate van het juist oplossen van
redeneervragen
o Resultaat:
 we krijgen blocking
 er is correlatie tussen blocking en oplossing redeneertaken welke overeind blijft als je
controleert voor leeftijd
 correlatie tussen leeftijd en blocking blijft niet overeind als je controleert voor
redeneervaardigheid
 niet leeftijd aan zich is van belang maar wel de mate waarin ze het soort redeneervragen
correct kunnen oplossen
o alle kinderen die een sterk blocking laten zien, doen het perfect op redeneervragen
o maar bij kinderen die weinig blocking laten zien, doet de helft het heel goed op
redeneervragen
o het kunnen redeneren over dit soort dingen is dus noodzakelijke maar geen voldoende
voorwaarde om blocking te krijgen
 werkgeheugen zou ook kunnen meespelen: redenering kunnen toepassen in blockingcontext
90
o kinderen tussen 4 en 6 jaar
o zelfde experiment samen met werkgeheugen taken (uit WISC en dieren herinner taak die ze
achteraf in juiste volgorde moeten reproduceren)
o hypo: mate van blocking is afhankelijk van redeneervaardigheid en werkgeheugen
o resultaten
 blocking was significant bij kinderen die het bovengemiddeld goed doen op
werkgeheugen taak
 geen blocking bij kinderen die het minder goed doen op werkgeheugen taak
 niet / moeilijk te rijmen met associatieve verklaring
 regressieanalyse: zowel redeneervaardigheid als werkgeheugen zijn onafhankelijk
belangrijk voor het voorspellen van de mate van blocking. (verbaal IQ en
chronologische leeftijd zijn geen unieke predictors)
 voorgaande experimenten zijn allen correlationeel. Dus er kunnen geen sterke causale
conclusies uit getrokken worden
 experiment om na te gaan of je blocking actief kan manipuleren door de redeneervaardigheid te
beïnvloeden
o als kinderen moeten redeneren om tot blocking te komen en dat redeneerproces is een
soort van modus tollens syllogisme dat ze moeten oplossen dan zou blocking sterker
moeten zijn als je modus tollens redeneren faciliteert
o bij volwassenen kan dit door training in counterfactual denken
 = hoe zou de situatie er hebben uitgezien als dit of dat anders was geweest
o Twee groepen kinderen met blocking taak (robot taak)
 Counterfactial groep: denken over hoe een bepaalde outcome zou zijn geweest als één
van de cues anders was geweest
 Bv. pizza licht half op/ Druiven licht niet op / Pizza+ brood licht half op
 Vraag: wat als druiven de buik ook deden oplichten
 Factual groep: kregen vragen over zaken die ze daadwerkelijk gezien hadden
o Resultaten
 Manipulatiecheck: na counterfactual training doen kinderen het beter op redeneertaak
 Door de training wordt het blocking effect ook groter. wat suggereert dat blocking
berust op modus tollens redeneren
 !dit effect treedt enkel op bij jongste kinderen (waarschijnlijk omdat oudste
kinderen al heel goed deden op redeneertaken en er geen extra ruimte tot
verbetering meer was
 Algemene conclusies
o Als we de prestaties van mensen in causale leertaken toeschrijven aan complexe cognitieve
processen (redeneren), dan moeten we wellicht hetzelfde doen voor de prestaties van
ratten in klassieke conditioneringsproeven
o Kunnen ratten redeneren?  als mensen het kunnen, dan kunnen ratten het wellicht ook
o Associatieve modellen moeten niet volledig over boord gegooid worden maar minstens
moeten uitgebreid worden om te verklaren waarom sommige dingen moeilijker zijn, meer
werkgeheugen vragen,…
91
Extra: Gedrag, taal en stimulus equivalentie
1. algemeen kader van waaruit gedragsanalyses opereren
 In het begin werd gedrag verklaard op basis van de antecedenten, het uitgelokte gedrag [ SR]
o Descartes postuleerde een mechanische benadering van onvrijwillig gedrag
 Gedrag werd gezien als reflexen en geconditioneerde reflexen
o Dit beeld is later herzien door een logisch positivistische benadering
 Bv. Watson:
 Enkel bezorgt om wat we objectief kunnen waarnemen
 We krijgen dus een wetenschappelijke verwerping van cognitie en emotie vermits ze
niet observeerbaar zijn en enkel afgeleid kunnen worden van gedragsmatige metingen:
de watsoniaanse restrictie
 Simplistisch methodologisch behaviorisme
 Later werd het S-R schema omgezet in een S-O-R schema
o O: mentale representatie
o Hoofdstroom=
 Bv. associatieve leer traditie
 Zowel mentalistische als mechanistische benadering van gedrag
 Mentalistische benaderin van gedrag : Gedrag doormiddel van de gemedieerde rol van
mentale gebeurtenissen
 mechanistische benadering van gedrag :Doet een poging om deze gebeurtenissen te
begrijpen door het verhelderen van processen (bv. hoe informatie opgemerkt,
opgeslagen, opgeroepen wordt of gerepresenteerd wordt in knopen)
o dus stimuli worden mentaal gerepresenteerd en er worden associaties gevormd tussen de
stimuli
o deze associatieve activiteit is direct verantwoordelijke voor het gedrag
 Een andere traditie veranderd het S-R schema in een R-S schema
o Gedragsmatige analystische traditie
o Skinner
o Gedrag wordt gevormd door de omgeving, gebaseerd op zijn geschiedenis van consequenties
(bekrachtiging, extinctie, straf)
o Over verschillende voorbeelden van bekrachtiging, worden voorafgaande contextuele
condities gediscrimineerd en lokken een respons uit
 Ze verkrijgen dus stimulus controle
o Dit proces is gelijk aan operant gedrag
 SD ; RSR
 In de aanwezigheid van een discriminatieve stimulus (SD), stelt men een bepaalde
respons (R) omdat deze bekrachtigd wordt (SR)
 Operant gedrag wordt dus functioneel bepaald door omringende contextuele
gebeurtenissen
 Een geschiedenis van consequenties
 Een antecedente stimuli
o Wat doen we dan met complexe zaken (bv. taal, gedachten, bewustzijn, geheugen,…)
 Deze cognitieve gebeurtenissen zijn gedraging die samen optreden met overt gedrag
 Het gaat hier om een radicaal behaviorisme omdat het alle publieke en private
gebeurtenissen als gedrag beschouwt
 Men gaat op zoek naar functionele verbanden tussen gedrag en omgeving, niet
naar structuren en andere mentalistische zaken
 Mentale gebeurtenissen verklaren gedrag dus niet omdat ze gedrag zijn
 De enige onafhankelijke variabelen die gedrag vorm geven zijn antecedente
gebeurtenissen en consequenties (dus de enige stimuli die gedrag bepalen zijn
contextueel)
92
 Dit maakt dat er een mooi onderscheidt is
 Duidelijke variabelen waarmee we gedrag kunnen voorspellen
 Duidelijke en bereikbare variabelen waarmee we gedrag kunnen manipuleren en
beïnvloeden
2. beschrijving van de originele benadering van verbaal gedrag
 Het gebruik van functionele analyse
o Er wordt een analyse gehouden van gebeurtenissen welke gedrag vorm geven en uitlokken
o Of er wordt een procedure gebruikt om die gedragingen te determineren die het gedrag
functioneel controleren
o Bv. functionele analyse van hoofd bonken bij autisten
 A. als ze in de keuken hoofd bonken krijgen ze voedsel
 B. als ze in de zetel hoofdbonken krijgen ze aandacht
 C. als ze hoofdbonken wanneer iemand ‘goedemorgen zegt’ worden ze gewassen
 het gaat hier telkens om eenzelfde topografische actie (hoofd bonken) in drie
verschillende contingenties dus het gaat om 3 functioneel verschillende gedragingen
 A. hoofdbonken als gedrag om voedsel te zoeken
 B. hoofd bonken als gedrag om interactie te zoeken
 C. hoofd bonken als gedrag voor sensorische stimulatie
o Gedrag wordt dus gevorm door zijn consequenties en uitgelokt door antecedente condities
o Operante responsen zijn functioneel bepaald aan de basis van deze gebeurtenissen
o Functionalisme is een vorm van Radicaal behaviorisme vermits het aanneemt dat cognitie
en taal geen mentale gebeurtenissen zijn meer gedragsmatige processen
 De uitdaging voor gedragsanalyses
o Taal is één van de grootste uitdagingen voor gedragsanalyses
o Waarom interesse in taal: taal kan gedrag controleren
 Taal contexten zijn een bron voor leren en gedragsmatige veranderingen
 Elke dag volgen we instructies. Dit kan gezien worden als linguïstische gebeurtenissen
waar we op reageren
 Maar er wordt ook klinisch gekeken naar de rol van gedachten
 Overtuigingen, automatische gedachten en regels kunnen een oorzaak zijn van
gedrag en soms leiden tot pathologisch gedrag
 Bv. ‘ik ben niets waard’ bij depressie
o Taal is een uiterst complex gedrag
 De basis van taal is een arbitraire en symbolische natuur
 Arbitrair: er is geen relatie tussen het geschreven en uitgesproken woord ‘hond’
en het beeld ervan
 Het woord staat symbool voor iets
 een referent (bv. geschreven woord hond) staat voor/ refereert naar een symbool (bv.
het beeld van het hond of de klank hond)
 Dit alles ondanks het feit dat deze gebeurtenissen perceptueel ongelijk zijn en
temporeel en spatiaal ongecorreleerd zijn
 Taal is veralgemeenbaar en nieuw
 We kunnen de verschijning van een verbale respons zien
 Welke coherent zijn
 Ondanks het feit dat ze nooit bekrachtigd zijn of eerder uitgelokt
 Verbaal gedrag lijkt op nieuw gedrag dat nooit speciaal bekrachtigd is
 Dit gaat verder dan een eenvoudige directe bekrachtigingsgeschiedenis
 Bv. bij het aanleren van een nieuwe taal moeten we niet alle woorden geleerd
hebben. Sommige woorden kunnen we afleiden uit de context
93




o Skinner trachtte om deze vragen te beantwoorden door gebruik te maken van functionele
analyse: hij probeerde te bepalen welke gebeurtenissen particuliere linguïstische
gebeurtenissen controleren
Een functionele analyse van verbaal gedrag
o Skinner categoriseerde verbale gedragingen in aparte functionele groepen, welke bekend
staan als operante klassen
 Eerst de echo: als het kind van 12-18 maand geluidjes begint te herhalen
 “zeg papa””papa”goed zo
 Dan de TACT: als een kind taaluitingen maakt naar een specifiek object
 Een gedrag dat lijkt op benoemen waarbij stimuli benoemd worden/ contact
gemaakt wordt met stimuli
 Kind ziet papa zegt “papa”goed zo
 Derde komt de MAND: kind maakt taaluitingen om toegang te krijgen tot objecten of
objecten te vragen. Een gedrag dat lijkt op vragen
 Kind heeft dorstzegt ‘sap’ krijgt drinken
o Skinner stelde verschillende andere dingen voor (bv. intraverbaal, textueel,…) het
belangrijke punt hierbij is dat het allen gaat om operante klassen welke functioneel verbale
gebeurtenissen bepalen
Problemen met skineriaanse benadering voor taal
o Skinner’ s gedragsmatige analyse houdt in dat taal gedrag is dat gevormd woord door
contextuele contingenties
o Maar er is geen coherente, empirisch toegankelijke definitie aangeboden
o Al de categorieën zijn hypothetisch en nooit experimenteel gedemonstreerd
o Er werd gesteld dat taal gevorm is door contextuele condities maar dit is nooit aangetoond
Skinner bood een arme functionele definitie van verbaal gedrag
o Verbaal gedrag is elk gedrag van de spreker, dat bekrachtigd wordt door een luisteraard
welke getraind is door een verbale gemeenschap om de bekrachtiging te mediëren
o Het probleem met deze definitie is dat het organisme dat spreekt er niet toe doet, enkele
het gedrag van de luisteraar is van belang
 Elk organisme gaan zich verbaal gedragen zolang als ze gevormd worden door iemand
die getraind is door een verbale gemeenschap
 Voorbeeld
 wanneer een pc het vormgeven van het gedrag van een rat medieert, maar zelf
niet gevormd is door een verbale samenleving, dan is het gedrag van de rat niet
verbaal
 wanneer een mens het gedrag medieert dan is het gedrag van de rat wel verbaal
 !! belangrijk hierbij is dat het gedrag van de rat identiek blijft in beide gevallen,
het gedrag is constant
o Skinner’ s definitie was dus te breed en kon geen empirisch onderzoek bieden
De basis was gezet voor een bevordering van gedragsanalyse
3. vooruitgangen in het veld (ontdekkingen die volgen op Skinner’ s oorspronkelijke werk)
 Stimulus equivalentie (Sidman)
o = en complex gedrag dat vermeend is enkel geobserveerd te worden in mensen met
verbale mogelijkheden
o Optreden van accurate, non bekrachtigde stimuli-stimuli responsen gevolg door een
bekrachtiging van andere stimuli- stimuli relaties
94
o
 Gebruik maken van arbitraire stimuli zonder enige relatie: we kunnen associatie
aanleren
 Eerst toon je dat A samen gaat met B hieruit leidt men af dat B ook samen gaat met
A
 Vervolgens toont men dat A samengaat met Cwaaruit men afleidt dat ook
omgekeerd C samengaat met A
 Dan biedt men B aan waarbij men direct afleidt dat die samengaat met C ( en
omgekeerd: als men C aanbied leidt men af dat die samengaat met B) ondanks het feit
dat ze nooit samen aangeboden zijn/ bekrachtigd zijn
 De antwoordpatronen kunnen niet voorspeld worden door de gekende leerwetten
o Stimulus equivalentie wordt geobserveerd met een matching to sample paradigma (MTS)
 Fase 1: equivalentie training MTS taak
 A1 wordt gevolgd door B1
 A1 wordt gevolgd door C1
 A2 wordt gevolgd door B2
 A2 wordt gevolgd door C2
 Deze 4 blokken worden elke twee keer aangeboden in blokken van 16 trials
 Proefpersonen krijgen stimulus aangeboden en moeten zeggen welke stimulus
ermee gepaard gaat
 Criteria: proefpersonen moeten 15 van de 16 aanbiedingen correct beantwoorden
 Fase 2: equivalentietesten
 Eerst wordt er gekeken voor omkeerbaarheid
o B1 wordt aangeboden; proefpersonen moet A1 aanduiden
o B2 wordt aangeboden; proefpersonen moeten A2 aanduiden
 Dan wordt er getest voor verkregen equivalentie relaties of transitiviteit
o Als A=B en A=C is B=C?
o B1 wordt aangeboden; proefpersonen moeten C1 aanduiden
o B2 wordt aangeboden,; proefpersonen moeten C2 aanduiden
o C1 wordt aangeboden; proefpersonen moeten B1 aanduiden
o C2 wordt aangeboden; proefpersonen moeten B2 aanduiden
o Cruciaal: enkel verbale wezens (=mensen) hebben betrouwbaar getoond zowel
de omkeerbare als de afgeleide relaties aan te leren
o Relatie tussen A1 en B1 en tussen A1 en C1 is een symmetrische relatie
o Relatie tussen B1 en C1 is een transitieve/ equivalentie relatie
o A1, B1 en C1 nemen deel in een equivalentie class. Dit wordt enkel gezegd wanneer
symmetrische en transitieve relaties geobserveerd zijn
 Symmetrie/ symmetrische relatie= een niet bekrachtigde, bidirectionele relatie tussen twee
stimuli waarbij een individu antwoord op de ene stimuli in termen van de andere stimuli
o Als A=B, dan B=A
 Equivalentie relatie is een verkregen, niet bekrachtigde relatie waarin wee of meer stimuli
relaties met elkaar combineren
o Als A=B en A=C dan B=C en C=B
95
 Relevantie voor taal
o We veranderen de abstracte vormen naar meer gekende objecten
o
 Coherent met antwoorden op arbitraire stimuli
 Onmiddellijk verkrijgen van niet bekrachtigde relaties tussen gebeurtenissen
(nieuwigheid en generativiteit)
 Consistent met de overeenkomsten van een verbale samenleving
o Het woord ‘hond’ doet meer dan enkel refereren naar het geluid ‘hond’ of het beeld van
een hond
o Het heeft een psychologische inhoud of betekenis (bv. adoratie, paniek)
o De transfer van stimulus functie
 De component van stimulus equivalentie dat de psychologische significantie geeft
 Definitie: wanneer een stimulus in een equivalente klas een gedragsmatige functie
verwerft, dan zullen andere stimuli deze respons uitlokken/ ontlokken zonder enige
bekrachtiging
 Bv. geconfronteerd worden met een beeld van een hond wordt gepaard met de
perceptuele functie van een hond te zien. Dit wordt overgedragen naar het woord
‘hond’ welke het beeld van de hond ontlokt
 Bv. als een kind ooit gebeten wordt door een hond en hierdoor angst opwekt bij het
zien van een hond, kan dit overgedragen worden en leiden tot angst bij het lezen van
het woord ‘hond’
 Dit is gedemonstreerd geweest door een serie van studies
 Dit vangt adequaat hoe taal gedrag kan controleren (bv. iemand gaat bordjes ‘beware
of dog’ vermijden)
o Noot: dit is van kritiek belang om de etiologie van angststoornissen en specifieke fobieën te
begrijpen
 Enkel 50% van de mensen met specifieke fobieën rapporteren een directe ervaring.
 Er is dus een substantiële hoeveelheid van verkregen fobieën door een verbale
gebeurtenis
o Wordt dit een symbolisch/ verbaal gedrag?
 Stimuli kunnen indirect verwijzen naar een andere gebeurtenis door een verkregen
equivalentie relatie
 Stimuli kunnen ook de referent met betekenis RE- presenteren. Dit is de transfer van
stimulus functie
 Conceptuele correlaties tussen stimulus equivalentie en taal
o Arbitraire stimuli kunnen makkelijk gerelateerd raken aan elkaar (abstracte natuur van taal)
o Deze relaties kunnen verkregen worden zonder voordien bekrachtiging te krijgen
(generativiteit en nieuwheid van taal)
o Dit kan tellen voor de psychologische betekenis van verbale stimuli door de transfer van
stimuli functie
 Ontwikkelingscorrelaties: evidentie voor links tussen stimulus equivalentie en taal
o Stimulus equivalentie kan gebruikt worden om een collectie van betekenisvolle woorden
aan te leren
 Bv. Sidman (1971) en Sidman & Cresson (1973)
96
 Ze gebruikte MTS om de verbale mogelijkheiden van volwassen met intellectuele
achterstand te doen toenemen
 Wanneer proefpersonen het woord ‘auto’ horen volgt ofwel het geschreven woord
‘auto’ of een beeld ervan
 Daarna zien we dat de proefpersonen het woord ‘auto’ en het beeld van de auto aan
elkaar kunnen koppelen
 Dit proces is herhaald met verschillende geluiden, woorden en objecten
 En er werd essentieel een basis verbaal repertoire gevestigd
o Kinderen met taalstoornissen vertonen geen stimulus equivalentie
 Devany, Hayes, e.a.
 Kinderen worden gematched voor chronologishce leeftijd (2-3 jaar)
 3 groepen
 Normale ontwikkeling
 Ontwikkelingsachterstand met normaal taal mogelijkheden
 Ontwikkelingsachterstand met abnormale taal mogelijkheden
 Kinderen worden blootgesteld aan MTS paradigma
 Ze worden getraind en getest voor twee equivalente klassen A=B=C en D=E=F
 Er wordt gebruik gemaakt van nonsens items zodat er geen perceptuele gelijkenissen
mogelijk zijn
 Resultaat: enkel kinderen met taal mogelijkheden konden stimulus equivalentie (zowel
de symmetrische als de equivalentie relaties) demonstreren
 [ kinderen met ontwikkelingsachterstand maar met normale taalmogelijkheden
hebben wel meer trials nodig om het verband aan te leren dan normale kinderen]
o Stimulus equivalentie correleert met het optreden van verbale vaardigheden
 Barnes et al.
 Kinderen worden onderverdeeld in 3 groepen
 Normaal ontwikkelde 3-4-jarigen met normale verbale mogelijkheden
 Mild tot erg dove kinderen van 7-8 jaar met verbale mogelijkheden boven de 2 jaar
 Mild tot erg dove kinderen van 4-5 jaar met verbale mogelijkheden onder de 2 jaar
 De sleutel variabelen waren
 De verschillende niveaus van verbale mogelijkheden: normaal, boven de 2 jaar,
onder de 2 jaar
 De aan-/afwezigheid van onmogelijkheid: normaal horen of ingrijpend doof
 De kinderen worden getest voor 2 equivalentie klassen: A1=B1=C1 en A2=B2=C2
 Gebruik gemaakt van nonsensitems
 Enkel de kinderen die verbaal boven de leeftijd van 2 jaar stonden waren capabel
om stimulus equivalentie te tonen
o Het maakt niet uit of het kind al dan niet doof was, enkel de verbale
capaciteit was van belang
 Ontwikkelingsstudies duiden om een associatie tussen stimulus equivalentie en taal maar wat is
de natuur ervan- 3 mogelijkheden
o Taalvaardigheden gaan vooraf aan de observatie van stimulus equivalentie
 Performantie op MTS is te wijten aan eerder bestaande taal vaardigheden
 Horne en Lowe
o Stimulus equivalentie is een gedrag dat voorafgaat aan taal
 Is stimulus equivalentie een gedragspatroon welke leidt tot taalmogelijkheden?
 sidman
o Taal en stimulus equivalentie zijn hetzelfde, welke opkomen van een particuliere leer
geschiedenis
 Stimulus equivalentie en taal zijn synoniem
 Relation frame theory
97
4. theorieën van stimulus equivalentie
4.1 Murray Sidman’s benadering
 Vanuit deze benadering is stimulus equivalentie een basis gedragsmatig fenomeen dat
noodzakelijk is voor taal
 Heeft een nogal gedetailleerde interpretatie
 Stimulus equivalentie is een fundamentele gedragsmatige gebeurtenis. Het is een nieuwe
grondstelling in het veld van gedragspsychologie
 In deze mate is het verwant met bekrachtiging, discriminatie, extinctie, habituatie, straf,… (de
wetten van gedragspsychologie)
 En daarom is stimulus equivalentie een noodzakelijke voorwaarde voor het optreden van taal
 Stimulus equivalentie is een fundamenteel gedragsmatige gebeurtenis
o Zoals de capaciteit om gedrag bekrachtigd te hebben, stimuli te discrimineren en
habitueren aan een US,…
o Sidman stelt dat stimulus equivalentie gekomen is door de evolutie van soorten (essentieel
is stimulus equivalentie evolutionair gegeven)
o Maar dit is in conflict met twee hoofdobservaties
 Stimulus equivalentie is nog niet eerder geobserveerd in andere niet menselijke dieren
 Als stimulus equivalentie een evolutionaire trek is, dan moet het observeerbaar
zijn in andere niet- menselijke soorten
 Chimpansees en andere primaten die capabel zijn om objecten te identificeren,
vertonen geen equivalentie
 Stimulus equivalentie is nog niet voorgekomen in lagere zoogdieren (bv. ratten,
duiven,…) ondanks substantiële pogingen
 Ontwikkelingsevidentie suggereert dat stimulus equivalentie ontwikkeld in kindertijd
en niet ‘gegeven’ is
 Longitudinaal onderzoek heeft aangetoond dat equivalentie ontstaat in de
kindertijd
o Symmetrische relatie kunnen ontstaan rond 17 maand
o Dit vindt plaats voor het ontstaan van transitieve relaties
 Huidige programma’s trachten kinderen te trainen om equivalentie relaties tussen
stimuli te verkrijgen
o Essentieel kan equivalentie als gedrag verworven wordt
 Alles samen suggereert evidentie dat Sidman’ s postulatie incorrect is
4.2 relational frame theory [RFT] (Steve Hayes)
 Stimulus equivalentie is synoniem met taal
 En dit is een geleerd gedrag gevormd door een particuliere geschiedenis van bekrachtiging in
een verbale gemeenschap
 RFT is een expansieve en brede gedragstheorie welke tracht complexe problemen, zoals taal
en cognitie aan te pakken
 Het postuleert niet dat stimulus equivalentie een fundamenteel gedragsmatige gebeurtenis is
 Het is daarentegen hoog beïnvloed door het geobserveerde optreden van stimulus
equivalentie in de kinderjaren
 Het staat in dienst van het concept van operant gedrag om rekening te houden met stimulus
equivalentie
 Daarbij worde stimulus equivalentie gezien als functioneel equivalent aan taal
 Taal en stimulus equivalentie is het zelfde
 RFT suggereert dat stimulus equivalentie een algemeen operante respons is
o SD (antecedente gebeurtenis) ; R (respons)SR (consequent)
o Dus stimulus equivalentie is onder de functionele controle van
 Consequente gebeurtenissen welke het vorm geven
98
 En antecedente gebeurtenissen welke de productie ervan controleren
 Tijdens de kindertijd worden specifieke naam-object en object-naam relaties aangeleerd
o “waar is de bal?”aanwijzen
o “wat is dit””bal”
o Juiste antwoorden worden beloond door verzorgers “good zo”
o Dit wordt vooraf gegaan door specifieke cues (bv. ‘is’ ‘hetzelfde als’ ‘dit’)
o Deze vorm van matching herhaald zich in herhaald leren met veel items in veel leer
ervaringen
o Na herhaalde leer mogelijkheden zijn bepaalde antwoordpatronen gevorm en bekrachtigd
in de aanwezigheid van ‘zoals’
o Dus cues controleren symmetrie en equivalentie antwoorden
 Stimulus equivalentie vanuit RTF perspectief is
o Een puur functionele, operante respons
o Geabstraheerd binnen een socio- verbale samenleving
o Welke toepasselijk gemaakt wordt door contextuele cues
99

Samenvatting leerpsychologie

Related documents

Products

Support

Samenvatting leerpsychologie

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib