Samenvatting leerpsychologie 1. basisconcepten en definities 1.1 fundamentele functies van leren Leren is één van de fundamentele karakteristieken van gedrag Het gaat zowel om intentioneel, bewust leren al som incidenteel, onbewust leren Leren wordt geïdentificeerd door een verandering in gedrag o Veel (maar niet alle!) instanties van leren verijzen het verwerven van nieuwe responsen. De verandering in gedrag welke gebruikt wordt om leren te identificeren kan een toename of een afname zijn van een particuliere respons o We kunnen leren iets niet te doen 1.1.1 leren en andere vormen van gedragsveranderingen Niet alle instanties waar gedrag gewijzigd wordt, zijn instanties van leren Leren is relatief duurzame gedragsverandering o Oorzaken van tijdelijke gedragsverandering (≠ leren) Vermoeidheid Tijdelijke veranderingen in fysiologische/ motivationele toestanden Tijdelijke veranderingen in omgevingsstimuli o Eens iets geleerd is, zal het herinnerd blijven voor een substantiële periode in de tijd Leren is een relatief duurzame gedragsverandering veroorzaakt door specifieke ervaring o Andere oorzaken van relatief duurzame gedragsverandering= Maturatie Maturatie vereist geen oefening of ervaringen die specifiek in verband staan met het geleerde gedrag De ervaring/ oefening bij leren kan variëren van éénmalig (on trial learning) tot erg veel maar is wel noodzakelijk om van leren te kunnen spreken Hetzelfde maturatie proces kan gedragsveranderingen produceren in een variëteit van situaties Gedragsveranderingen veroorzaakt door leren zijn relatief specifiek/ beperkt tot het geleerde gedrag (MAAR er is wel enige mate van generalisatie mogelijk naar gelijkaardige situaties/gedragingen) o Andere oorzaak van relatief duurzame gedragsverandering= Evolutie Net zoals bij leren zijn gedragsveranderingen door evolutie het resultaat van interacties met de omgeving Evolutionaire veranderingen gebeuren voer generaties heen, leren vindt plaats binnen het leven van 1 individu Leren is zelf wel een product van evolutie Leren is een relatief duurzame verandering in het gedragspotentieel o Afwezigheid van performantie/ gedragsverandering wil niet zeggen dat er niet geleerd is o Veranderingen (leren) kan alleen tot uiting komen in bepaalde condities 1.1.2 leren, prestatie en niveaus van analyse Alleen door een verandering in gedrag op te merken, kan er besloten worden dat er leren optrad. o De verandering is alleen evident onder speciale omstandigheden o Leren kan behaviorally silent zijn (= geen zichtbare gedragsmanifestatie hebben) o Performantie= de observeerbare acties die een individu doet. Leren is één van de factoren die performantie determineren Leren vereist een verandering in het potentieel om iets te doen 1 o Gedrag wordt gereguleerd door zenuwsysteem. Dus leren betreft een duurzame verandering in de neurale mechanisme van gedrag Gevolg: leren kan bestudeerd worden op verschillende niveau Moleculaire veranderingen in zenuwcellen of neuronen Veranderingen in neurotransmittersysteem en neuronale circuits geassocieerd met leren Veranderingen in het gedrag van het gehele organisme Drie fundamentele types van ‘ervaring’ o Ervaring met een prikkel/ gebeurtenis op zich Louter herhaald blootgesteld worden aan een bepaalde prikkel Habituatie/ sensitisatie o Ervaring met de relatie tussen twee prikkels/ gebeurtenissen S-S leren Klassieke/ pavloviaanse conditionering o Ervaring met de relatie tussen het eigen gedrag en de consequenten in de omgeving Operante conditionering Effecten van de eigen acties op de omgeving 1.1.3 een definitie van leren leren is een relatief duurzame verandering in het potentieel om een bepaald gedrag te stellen, die toe te schrijven is aan ervaring met gebeurtenissen in de omgeving die specifiek gerelateerd zijn aan dat gedrag. 1.2 naturalistische vs. experimentele observaties naturalistische observatie: observeren en meten van gedrag zoals het verschijnt onder natuurlijke omstandigheden, in de afwezigheid van interventies/ manipulaties door de onderzoeker o kan nooit antwoord geven op oorzaken van gedrag(verandering), enkel hypothesen genereren o beschrijvend/ correlationeel/ differentieel onderzoek experimentele observatie: meten van gedrag onder condities die speciaal ontworpen zijn door de onderzoeker om particuliere factoren/ variabelen te testen welke het leren of de performantie van het gedrag zouden kunnen beïnvloeden o kan leiden tot causale uitspraken o MAAR de oorzaak van gedrag kan niet rechtstreeks geobserveerd worden Moeten geobserveerd worden door verschillen in het gedrag in verschillende experimentele condities Causale conclusies zijn inferenties gebaseerd op een vergelijking van twee ( of meer) experimentele condities 1.3 het fundamentele leerexperiment Kritiek aspect van onze definitie is dat leren een resultaat is van het verleden. Om te besluiten dat leren plaatsvond, moeten we zeker zijn dat de verandering in gedrag veroorzaakt is door een ervaring in het verleden Werken met (minstens) 2 groepen: experimentele en controle groep o Zijn gelijkgesteld op alle ( persoon/ omgeving)variabelen o Experimentele groep krijgt kritische leerervaring (OV) op een bepaald moment (T) o Verandering in gedrag (AV) wordt in beide groepen gemeten op moment (T+1) en vergeleken met elkaar 2 1.3.1 het controle probleem in studies over leren Adequate controlegroep is essentieel Gevolg 1: leren kan niet onderzocht worden in een naturalistische observatie Gevolg 2: controle groep moet op alle punten gelijk zijn aan experimentele groep, behalve wat betreft de kritische onafhankelijke variabele Gevolg 3: meestal wordt er gebruik gemaakt van een between subject design, soms ook van een within subject design (vooral in Skineriaanse traditie) o Visuele voorstelling: zie Blz. 11 1.3.2 de algemene proces benadering voor de studie van leren Assumptie: dezelfde fundamentele leerprocessen zijn aan de orde in een veelheid van leertaken/ situaties, en dit in principe bij alle diersoorten Assumptie: er bestaan een aantal universele leerwetmatigheden ! ontkent niet dat er bij verschillende leertaken of bij verschillende diersoorten verschillende soorten prikkels/ responsen kunnen zijn of dat bepaalde leertaken relatief moeilijker/ makkelijker kunnen verlopen Algemene regels van leren kunnen ontdekt worden door eender welk soort of eender welk gedragssysteem welke leren vertoont, te bestuderen 1.3.3 het gebruik van niet menselijke subjecten in onderzoek naar leren Voordelen: o Betere kennis en controle over leergeschiedenis o Betere precisie en controle over leeromgeving en leertaak o Herhaald testen/ trainen is goed mogelijk (zelfde individu observeren in zelfde omstandigheden) o Kennis en controle over genetica o Grotere controle over motivationele factoren welke het leren kunnen beïnvloeden o Betere kans om de invloed van taal te minimaliseren o Minimale invloed van vraag effecten Inadequate alternatieven o Observationeel (veld) onderzoek: geen controlegroep o Studies op planten: hebben geen zenuwsysteem o Studies op weefselculturen: kan interessant zijn, maar zonder gedragsmatig onderzoek met intacte organismen, kan men niet determineren wat het belang is van een bepaald celulair proces o Computersimulaties : er zijn vele observaties nodig voordat men een goede pc simulatie kan maken 2. De structuur van ongeconditioneerd gedrag 2.1 shaping en homogene vs. heterogene substraten van gedrag Door middel van shaping kan een organisme zijn gedrag geleidelijk aan veranderd worden zodat het nieuwe responsen kan uitdrukken Analogie: klei boetseren tot het gewenste object gebeurt ook stapje voor stapje (klei is homogeen substraat dat in eender welke richting vervormd kan worden) Gedrag is een heterogeen substraat: veranderingen in gedrag vinden plaats in de context van genetisch geprogrammeerde predisposities die ervoor zorgen dat bepaalde veranderingen makkelijker plaatsvinden Alle instanties van leren reflecteren een interactie tussen de training procedure en het reeds bestaande gedrag van het individu 3 2.2het concept van de reflex De kleinste eenheid van ongeconditioneerd gedrag is de reflex Descartes: belangrijke aspecten van het menselijke leven zijn vrijwillig. Daarnaast zijn er schijnbaar automatische en onvrijwillige reacties wat hij bestempelt als een reflex o Analogie met ‘bewegende standbeelden’ o Onvrijwillige reacties op bepaalde stimuli zijn voorbeelden van uitgelokt gedrag o Reflexboog: het volledige geheel van stimulus input naar respons output. Ontlokkende prikkel wordt via een receptor cel waargenomen en via een sensorieel (afferent) neuron doorgestuurd naar een inter neuron. Deze stuurt de info naar efferente neuronen (motorisch neuron) dat via de effector zorgt voor een ontlokte respons Visuele voorstelling: blz. 18 o Reflexen zijn betrokken in vele aspecten van gedrag die nodig zijn om noodzakelijke levensfuncties te hand haven 2.3 complexe vormen voor uitgelokt gedrag Reflexen gelden niet enkel voor de elementaire regulatie van vitale levensfuncties. Maar ook voor complex gedrag en complexe sociale interacties Vaak gaat het om complexe sequenties van specifiek ontlokkende prikkels en specifieke responsen Bv. Paargedrag stekelbaars o Mannetje bouwt nesttunnel in territorium o Andere mannetjes in de buurtaanval o Vrouwtje in territoriumzigzag zwemmen o Vrouwtje volgt mannetje naar tunnel o Vrouwtje in tunnel: mannetje raakt staart vrouwtje aan o Vrouwtje legt eitjes in tunnel o Mannetje bevrucht de eitjes en jaagt vrouwtje weg o !! als de reactie van 1 van de 2 faalt in het uitlokken van de volgende respons bij de partner, dan is de sequenties van acties verstoord en beëindigd de sociale interactie 2.3.1 modale actie patronen (MAP) Lijkt op een reflex, maar is complexer vermits er verschillende spiergroepen bij betrokken zijn Aangeboren patronen van ontlokt gedrag die specifiek zijn voor een bepaalde soort Eerder actiepatronen ipv responses ( want niet beperkt tot 1 spierbeweging) Modaal: meeste leden van de soort vertonen het actiepatroon op erg gelijkwaardige wijze Soort specifiek gedrag 2.3.2 signaalprikkels MAP treedt op in de context van rijke/ complexe prikkelcondiguraties Signaalprikkels: de beperkte set van cruciale prikkelkenmerken van de complexe ontlokkende prikkelconfiguratie, die noodzakelijk en voldoende zijn om een modaal actiepatroon te ontlokken o Vaak een opvallend klein deeltje van de cues die normaal een actiepatroon zouden uitlokken Bv: kop en nek van vrouwelijke kwartel is signaalprikkel voor seksuele benadering door mannetjes kwartel o De visuele cues van het rest van het lichaam, bewegingscues, auditieve, olfactieve of tactiele cues zijn onbelangrijk Bv.: de punt vorm van de bek en de rode stip op de bek van de moeder is signaalprikkel voor de pikrespons op de bek door de kuikens bij meeuwen 4 o De vorm van de kop, de ogen, geluiden,… zijn onbelangrijk 2.4 de organisatie van uitgelokt gedrag Uitgelokte gedragingen gebeuren niet onafhankelijk van elkaar. Ze zijn georganiseerd op speciale manieren. De organisatie kan het gevolg zijn van aangeleerde of niet- aangeleerde factoren 2.4.1 motivationele factoren Cruciaal in de coördinatie van Modale actiepatronen is de interne status van het organisme Hydraulisch model (Lorenz): motivationele toestand brengt het organisme in gereedheid voor een bepaald soort MAP. Een signaalstimulus triggert dan het MAP tegen deze achtergrond o Bepaalde factoren leiden tot de opbouw en ontlading van een bepaald type motivatie/ drive Bv. Verbruik van energie en voedingsstoffen doet de honger drive toenemen De aandacht voor signaalstimuli verhoogt en de drempel voor de activering van voeding gerelateerde Maps verkleint De MAP tot eten wordt ontlokt waardoor de honger drive afneemt 2.4.2 appetitieve en consumatorisch gedrag Betreft een sequentiële organisatie: Appetitief gedrag bestaat uit activiteiten die het organisme toelaten om in contact te komen met signaalprikkels die het modale actiepatroon zullen ontlokken welke op hun beurt zorgen voor het beëindigen van de responssequentie Appetitief gedrag: exploreren van de omgeving naar voedselbronnen o Variabel gedrag welke optreedt als reactie op algemene spatiale cues o Betreft een brede reeks van mogelijke activiteiten Consummatorisch gedrag: beëindigen de respons sequentie omdat ze de motivatie beëindigen 2.4.3 gedragssystemen Timberlake: voeding- gedragssysteem bestaat ui meer dan 2 (appetitief- consummatorisch) componenten o Algemene zoekmodus: het dier reageert op algemene kenmerken van de omgeving met reacties die toelaten om in contact te komen met verscheidenheid aan potentiële voedselbronnen o Focale zoekmodus: focussen op een specifiek aspect van de omgeving o Hanteren en opeten van voedsel (= Consummatorisch gedrag) Gedragssystemen zijn beschreven voor een variëteit van verschillende functies die organismen hebben om te slagen in hun leven Kenmerken o Bestaan vaak uit sequenties van 3 of meer gedragsmodi o De sequentie van respons modi is lineair (men gaat van de ene respons naar de andere, zonder er eentje over te slaan) o De sequentie is bi-directioneel o Elke respons modi vereist specifieke responsen en een toegenomen aandacht/ sensitiviteit voor specifieke prikkels Dergelijke georganiseerde gedragssystemen werden beschreven in een veelheid van domeinen (bv. Voortplanting, voeding, zorg voor jongen,…) Leren ent zich op dit complexe, heterogene en georganiseerde substraat van ongeconditioneerd gedrag, bestaande uit eenvoudige reflexen, meer complexe modale actiepatronen, en sequentieel georganiseerde gedragssystemen 5 3. Habituatie en sensitisatie Inleiding Meest voorkomende en eenvoudigste vormen van gedragsverandering Ze kunnen optreden in alle meer complexe procedures Meest bestudeerd in reflex systemen o Descartes: reflexen hebben 2 hoofdkenmerken De kracht van de ontlokkende respons is direct gerelateerd aan de intensiteit van de ontlokkende stimulus Een reflexmatige respons zal altijd optreden wanneer de uitlokkende stimuli aanwezig is o MAAR reflexen blijken niet altijd met dezelfde intensiteit op te treden (uitgelokt gedrag kan flexibel zijn) Habituatie en sensitisatie reguleren onze reflex responsen en doen de efficiëntie toenemen van onze interacties met de omgeving o Bv. oriënteringsrespons: we richten ons naar nieuwe stimuli, maar als alle stimuli in de omgeving onze aandacht zouden trekken, vereist dat teveel inspanning Habituatie en sensitisatie zijn de eerste principes van gedragsorganisatie gebaseerd op ervaring 3.1 algemene principes van regulatie Iets wordt gereguleerd wanneer zijn functies gehandhaafd worden binnen acceptabele limieten of binnen een vastgelegd doelbereik (=homeostatisch niveau) Om een systeem te handhaven binnen een bepaald bereik, moeten krachten die het systeem in de ene richting duwen, tegengegaan worden door krachten die het systeem terug naar het vereiste homeostatisch niveau brengen. Regulatie wordt bekomen door de activatie van opponenten processen o Habituatie en sensitisatie zijn tegengestelde processen welke de intensiteit van het uitgelokt gedrag regelen Opponente- proces theorie van motivatie/ emotie (Solomon) o Emotionele reacties zijn vaak tweefasig: primaire reactie/ toestand gevolgd door tegenovergestelde secundaire reactie/ toestand o Bij herhaling wordt de primaire reactie zwakker, de secundaire reactie wordt sterker. (bv. Alcohol, sauna,…) o A proces: treedt onmiddellijk op Sterkte is functie van intensiteit ontlokkende prikkel Eindigt snel na aanbieding prikkel o B proces: Eerst traag, zwak en relatief kortdurend Blijft tijdje aanhouden na aanbieding prikkel Wordt door oefening sneller, intenser en duurzamer Wordt terug trager, zwakker, relatief kortdurend bij gebrek aan oefening 3.2 effecten van herhaalde presentatie van een uitlokkende stimulus Exp. Zie blz. 31 o Langer kijken naar complexe patronen o Bij het eenvoudige patroon treedt habituatie op ( afname aandacht) o Bij het complexe patroon treedt eerst sensitisatie op en vervolgens habituatie Habituatie effect: afname in de sterkte of de probaliteit van een respons ten gevolge van herhaalde aanbieding van de ontlokkende prikkel 6 Sensitisatie effect: toename in de sterke/ probaliteit van een respons ten gevolge van herhaalde aanbieding van ontlokkende prikkel Exp.: startle respons o = plotse beweging veroorzaakt door sterk, nieuw geluid o Bij herhaalde aanbieding van het plotse geluid, treedt er habituatie op Hoe intenser de stimuli, hoe moeilijk om er aan gewend te geraken Stimulus generalisatie van habituatie: habituatie effect is overgedragen naar nabijgelegen locaties 3.2.1 karakteristieken van habituatie effecten Effecten van stimulus verandering o Habituatie is specifiek voor de particuliere stimulus welke herhaaldelijk aanwezig was o Als er een nieuwe stimulus aanwezig is, zal de gehabitueerde respons herstellen o Er is dus sprake van stimulus specificiteit o Stimulus generalisatie van habituatie: het habituatie effect wordt overgedragen naar andere prikkels die sterk lijken op de oorspronkelijke prikkel o Exp.: blz. 34 o ! vermoeidheid is dus niet de oorzaak van habituatie: als vermoeidheid een rol speelt, zou er geen nieuw habituatie proces optreden bij het aanbieden van een nieuwe stimulus Effecten van time-out van stimulatie o Habituatie effecten zijn vaak temporeel o Spontaan herstel: als de stimuli niet meer gepresenteerd wordt, verdwijnt het habituatie effect o De mate van spontaan herstel is afhankelijk van de grote van het tijdsinterval zonder prikkelaanbieding ( hoe groter het tijdsinterval, hoe meer spontaan herstel) o Er treedt niet altijd spontaan herstel op! (bijvoorbeeld bij flavor neophobia) o Korte termijn habituatie: case waarin substantiële spontaan herstel optreedt Komen niet overeen met leren, want niet duurzaam o Lange termijn habituatie: case waarin substantieel spontaan herstel niet optreedt Komt overeen met leren o Deze twee vormen zijn niet mutueel exclusief: ze kunnen tegelijk plaatsvinden Effecten van stimulus frequentie o Frequentie van eens stimulus refereert naar hoe vaak de stimulus herhaald wordt binnen een bepaalde tijd o Hoe hoger de frequentie, hoe korter de periode van rust tussen de herhalingen. Dus minder kans op spontaan herstel Effecten van stimulus intensiteit o Hoe intenser de stimuli, hoe minder kans op habituatie Effecten van blootstelling aan een tweede stimulus o Habituatie wordt niet alleen getermineerd door de uitlokkende stimulus. Het niveau van reageren wordt ook beïnvloed door andere stimuli welke het organisme ervaart o Dishabituatie: blootstelling aan een tweede stimuli kan resulteren in het herstel van een voordien geleerde habituatie respons o Exp. Blz. 37 Steeds minder visuele aandacht voor schaakpatroon Schaakpatroon+ geluid aanbieden: terug langer kijken naar patroon (!! Dus niet richten op geluid) 7 3.2.2 karakteristieken van sensitisatie effecten Hoe intenser de prikkel, hoe meer sensitisatie Hoog frequente aanbieding leidt tot snellere sensitisatie dan laag frequente aanbiedingen Korte termijn sensitisatie: resultaat van tijd zonder stimulatie (respons daalt na verloop van tijd) Lange termijn sensitisatie: sensitisatie is evident zelfs na een aanvaardbare periode zonder stimulatie (respons blijft stijgen) Veel minder prikkel specificiteit 3.3 de duale proces theorie van habituatie en sensitisatie Groves en Thompson Onderscheid tussen onderliggende processen en observeerbare fenomenen o Habituatie en sensitisatie fenomeen: performantie effect o Habituatie en sensitisatie proces: refereert naar de onderliggende gebeurtenissen die verantwoordelijk geacht worden voor de gedrag habituatie en sensitisatie effecten Gebaseerd op 2 onderliggende processen: sensitisatie en habituatie proces Actief in twee functioneel onderscheiden systemen in het zenuwstelsel: S-R systeem en Toestand systeem 3.3.1 het S-R systeem en het toestand systeem S-R systeem o Het kortste pad in het zenuwsysteem tussen een ontlokkende stimuli en het resulterende ontlokte gedrag o = reflexboog van Descartes o Bestaat uit 3 neuronen: sensorisch (afferent) neuron, inter neuron, motorisch (efferent) neuron Toestand systeem o Bestaat uit alle neuronale processen die niet zelf deel uitmaken van het S-R systeem, maar die de responsiviteit van het S-R systeem beïnvloeden o Opstijgende zenuwbanen naar en dalende zenuwbanen vanuit de hersenen o Moduleren de activiteit van het S-R systeem Habituatie proces vindt plaats in S-R systeem, sensitisatie proces in toestand systeem o Kunnen simultaan geactiveerd worden o Werken als opponente mechanismen o Het netto effect van beide processen bepaald het observeerbare gedrag Habituatie effect sterker dan sensitisatie daling in gedragsoutput Sensitisatie effect sterker dan habituatie toename in gedragsoutput o Zowel habituatie als sensitisatie zwakken af na verloop van tijd zonder bijkomende stimulatie 3.3.2implicaties van het de duale proces theorie S-R systeem is meest primitieve mechanisme van uitgelokt gedrag o Gevolg: wordt altijd geactiveerd wanneer een uitlokkende stimulus aanwezig is o Elke activatie van S-R systeem leidt tot opbouw van habituatie proces (dus habituatie is universeel kenmerk van ontlokt gedrag) o Of er een habituatie effect optreedt, is afhankelijk van de activatie van het toestandssysteem en het tijdsinterval sinds de laatste aanbieding van de prikkel Sensitisatie effect is niet universeel voor elk ontlokt gedrag o Enkel bij de aanbieding van erg intense of betekenisvolle prikkels wordt het toestand systeem geactiveerd o Farmaca of emoties kunnen invloed uitoefenen op toestand systeem 8 o Sensitisatie proces kan geactiveerd worden door een andere gebeurtenis dan de ontlokkende stimuli OF door de ontlokkende stimuli zelf Bv aanbieding luide toon activeert toestand systeem: sensitisatie proces stijgt. Sensitisatie wordt groter dan habituatie, dus visuele aandacht stijgt dishabituatie Zwaktes o Biedt geen adequate verklaring voor langer termijn habituatie, noch voor lange termijn sensitisatie effecten o Deze fenomenen veronderstellen ook vormen van associatief leren Sterktes o Kijkt naar verschillende patronen ( habituatie, sensitisatie) o Bekijkt de effecten van tijdsverloop o Effecten van stimulus frequentie o Prikkel specificiteit en generalisatie van habituatie o Dishabituatie o A- specificiteit van sensitisatie 4. Pavloviaanse conditionering: basis concepten Inleiding Associatief leren: wat we leren over combinaties van stimuli Leren voer de samenhang tussen gebeurtenissen/ prikkels in de omgeving waarbij de relatie zich voordoet onafhankelijk van het gedrag van het organisme Gedrag ontlokt door prikkel wijzigt hier ten gevolge van het samengaan van deze prikkel met een andere prikkel 4.1 pavlov zijn spreekwoordelijke bel Er wordt herhaaldelijk een bel aangeboden welke onmiddellijk gevolgd wordt door toediening van voedsel. o Aanvankelijk: enkel speekselsecretie bij toediening voedsel o Na verloop van tijd ook speekselsecretie bij de bel Basisterminologie o Voorwaardelijke prikkel (VP) =conditioned stimulus (CS) de bel o onvoorwaardelijke prikkel (OP)= unconditioned stimulus (US) voedsel o onvoorwaardelijke respons (OR)= unconditioned respons (UR) speekselsecretie door voedsel o voorwaardelijke respons (VP)= conditioned respons (CR) speekselsecretie door bel 4.2 hedendaagse pavloviaanse conditionering voorbereidingen 4.2.1 appetitieve conditionering procedure wordt vaak gehanteerd bij duiven en ratten procedure met duiven o duiven zijn gematigd uitgehongerd o gebruik gemaakt van skinner box o geconditioneerde stimulus: licht geprojecteerd op kleine plaat of respons sleutel boven het voederbakje o geconditioneerde procedure: het lichtje enkele seconden doen branden alvorens een kleine hoeveelheid voedsel te geven 9 o resultaat: na een aantal aanbiedingen, beginnen de duiven op de responssleutel te pikken van zodra het oplicht (ze blijven pikken zelfs wanneer ze geen voedsel meer krijgen dus er is sprake van niet doelgericht gedrag) het licht wordt een signaal voor voedsel o visuele voorstelling zie Blz. 48 hier is sprake van sign tracking= autoshaping: procedure met ratten o voorwaardelijke prikkel: toon/ lichtje op plafond o onvoorwaardelijke prikkel: voedsel o resultaat: het horen van de toon laat het hoofd van de rat bewegen ( head jerk)/ rat gaat op achterste poten staan om aan het lichtje te geraken o dus verschillende soorten VP kunnen verschillende soorten VR ontlokken, bij één zelfde OP 4.2.2 aversieve conditionering wordt vaak onderzocht door gebruik te maken van de oogknipper reflex procedure 1 o deelnemers: mensen, o VP: korte visuele of auditieve prikkel o OP: luchtstootje tegen het oog ( of licht elektrische prikkel in de buurt van het oog) o Respons: oogknipper reflex Procedure 2 o Deelnemers: konijnen, ratten o VP: toon of licht o OP: korte elektrische prikkel langs het rooster op de bodem van de kooi o OR: opspringen o VR: freezing ( volledig bewegingsloos zitten) o Visuele voorstelling zie Blz. 49 Geconditioneerde supressie o Fase 1: aanleren van stabiel (operant) gedrag: drukken op hendel leidt tot voedsel o Fase 2: klassieke vrees conditionering: toon (VP) leidt tot shock (OP) leidt tot freezing o Fase 3, testfase: aanbieden van de toon tijdens het operant gedrag o Resultaat: operant gedrag wordt onderdrukt, dier gaat freezen Supressieratio: o aantal responsen tijdens de toonprikkel/ ( aantal responsen tijdens toonprikkel+ aantal responsen voor het aanbieden van toonprikkel) o ondergrens= 0 (volledige supressie)zeer sterke pavloviaanse conditionering o bovengrens= 0,5 (geen supressie) geen pavloviaanse conditionering 4.3 de natuur van de conditionele respons 4.3.1 skelet vs. autonoom vegetatieve geconditioneerde reacties in de standaardprocedures wordt er voornamelijk gebruik gemaakt van skeletresponsen o sign tracking: skeletrespons o head jerk, rearing o oogknipper reflex maar pavloviaanse conditionering kan ook resulteren in rechtstreekse beïnvloeding van skelet responsen 4.3.2 gelijkenissen van geconditioneerd en ongeconditioneerde gedragingen soms zijn de VR en de OR gelijkend (identiek) aan elkaar (bv. oogknipperreflex) maar het kan even goed zijn dat VR helemaal niet lijkt op OR (bv. freezing vs. opspringen) 10 4.3.3 de gedragssysteem benadering de OP activeert het gedragssysteem dat relevant is voor de OP in kwestie o bv. voedsel activeert voedingssysteem, shock activeert defensiesysteem aard van de VR wordt bepaald door de manier waarop de VP geïntegreerd wordt in het gedragssysteem dat geactiveerd wordt door OP o voedingssysteem begint met algemene zoekmodus gevolgd door focale zoekmodus en opeten van voedsel als VP gepresenteerd wordt voordat het dier voedsel krijgt, zal de VP ingekapseld worden in één van de respons modi van het voedselgedragssysteem focale zoekmodus: toenaderingsgedrag (bv. sign tracking) consummatorische respons: hanteren van en bijten op de VP o defensiesysteem shock= externe bron van pijn, zoals gebeten worden door slang: recht springen lichtprikkel= een slang zien/ruiken: freezing 4.4 de inhoud van pavloviaanse associaties S-R leren: VP lokt VR direct uit o VP ontlokt VR rechtstreeks o OP is de oorzaak van associatief leren en van de gedragsverandering, maar wordt niet mee geëncodeerd S-S leren: VP activeert een representatie van de OP, welke de VR genereert o VP ontlokt de VR onrechtstreeks, via activatie van de representatie van de OP o OP wordt mee geëncodeerd o VP activeert de verwachting/ doet denken aan de OP o Als het resultaat van deze associatie, activeert de presentatie van de VP een neutrale representatie van de OP o Klassieke conditionering leidt tot het vormen van een associatie tussen de VP en OP visuele voorstelling zie Blz. 52 4.4.1 effecten van US devaluatie een krachtige techniek op het onderscheid te maken tussen S-R en S-S mechanisme de test impliceert het evalueren van de kracht van de VR nadat de motivatie om te reageren om de OP veranderd is o bij OP devaluatie wordt de motivatie verminderd procedure o visuele voorstelling zie Blz. 53 o fase 1: acquisitie seksuele pavloviaanse conditionering bij mannelijke kwartels VP= lichtprikkel OP= toegang tot en paren met een vrouwtje VR= toenaderingsgedrag tot de lichtprikkel o fase 2: OP devaluatie experimentele groep: seksuele motivatie doen dalen (devaluatie) controle groep: seksuele motivatie blijft gelijk o test VP S-R leren ( lichtjetoenadering) : verandering in motivatie mag geen invloed hebben op respons S-S leren (lichtjevrouwtjetoenadering): verandering in motivatie leidt tot verandering respons Resultaten tonen evidentie voor S-S leren ( vermits er daling is in toenaderingsgedrag) 11 4.4.2 effecten van US inflatie Motivatie doen stijgen Procedure 1 o Fase 1 acquisitie Smaak-smaak conditionering bij ratten VP: licht bittere smaak (kinine) OP: zout VR: drinken van bittere smaak oplossing o Fase 2: Op inflatie Inductie van sodium tekort waardoor de voorkeur voor zout gaat toenemen o Fase 3: test VP Hoeveel drinken de ratten van de kinine oplossing S-R leren: er zou geen effect mogen zijn S-S leren: er zou een toename moeten plaats vinden van het drinken De resultaten bieden evidentie voor S-S leren Procedure 2 o Fase 1 acquisitie Aroma- smaak conditionering bij mensen VP: neutraal fruitaroma OP: polysorbaat20 (erg slechte smaak) VR: lekker/slecht vinden van VP aroma o Fase 2: OP inflatie Aanbieding van erg hoge dosis polysorbaat20( valentie van OP veel negatiever maken) o Fase 3: test VP Er is geen invloed van de OP inflatie, wat wijst op S-R leren 4.5 stimulus factoren in klassieke conditionering 4.5.1 CS nieuwigheid en het latente inhibitie effect Herhaalde blootstelling aan een stimulus kan resulteren in habituatie effect. Dit maakt hoog gelijkaardige stimuli minder effectief in het uitlokken van sterke gedragsreacties Habituatie kan ook de effectiviteit van een stimulus verminderen die later gebruikt wordt als VP in een conditioneringsprocedure Procedure Latente inhibitie (= VP-pre exposure effect) o VP pre-exposure fase: Mensen in experimentele groep krijgen eerst herhaalde presentatie van de stimulus die later als VP aangeboden wordt (in controle conditie krijgt men dit niet) o VP-OP aanbiedingen o Test: de VP in de experimentele conditie is minder dan de VR in de controle conditie Meestal wordt dit effect verklaard in termen van een aandachtsproces o Tijdens de pre- exposure daalt de aandacht voor VP o Die verminderde aandacht verstoort het daaropvolgende leren van de VP-OP associatie = associatieve interferentie Geleerd om prikkel (toon) te negeren waardoor je er geen aandacht meer aan gaat schenken Na aanbieding van de shock wordt het moeilijk om het verband tussen toon en shock te leggen o Alternatief: geheugen interferentie ( eerst leer je dat VP ongevaarlijk is, daarna moet je leren dat dezelfde VP gevaarlijk is) 12 4.5.2 CS- US relevantie en selectieve associaties De OP activeert het gedragssysteem dat relevant is voor de OP in kwestie Elk gedragssysteem wordt gekenmerkt door specifieke responsen en een verhoogde aandacht/ sensitiviteit voor specifieke prikkels Procedure o Fase 1 Conditie 1: een smaak en een audiovisueel signaal wordt gekoppeld aan een shock Conditie 2: smaak en audiovisueel signaal wordt gekoppeld aan misselijkheid o Fase 2: test Smaak of audiovisueel signaal worden apart aangeboden, men onderzoekt de ‘likes’ o Resultaat: In de misselijkheid conditie is er meer afkeer voor smaak In de shock conditie is er meer afkeer voor audiovisueel signaal De effectiviteit van VP in pavloviaanse conditionering hangt van de OP die gebruikt wordt Het is essentieel om de VP-OP INTERACTIE te kunnen aantonen o VP1-OP1 > VP2-OP1 en tegelijk: o VP1-OP2 ≤ VP2-OP2 Instanties van selectief leren zijn niet absoluut (bv. de associatie toon- misselijk kan ook geleerd worden, maar is moeilijker) Gelijkenissen tussen VP en OP vergemakkelijken de vorming van de associatie 4.6 het controle probleem in pavloviaanse conditionering Het is cruciaal om aan te tonen dat de gedragswijziging ten opzichte van de VP causaal toe te wijzen is aan ervaring van een VP-OP relatie o Dus habituatie en sensitisatie effecten moeten uitgesloten worden VP alleen controleconditie: o Herhaald aanbieden van VP (zonder OP) o Controleert wel voor sensitisatie effecten door herhaalde aanbieding van VP op zich o Controleer niet voor sensitisatie effecten (of dishabituatie) door OP aanbiedingen OP alleen controleconditie o Herhaald aanbieden van OP (zonder VP) o Controleert voor sensitisatie effecten door herhaalde aanbieding van OP o Controleert niet voor sensitisatie effecten door herhaalde aanbiedingen van VOP Zuiver random controle conditie o Aanbieding van VP en OP, even frequent als in de experimentele conditie, maar het moment waarop ze aangeboden worden is at random en onafhankelijk van elkaar o Controleert voor effecten van herhaalde aanbieding van VP op zich en van OP op zich o Probleem: geen zuiver neutrale basislijn; sluit associatief leren niet uit Incidentiele VPOP aanbiedingen zijn niet uitgesloten Contextuele cues (bv. kooi) kunnen bron zijn van associatief leren Prikkelcompetitie: hoe meer contextconditionering, hoe minder ruimte voor toonconditionering ( toon zou zelfs deels een veiligheidssignaal kunnen worden) VP+/VP- discriminatieve controle o De helft van de VP aanbiedingen worden gevolgd door een OP, de andere helft worden getoond zonder gevolg te worden door OP o De VP+ en VP- beurten worden random toegewezen o Voor de ene helft van de profpersonen is VP+ een licht en VP- een toon, voor de andere helft is het omgekeerd o Associatief leren wordt enkel geïnterfereerd wanneer VRvp+ > VRvpo Controleert voor herhaalde aanbieding VP en herhaalde aanbieding OP op zich Niet gepaarde controle 13 o Aanbieding VP en OP even frequent als in experimentele conditie, maar VP en OP komen nooit samen voor o Controleert voor effecten van herhaalde aanbieding VP op zich en OP op zich o Maar VP kan inhibitorisch worden 4.7 prevalentie van pavloviaanse conditionering Klassieke conditionering is meest voor de hand liggend wanneer een gebeurtenis betrouwbaar optreedt kort voor een andere gebeurtenis Wordt vaak onderzocht in hoe mensen een bepaalde gebeurtenis beoordelen als de oorzaak van een andere gebeurtenis Drugs tolerantie en verslaving Kinderlijke en moederlijke reacties tijdens voeden Leren voer seksuele situaties 5. Stimulus relaties in pavloviaanse conditionering 5.1 temporele relaties tussen CS en US 5.1.1 simultane conditionering De VP en OP worden op het zelfde moment aangeboden Bevat perfecte temporele contiguïteit In veel gevallen biedt dit geen sterke evidentie voor conditionering 5.1.2 uitgestelde conditionering VP wordt in de tijd iets voor OP aangeboden en duurt minimaal tot het begin van de aanbieding van OP (dus geen leegte tussen OP en VP) Levert het sterkste conditioneringseffect op 5.1.3 spoor conditionering VP wordt in de tijd iets voor OP aangeboden, maar is niet meer aanwezig bij het begin van de aanbieding van OP Er is ene leeg interval ( trace interval) tussen VP en OP Leidt tot zwakkere conditionering dat bij uitgestelde conditionering ( ze vereisen een ander soort geheugen systeem) 5.1.4 effecten van CS- US interval Cruciaal voor associatief leren: hoeveel tijd zit er tussen het begin van de VP en de presentatie van de OP =inter stimulus interval Bijna geen evidentie voor leren bij simultane conditionering ( interval = 0) Meer evidentie bij uitgestelde conditionering (interval >0) o Vaak curvilineair verband: tot een bepaald interval stijg VR, daarna is er een progressieve daling van VR Hoe groter het interval wordt, hoe kleiner de evidentie voor leren Hoe snel de daling plaats vindt, is afhankelijk van het antwoord systeem dat geconditioneerd wordt o Oogknipperreflex: geen effect bij een interval van 0, stijging tot interval van 0,2 tot 0,5 daarna terug daling o Geconditioneerde suppressie: effect stijgt tot interval van ongeveer 2 minuten, daarna daling o Smaakaversie: effect stijgt tot bepaald uur voordat het begint te dalen 14 Leren over de langste intervallen wordt gezien bij smaak- aversie leren ( intervallen zijn daar een paar uur groot) o =lang uitgesteld leren (long delayed): representeert leren met VP-OP intervallen die een heel stuk langer zijn dan de intervallen welke geconditioneerde suppressie of oogknipper conditionering steunen. 5.1.5 temporele codering van US optreden Pavloviaanse conditionering is hoog sensitief voor tijd factoren Tijd is belangrijke determinant van ( de mate van) conditionering Maar tijd is ook iets waarover wordt geleerd in klassieke conditionering o = temporele code o Je leert DAT de OP komt maar ook WANNEER de OP komt 5.2 signaal relaties tussen CS en US = informationele relatie Geconditioneerde responsen ontwikkelen sneller met procedures waarin de VP betrouwbare informatie biedt over het optreden van OP. De VP fungeert als een betrouwbaar signaal voor de OP In typische uitgestelde conditionering o Elke VP wordt gevolgd door een OP (nooit VP alleen) o OP wordt steeds voorafgegaan door VP (nooit alleen) o Er is dus een perfecte statistische contingentie tussen het optreden van de VP en het optreden van de OP 5.2.1 CS/US contiguïteit en blocking effect Hoe kan de signaal relatie tussen VP en OP verstoort worden? o De VP aanbieden met een andere cue die de OP reeds voorspelt. De VP zal redundant zijn en er zal slecht een beetje conditionering plaats vinden o = Blocking effect Voorbeeld o Stel allergisch voor garnalen o Als je garnalen eet wordt je misselijk o Leidt tot aversie voor garnalen o Op een bepaald moment eet je garnalen samen met shitake, nadien weer misselijk o Gevolg: je verwerft geen aversie voor de Shitake Dus dat gene wat een individu leert over de VP wordt beïnvloed door de aanwezigheid van andere cues welke voordien geconditioneerd waren met de OP o Er bestaat al een goede predictor voor misselijkheid. Deze blokkeert het conditioneren van een nieuwe prikkel Experiment o Fase 1: perfecte contingentie tussen licht (VP) en schok (OP) o Fase 2: Perfecte contingentie tussen licht en schok Maar ook perfecte contingentie tussen toon en schok o Resultaat: geen ( of toch veel minder) conditionering op later toegevoegde toon prikkel (hoewel die even predictief is) DUS contingentie en contiguïteit zijn geen voldoende voorwaarden voor klassieke conditionering. De VP moet predictief zijn en niet redundant zijn!! 15 5.2.2 CS/US contingentie = de mate waarin de aanwezigheid van de ene stimulus kan dienen als basis om de andere stimulus te voorspellen Statistische contingentie tussen VP en OP kan worden uitgedrukt in termen van twee conditionele probaliteiten o P (OP │VP)= kans op het optreden van OP gegeven VP o P (OP│ geen VP)= kans op het optreden van OP gegeven geen VP o de verhouding tussen deze probaliteiten is een cruciale determinant van klassieke conditionering P (OP│VP) > P (OP│ geen VP): positieve contingentie o VP is predictor voor aanwezigheid OP o Exitatorische conditionering P (OP │VP) = P (OP│ geen VP): nul contingentie o VP voorspelt OP niet o Geen conditionering P (OP │VP)< P (OP │geen VP): negatieve contingentie o VP is predictor voor de afwezigheid van OP o Inhibitorische conditionering Zie cursus functieleer 2de bachelor / notities leerpsychologie voor berekeningen 5.3 hogere orde relaties in pavloviaanse conditionering: geconditioneerde inhibitie De focus ligt niet op hoe VP de OP voorspelt maar wel op hoe de VP informatie verschaft over de relatie van een tweede VP met de OP = modulatie van een eenvoudige VP- OP relatie [ VP2(VP1OP)] 5.3.1 inhibitorische conditionering procedures VP wordt een signaal voor de afwezigheid/ het niet optreden van een op basis van andere cues verwachte OP [ exitatorische conditionering: VP wordt signaal voor aanwezigheid OP] Standaard procedure o A= licht/ B= toon / OP = shock o A+ trials ( A wordt gevolgd door OP) worden afgewisseld met AB- trials (als A en B samen voorkomen, volgt er geen shock) o Op basis van A verwacht je OP o B wordt een geconditioneerde inhibitor (OP treedt niet op ondanks dat A aanwezig is) o In het algemeen geldt dat de exitatorische conditionering van A sneller verloopt dan de inhibitorische conditionering van B Negatieve VP-OP contingentie o P(OP │VP) < P (OP │ geen VP) o Context cues fungeren als exitatorische VP’ s die de verwachting van OP induceren o VP wordt een signaal voor het niet optreden van OP o Nalezen blz. 76 5.3.2 gedragsmatige manifestaties van geconditioneerde inhibitie Een exitatorische VP ontlokt de manifestatie van VR Een inhibitorische VP onderdrukt de manifestatie van VR Probleem: hoe moet je een ‘onderdrukte VR’ onderscheiden van ‘geen VR’ ( wordt in beide gevallen gedragsmatig op zelfde manier geuit) Summatie test o = op performantie gebaseerde test van inhibite 16 o VP+ is exitatorisch. Hiervan het effect nagaan en gebruiken als baseline o De effecten van inhibitorische stimuli ( VP-) nagaan door de VP+ en de VP- samen aan te bieden VP+ alleen aanbieden VP+ samen met VP- aanbieden VP+ met een neutrale prikkel (VP0) aanbieden o Als VP- inhibitorisch is, dan gaat de tweede conditie nul zijn o De derde conditie moet kleiner resultaat opleveren dan de eerste conditie, maar groter dan de tweede conditie Vertraagde acquisitie test o Gebaseerd op de assumptie dat de geconditioneerde inhibitorische eigenschappen zullen interfereren met de acquisitie van exitatorische eigenschappen van de stimulus o De geconditioneerde inhibitie zal het daaropvolgend verwerven van geconditioneerde excitatie bemoeilijken/ vertragen o Procedure: Fase 1: creëren inhibitor vs. neutrale prikkel Inhibitor groep: A+/ XA- training of een negatieve contingentie X-OP Controle groep: X niet aanbieden of X alleen aanbieden Fase 2: excitatorische training In beide groepen X-OP training Als X actieve inhibitor is, dan is de acquisitie trager dan wanneer X neutraal is 5.4 hogere orde relaties in pavloviaanse conditionering: geconditioneerde facilitatie Geconditioneerde facilitatie procedure is gelijk aan de standaard inhibitorische procedure omdat het 1 OP en 2 VP’ s betreft De stimuli worden zodanig aangeboden dat B aantoont of de A-OP relatie al dan niet geldig is Het enige verschil is dat bij inhibitie B voorspelt dat A-OP niet opgaat. Bij facilitatie voorspelt B dat A-OP wel opgaat 5.4.1 stimulus relaties in geconditioneerde facilitatie Directe B-OP relatie o B is de beste predictor van OP o A is irrelevant Door B gefaciliteerde A-OP associatie [B(A-OP)] o = hogere orde associatieve structuur o Positieve modulatie= positive occasion setting 5.4.2 onderscheid tussen B-US en B ( A-US) relaties Er is evidentie voor beide oplossingen Ze zijn niet mutueel exclusief Er zijn verschillende determinanten die een rol spelen, maar 1 belangrijke determinant is de tijdsrelatie tussen de twee VP’ s o Sequentieel: BA+/A- : hiërarchisch B(A-OP) o Simultaan: BA+ / A-: rechtstreeks: B-OP Hoe kan je onderscheiden of het om B-OP of B(A-OP) gaat? o Aard van de geconditioneerde respons Gebruik maken van het feit dat verschillende soorten VP’ s soms kwalitatief verschillende VR’ s kunnen ontlokken Bv. licht voedsel: key pecks / geluid voedsel: rondwandelen Dus key pecks zijn indicatie voor licht –OP associatie, niet voor toon-OP associatie 17 AB+/ B-= geluid+ lichtvoedsel / licht geen voedsel Observatie: key pecks bij geluid+ licht, niet bij alleen licht ( en ook geen ronddwalen) Je krijgt dus een B(A-OP) structuur: het geluid voorspeld dat het lichtje zal leiden doet voedsel o Effect van uitdoving (extinctie) feature B Als er sprake is van een B-OP relatie dan… (B-Geen OP) is een disconformatie van B-OP Doet VR op BA trials dalen en discriminatie van A/ BA dalen Als er sprake is van B(A-OP) relatie… (B-geen OP) is geen disconfirmatie van B(A-OP) ( disconfirmatie zou zijn: B(Ageen OP) Doet VR op BA trials niet teniet, en discriminatie A/AB blijft behouden 6. Theorieën van associatief leren Inleiding Van contiguïteit naar contingentie tussen VP en OP als noodzakelijke en voldoende voorwaarde voor leren Blocking effect: ondanks perfecte contingentie B-OP géén gedragsmatige evidentie voor leren B-OP relatie o Fase 1: tien keer toonshock US USCS 10 0 10 CS0 10 10 10 10 P(US|CS)= 10/10=1 P(US|CS-)=0/10=0 o Fase 2: tien keer toon+lichtshock US USCS 10 0 10 CS10 20 30 20 20 P(US|CS)= 10/10=1 P(US|CS-)= 10/30=.33 ! in beide gevallen hebben we positieve contingentie o Licht voorspelt shock niet! De ontdekking van het blocking effect stimuleerde een vlaag van theoretische inspanningen om associatief leren te karakteriseren o Eerste en meest invloedrijke= Rescorla- Wagner model o Snel opgevolgd door alternatieve modellen, die bepaalde tekortkomingen van RW model probeerden op te vangen Theorieën spelen een belangrijke rol in de wetenschap want ze helpen ons om verder te gaan dan het louter beschrijven/ catalogiseren van experimentele resultaten o Theorieën geven antwoorden op hoe en waarom vragen o Theorieën helpen om verschillende onderzoeksbevindingen samen te vatten en gidsen toekomstig onderzoek o Model of theorie creëren welke hypothetische constructen/ mechanismen gebruikt organisatie van en samenhangt tussen verschillende leerfenomenen predictie nieuwe bevindingen 18 6.1 het Rescorla- Wagner model Basis blocking effect o Fase 1: experimentele groep: AOP Controle groep: niets o Fase 2: beide groepen: (A+B)OP o Test fase: Bexperimentele groep: B is niet geconditioneerd Controle groep: B is geconditioneerd Waarom blokkeert de aanwezigheid van de voordien geconditioneerde prikkel A het ontstaan van geconditioneerd gedrag op B? o Kamin: US moet verrassend zijn om leren te induceren o A is reeds voorspeller van OP o Men verwacht dus het optreden van OP bij aanbieden van AB-OP trialsOP is dus niet verrassend geen vorming van een nieuwe BOP associatie Basis RW model: de effectiviteit van een ongeconditioneerde stimulus wordt bepaald door de mate waarin het verrassend is o Assumptie 1: iets is verrassend als het verschillend is van wat verwacht werd OP kan onverwacht groot/ sterk zijn: basisconditie voor excitatorisch leren en toename van associatieve sterkte OP kan onverwacht klein/zwak zijn: basisconditie voor inhibitorisch leren en afname van associatieve sterkte o Assumptie 2: OP-verwachting is gebaseerd op de (reeds verworven) associatieve sterkte van alle prikkels die op een gegeven trial aanwezig zijn (de OP voorafgaan) o Assumptie 3: Sterke VR= index van een sterke verwachting van OP Zwakke VR= index van een zwakke verwachting van OP ΔV = k (λ – V) o ΔV = verandering in associatieve sterkte van een prikkel op een trial o k = constante = leerparameter die functie is van de saliëntie van de VP en de OP o λ = asymptoot van leren voor bepaalde OP (= maximaal gesupporteerde associatieve sterkte) λ = 1 als OP aanwezig op trial, λ = 0 als OP afwezig o V = som van (reeds verworven) associatieve sterkte van alle VP’s aanwezig op een trial o (λ – V) = mate waarin OP verrassend is = mate van “verwachtingsdiscrepantie” Ook wel: ΔV = αβ (λ – V) o α = constante = leerparameter die functie is van de saliëntie van de VP o β = constante = leerparameter die functie is van de saliëntie van de OP o beiden variëren tussen 0 en 1 bv. indien slecht 1 VP-A [ A+ A+ A+] o ΔVA = αβ (λ – VA) o Eerste trial: ΔVA= 0.20 (1-0)= 0.20 VA=0 Dus (λ – VA) = (λ – 0)= groot (sterke onderpredictie) Dus ΔVA is groot sterke toename o Tweede trial: ΔVA= 0.20 (1-0.20) = .016 o Derde trial: ΔVA= 0.20 (1-0.36) = 0.128 [ 0.36=0.2+0.16] VA wordt groter Dus (λ – VA) is klein (zwakke onderpridictie) 19 Dus ΔVA is klein zwakke toename o verklaring typische acquisitiecurve (negatief versnelde curve) Bv. 2 VP’s (A en B) [AB+ AB+ AB+] o ΔVA = αAβ (λ – VAB) EN ΔVB = αBβ (λ – VAB) Waarbij VAB = VA + VB o Impliceert competitie tussen A en V voor de verwerving van associatieve sterkte, want de soms van VA + VB is maximaal λ o Stel αA = αB Trial 1: ΔVA = 0.20 (1-0) = 0.2 ΔVB= 0.20 (1-0)=0.20 Trial 2: ΔVA= 0.20 (1-0.4)= 0.12 ΔVB= 0.20 (1-0.4)=0.12 Trial 3: ΔVA= 0.20 (1- 0.64)=0.072 ΔVB= 0.20 (1- 0.64)=0.072 … leren stopt wanneer de som gelijk is aan 1. lopen ze gelijk dan stopt leren als VA=VB= .5 λ Overshadowing o Na A+ training zal VR op A groter zijn dan na AB+ training (B overschaduwt de acquisitie van A) o Verklaring RW: VAB=VA+VB= maximaal λ Bij AB+ training verwerft B ook associatieve sterkte o Dus bij simultane training met VPA en VPB zullen VA en VB steeds kleiner zijn dan wanneer VPA en VPB elk afzonderlijk worden getraind 6.1.1 applicatie van het blocking effect Fase 1: (VPA-OP training) o ΔVA = αAβ (λ – VA) o VA benadert asymptoot, dus VA = λ Fase 2: ([VPA + VPB]-OP training) o VB = 0 o ΔVB = αBβ (λ – VAB), waarbij VAB = (VA + VB) o Maar VAB = (λ + 0) = λ o Dus (λ – VAB) = (λ – λ) = 0 o Dus reeds correcte predictie door A, er zal dus geen conditionering van stimulus B plaatsvinden o En dus ΔVB = αBβ (λ – λ) = 0 In de controle groep is er nog geen voorspelling van A-OP. Daarom zal OP verrassend zijn, en zullen zowel A als B conditionering verwerven Unblocking kan optreden door een sterkere OP aan te bieden op de VAB trials o Fase 1: (VPA-OP training) met OP = λ ΔVA = αAβ (λ – VA) VA benadert asymptoot, dus VA = λ o Fase 2: ([VPA + VPB]-OP training) met OP = 2λ (bv. dubbel zo intense shock) VB = 0 ΔVB = αBβ (2λ – VAB), waarbij VAB = (VA + VB) VAB = (λ + 0) = λ Dus (2λ – VAB) = (2λ – λ) = λ Dus onderpredictie En dus ΔVB = αBβ (λ) géén blocking, VPB wordt excitatorisch 20 6.1.2 verlies van associatieve waarde ondanks paring met de OP Sommige predicties van RW model zijn contra intuïtief maar welk correct gebleken! Associatieve sterke van een prikkel kan in bepaalde omstandigheden afnemen ondanks bijkomende gepaarde aanbiedingen met OP Fase 1 o Stimulus A en B worden afzonderlijk aangeboden met OP tot ze beide volledig geconditioneerd zijn o VA=VB= λ : ze voorspellen beiden perfect de OP Fase 2 o A en B worden samen aangeboden gevolgd door OP o RW voorspelt dat de eigenschappen van de individuele stimuli A en B zullen afnemen o Door de training in fase 1 , gaan stimuli A en B beide perfect de OP voorspellen: VA = λ én VB = λ o In fase 2 gaan de afzonderlijke verwachtingen samengevoegd worden. Gevolg: VAB = VA + VB = (λ + λ) = 2λ = overpredictie o De verwachtingen van A en B moeten dus af gezwakt worden (verlies van associatieve waarde) tot VAB = VA + VB = λ 6.1.3 geconditioneerde inhibitie Standaard inhibitorische conditionering procedure o Trials waarbij de US aanwezig is en trials waarin die niet aanwezig is A+/ AB- training o Doel: op A- trials moet OP verwacht worden, op AB-trials moet OP niet verwacht worden o A moet excitatie verwerven en B moet inhibitie verwerven die voldoende sterk is om de excitatie van A om te keren op AB trials (zodat de verwachting op AB trials= 0) A+/AB- training op VPA-OP trials λ = 1 o ΔVA = αAβ (λ – VA) = positief o VPA verwerft excitatie = positieve associatieve waarde voor VA op (VPA + VPB)-géénOP trials λ = 0 o ΔVB = αBβ (λ – VAB) = αBβ (0 – VAB) = negatief o want VAB = (VA + VB) = (positieve waarde + 0) = positief, er is dus overpredictie o VPB verwerft inhibitie = negatieve associatieve waarde voor VB o VPA verliest deel van de reeds verworven excitatie Bemerk: opbouw (positieve) VA sneller dan opbouw (negatieve) VB o Onderpredictie (1 – VA) op bekrachtigde trials groter dan overpredictie (0 – VAB) op onbekrachtigde trials Stabiliseert als VA = λ en VB = -λ Uitgewerkt voorbeeld zie op slides 6.1.4 uitdoving van excitatie en inhibitie In een extinctie procedure wordt de geconditioneerde stimulus herhaaldelijk aangeboden zonder de US o Wanneer CS+ eerst aangeboden wordt zonder US in extinctie, zal er een overpredictie zijn van de US (VA is positief, max. λ) o Na herhaaldelijke presentatie van de CS zonder US, zal de verwachting gradueel bijgesteld worden in lijn met de afwezigheid van de US door graduele reductie van de associatieve waarde van se CS tot 0 Zodra extinctie begint: geen OP dus λ = 0 ΔVA = αAβ (λ – VA) = αAβ (0 – VA) = negatief o De overpredictie wordt bijgesteld 21 VPA verliest geleidelijk de verworven excitatorische waarde, tot VA =0 o ( deze voorspelling van RW is achteraf fout gebleken) Bescherming tegen extinctie o Ondanks afwezigheid OP (extinctieprocedure) kan een excitator VPA (VA= 1) soms toch zijn excitatorische waarde behouden…namelijk wanneer excitator VPA aan extinctieprocedure wordt onderworpen in aanwezigheid inhibitor VPB (VB= -1) !! o Reden: op AB- extinctietrials: ΔVA = αAβ (λ – VAB) Waarbij λ = 0, en VAB = (VA + VB) = (1 + (-1)) = 0 Dus géén overpredictie, dus VPA behoudt excitatie! Je krijgt een uitdoving van de angstlokkende prikkel (A), gecombineerd met veiligheidssignaal er zal geen angst uitgelokt worden, maar waarden van variabelen veranderen niet! Uitdoving van inhibitie o A+/AB- training, gevolgd door herhaalde B- aanbiedingen o RW voorspelt het analoge als voor extinctie van excitators o Als B perfecte inhibitor VB = -λ o Zodra extinctie begint geen OP dus λ = 0 ΔVB = αBβ (λ – VB) = αAβ (0 – (-λ)) = positief De onderpredictie wordt bijgesteld VPB verliest geleidelijk de verworven inhibitorische waarde, tot VB =0 Signaal dat als veiligheid dient, resulteert in het verlies van het veiligheidssignaal bij herhaalde aanbiedingen van het signaal zonder OP 6.1.5 problemen met het Rescorla- Wagner model Uitdoving van inhibite verloopt niet zoals RW voorspelt o Onbekrachtigde B- aanbiedingen na A+/AB- training blijken géén effect te hebben, of soms zelfs de inhibitorische waarde versterken o Inhibitie kan worden afgebouwd door uitdoving van de excitator A !! (bron van gevaar afnemen) Extinctie van excitatie is niet het spiegelbeeld van acquisitie van excitatie o Het gaat niet om het “afleren” of “afbouwen” van de oorspronkelijke excitatorische relatie o Maar om het BIJLEREN van een nieuwe relatie, namelijk dat de OP niet langer volgt op de VP Eenzelfde VP kan tegelijk én excitatorische én inhibitorische eigenschappen hebben o Volgens RW kan een prikkel slechts één associatieve waarde hebben Die kan positief of negatief zijn, maar niet beide tegelijk o MAAR er is toch evidentie gevonden dat eenzelfde prikkel zowel excitator als inhibitor kan zijn o Vb. Tait & Sadlin (1986): Shockje rond oogtoon Backward conditioning (OPVP) (schok rond ogen geluid) bij konijnen: suppressie operant likgedrag door geluid (dus VP excitatorisch) Nadien: forward conditioning (VPOP) met geconditioneerde oogknipper als VR: vertraagde acquisitie (dus VP kenmerken geconditioneerde inhibitor !) Antwoord: theorieën die onderscheid maken tussen emotioneel-affectieve en sensorieel-descriptieve representatie van OP RW kan beide effecten op zich wel verklaren, maar niet tegelijk Latente inhibitie kan niet worden gevat in RW model 22 o In RW model is α de salience van een VP, een vaste onveranderlijke parameter o In latente inhibitie zal waarden van α waarschijnlijk dalen Opheffen blocking door een zwakkere OP tijdens compound- conditioneringsfase o Indien er tijdens fase 2 een sterkere OP (bv. 2λ) dan tijdens eerste fase (λ) wordt aangeboden voorspelt RW (correct) géén blocking want (2λ – VAB) is dan > 0, dus ΔVB = αBβ (2λ – VAB) > 0 VP verwerft excitatie o Maar ook wanneer omgekeerd (OP = 2λ tijdens fase 1, λ tijdens fase 2) zal er géén blocking optreden VP verwerft excitatie !! als RW al iets voorspelde was het inhibitie 6.2 andere modellen van klassieke conditionering 6.2.1 aandachtsmodellen van conditionering RW (Amerikaans) focus op de effectiviteit van de OP: o Hoeveel er geleerd wordt is afhankelijk van de effectiviteit van de OP o des te meer leren op een trial des te slechter de OP-predictie o Des te minder leren op een trial des te beter de OP-predictie Britse leerpsychologen: focus op de effectiviteit van de VP o Algemene assumptie: opdat conditionering optreedt moeten subjecten aandacht hebben voor de CS o Des te meer leren op een trial des te meer de VP de aandacht trekt (en dus ‘verwerkt’ wordt) o Des te minder leren op een trial des te minder de VP de aandacht trekt o Het “aandachtstrekkend vermogen” van een prikkel = de opvallendheid (“SALIENCE”) van een prikkel Aandachtsmodellen verschillen in hun assumpties over wat de opvallendheid van de CS op een gegeven trial bepaalt Pearce & Hall: o Basisassumptie; opvallendheid van de VP op de trial n wordt bepaald door de mate waarin de OP verassend was op trial n-1 Er valt veel te leren als de OP verrassend was veel aandacht voor VP op volgende trial Er valt weinig te leren als de OP niet verrassend was weinig aandacht voor VP op volgende trial o Dus: de late waarin OP verrassend is, heeft enkel een pro-actieve invloed op aandacht (en dus ook op de mate van leren) <->RW: mate waarin OP verrassend is, heeft een momentane invloed op de mate van leren (invloed op zelfde trial) RW: ΔVA = αAβ (λ – VA), waarbij αA = constante Pearce & Hall: αA = variabel over trials o αAn = |λn-1 – VAn-1| Waarbij αAn = de salience/associeerbaarheid van prikkel A op trial n (waarde tussen 0 en 1) λn-1 = sterkte van de OP op trial n-1 (tussen 0 en 1) VAn-1 = associatieve sterkte van A op trial n-1 |λn-1 – VAn-1| = absolute waarde verschil o De verandering in associatieve sterkte van prikkel A (ΔVA) is dan functie van: ΔVA = SA αA λ SA = intensiteit van VPA constante (objectieve waarde van bepaalde prikkel) αA = associeerbaarheid VPA 23 λ = intensiteit OP efficiëntie van OP wordt constant gehouden (λ) , associeerbaarheid wordt flexibel (α) Of uitgebreid: ΔVAn = SA |λn-1 – VAn-1| λn o Acquisitie Trial1 αA = associeerbaarheid VPA voor nieuwe prikkel positieve waarde verschillend van nul, ΔVA = SA αA λ = verwerven bepaalde mate van excitatie ΔVA = SA αA λ (bv. = 0,1) o de eerste twee termen zullen positief zijn, o de laatste is gelijk aan 1 Een nieuwe prikkel heeft altijd een licht positieve waarde Trial2 αAn = |λn-1 – VAn-1| groot want op vorige trial1 was VA nog 0, dus SA αA λ groot ΔVA = SA αA λ o Eerste term is positief o Laatste term is 1 o Middelste term: |λn-1 – VAn-1|= |1-0| (zeer grote verrassing [!! Kijken naar begin vorige trial] n Trial3 αA reeds kleiner dan op trial2, want op trial 2 was VA reeds in bepaalde mate positief, en dus is ook |λn-1 – VAn-1| kleiner dan op trial2. Hierdoor ook SA αA λ kleiner dan op trial 2 ΔVA = SA αA λ o Eerste term is positief o Laatste term is 1 o Middelste term: |1-0.1| Trial laatste: indien op voorlaatste trial (VA = λ) was, is αAn = |λn-1 – VAn-1| = 0 geworden, dus ook SA αA λ = 0 Als op voorlaatste trial de predictie al optimaal was, dan zal de aandacht op de volgende trial wegvallen (er zal geen leren meer plaatsvinden) o Blocking Fase 1 (A+ training): VA = 1 (einde leerfase) en αA = 0 (perfecte predictie) Fase 2 (AB+ training) Indien meerdere VP’s αBn = |λn-1 – VABn-1| Eerste trial: o αB zal (als nieuwe prikkel) normale startwaarde hebben, groter dan 0, dus ΔVB = SB αB λ zal niet nul zijn ΔVA= αA * SA* λ = 0*SA*λ =0 ΔVB= αB * SB* λ = pos. *SA*λ =pos (nieuwe prikkel is altijd positief) o geen blocking op 1ste trial !! Volgende trial(s): o αBn = |λn-1 – VABn-1|= 0 want VABn-1 = 1 omdat VAn-1 = 1, dus geen verder leren meer o blocking vanaf 2e trial o Latente inhibitie door pre-exposure VP-alleen (zonder OP), zal αAn = |λn-1 – VAn-1| gelijkgesteld worden aan 0 (zowel λn-1 als VAn-1 = 0) Bij eerste VP-OP trial: géén leren ! “Bijstelling” αA op volgende trials o Opheffen blocking 24 door zowel sterkere als zwakkere OP tijdens compound-conditioneringsfase |λn-1 – VAn-1| is van belang, onafgezien van “over- of onderpredictie ! Dus: ook na 1e compound trial verder leren! 6.2.2 temporele factoren en geconditioneerd gedrag Noch in het RW model, noch in de aandachtsmodellen wordt expliciet met de factor ‘tijd’ rekening gehouden ondanks het feit dat tijd een belangrijke determinant is bij pavloviaans leren o Effecten van de duur van VP en VP-OP interstimulusinterval Vaak curvilineair verband, met na “optimum” langer ISI minder conditionering Respons-afhankelijk! (cfr. “general search – focal search – food handling and ingestion”) o Effecten duur inter trial interval Algemeen: langere ITI’s leiden tot meer/ sterkere VR (bij een gelijk aantal VP-OP aanbiedingen) Bij gelijk aantal trials, maar met grotere intervallen zal een sterker effect optreden o Verhouding tussen VP en duur ITI Niet de duur van de VP of de duur van ITI op zich is van belang, maar wel de ratio tussen de twee. Hoe groter de ratio (duur ITI/ duur VP), hoe sterker de conditionering Bv. Experiment Holland Proefdier: ratten Na een toon volgt er automatisch voedselratten gaan na een tijdje al sneller naar het voedselbakje gaan VP: auditieve ruis OP: aanbieding voedsel VR: % tijd dat de rat zijn snuit in voedselhouder heeft tijdens VP (= anticipatorische geconditioneerde respons) Eerste OV: duur van VP (10 of 20 seconden) Tweede OV: duur van ITI (15 tot 960 seconden, 6 verschillende niveaus) Dus je krijgt I/T ratio’s van 1.5 ; 3 ; 6 ; 12 ; 24 ; 48 Resultaat o VR was direct gerelateerd aan I/T ratio: hoe groter de ratio, hoe groter VR o Dus de duur van VP of duur van ITI op zich zijn niet cruciaal Bij langere VP(T) kan er toch een even sterke conditionering zijn, door de verlening van de ITI(T) Bij een even lange VP(T) kan er toch sterkere conditionering zijn door verlening van de ITI(T) Waarom is de I/T ratio nu zo van belang? o Relatieve wachttijd hypothese “wachttijd” tot optreden OP in aanwezigheid VP = “VP-wachttijd” “wachttijd” tot optreden OP zonder rekening te houden met de VP = “contextwachttijd” (base rate) VP is informatief ams VP-wachttijd < context-wachttijd ! Kleine I/T ratio: VP wachttijd ≈ contextwachttijd VP weinig informatief mbt. wanneer OP komt weinig conditionering Grote I/T ratio: VP wachttijd < contextwachttijd VP sterk informatief mbt. wanneer OP komt sterke conditionering o Rate expectancy theory (Gallistel & Gibbon) Uitbreiding ideeën “relatieve wachttijd hypothese” Centraal: 25 organismen hebben notie van “tijdsduur”, geheugenrepresentatie van duur verschillende gebeurtenissen in conditioneringsprocedure Decisieprocessen gebaseerd op vergelijking van deze temporele variabelen bepalen geconditioneerd gedrag Performantie-theorie ‘leer’theorie 6.2.3 de comparator hypothese (Miller) Prikkels (én context) verwerven onafhankelijk van mekaar associatieve sterkte, volgens eenvoudige niet-competitieve op contiguïteit gebaseerde leerregel (! Spiegelbeeld van RW) Alle associaties excitatorisch! Net als in “relatieve-wachttijd-hypothese” centrale idee: geconditioneerd gedrag tov een VP is functie van vergelijkingsproces: o Associatieve sterkte target VP o Associatieve sterkte “comparator” prikkels Contextuele én andere discrete VP’s aanwezig tijdens training Mate van excitatorische/inhibitorische respons is functie van uitkomst vergelijking “actuele” associatieve waarde (= op moment van testen) van target VP en comparator prikkels o Excitatorische waarde target VP > excitatorische waarde comparator stimuli excitatorische VR o Excitatorische waarde target VP < excitatorische waarde comparator stimuli inhibitorische VR Tijdens acquisitie: 3 types van associaties o Target VP – OP associatie (link1) o Target VP – Comparator Stimuli associatie (link2) o Comparator Stimuli – OP associatie (link3) Op moment test: directe en indirecte activatie OP representatie o Directe activatie: via link 1 o Indirecte activatie: via links 2 en 3 Vergelijking mate directe versus indirecte activatie determineert VR o Deze hypothese is een kwalitatieve respons regel (dus geen berekeningen zoals bij RW) o Tijdens acquisitie wordt bepaald welke prikkels een rol zullen spelen, o De waarde die de prikkels hebben op het moment van de vergelijking is cruciaal Implicaties o Performantie verklaring i.p.v. leerverklaring voor o.a. blocking, overshadowing, contingetie-effecten, … Bv. overshadowing VR op X kleiner na XA+ training dan na X+ training Niét omdat associatie X-OP zwakker is Wél omdat sterkte comparator stimuli in geval XA+ training (zijnde context plus A) groter is dan in geval X+ training (enkel context) Bv. blocking VR op X kleiner na A+ training gevolgd door XA+ training dan bij XA+ training zonder voorafgaande A+ training Niét omdat X-OP relatie minder goed/niet geleerd in blocking groep dan in controle groep Wél omdat in blocking groep de comparator stimulus A een grotere associatieve sterkte heeft (voorafgaande A+ training) dan in controle groep (geen voorafgaande A+ training) Pre-training zorgt ervoor dat A-OP associatie sterker wordtminder sterke respons op doelprikkel X 26 o Predicties van effecten van post- acquisitie manipulatie van de associatieve sterkte van comparator prikkels, die niet met de traditionele leer theorieën kunnen worden verklaard (restrospectieve revaluatie) Bv. postacquisitie uitdoving context A+ training in een bepaalde context A-OP en context-OP associaties Aangezien context = comparator voor target A, predictie: uitdoving context zal leiden tot sterkere VR op target A Experimenteel aangetoond! Kan niet worden verklaard door RW, aandachtsmodellen etc Bv. unblocking/ unovershadowing Na A+, dan XA+ training mindere respons op X dan wanneer onmiddellijk XA+ training Oorzaak: comparator A voor target X is sterker in blocking groep (dan in controle groep) o Bij blocking weegt (A+ context) -US meer door Predictie: uitdoving A zal leiden tot stijging/verschijnen van VR op geblockte target X o Bij unblocking zal (A+ context)- US zwakker worden waardoor X-US sterker wordt Experimenteel aangetoond!! Bv. uitdoving ‘inhibitie’ A+/XA- training, of negatieve contingentie X-OP Sterkte comparator stimuli voor target X (A+ context, of context) groter dan sterkte target X, dus “inhibitie” op X o A wordt altijd gevolgd door OP, AX wordt zelfde gevolgd door OP o A + context zal sterke link met OP hebben o X zal zwakke link met OP hebben Predictie: uitdoving comparator prikkels zal leiden tot verdwijnen inhibitie (of tot lichte excitatorische respons) op X o uitdoving van A zorgt dat de X-OP band sterker wordt Experimenteel aangetoond! Bv. Backward blocking XA+ training gevolgd door A+ training (omgekeerde sequentie dan bij “forward” blocking) er zal op X weinig/niet gereageerd worden Predictie: comparator A voor target X zou sterker moeten worden (dan in controlegroep), dus VR op X zou zwakker moeten worden (dan in controle groep) “backward blocking” Experimenteel aangetoond!! Bv. post acquisitie versterken door context A+ training in een bepaalde context A-OP en context-OP associaties Aangezien context = comparator voor target A, predictie: versterken context zal leiden tot zwakkere VR op target A Experimenteel moeilijk(er) aantoonbaar… Zwakte van het model: 3 soorten associaties, maar de precieze leerprincipes zijn niet echt gespecifieerd 27 Extra: configuraal leren (Pearce) RW, pearce & Hall, Miller hadden een elementele benadering van samengestelde prikkels (AB=A+B) Alternatief: configurale benadering van samengestelde prikkels (AB=C) o Het geheel is verschillend van de som van de delen o AB configuratie verwerft associatieve sterkte o Rol voor generalisatie tussen AB, B en A Verandering in excitatorische sterkte van een prikkel (ΔEA) op een trial wordt bepaald als o ΔEA = β (λ – ĒA) β = ‘learning rate’ parameter, afh. van sterkte US λ = asymptoot van leren (max = 1) ĒA = netto “verworven” (geaggregeerde) excitatorische sterkte, bestaande uit: o ĒA = EA + e A EA = rechtstreeks verworven excitatorische sterkte eA = gegeneraliseerde excitatorische waarde vanuit perceptueel gelijkende prikkels als er geen andere prikkels zijn die lijken op prikkel A, dan wordt deze term nul De gegeneraliseerde excitatorische waarde voor prikkel A (=eA),wordt bepaald als o eA = Σjn JSA * Ej JSA = de similariteit tussen prikkel A en prikkel J Varieert tussen 0 en 1 Zelfs wanneer de stimuli volledig veranderd, zal deze term nog steeds een positieve waarde hebben o Op beide trials zijn er een reeks representaties van stimuli welke constant blijven (bv. experimentele context) en deze stimuli zullen een zorgen voor een positieve mate van similariteit JSA = (Pcom/PΣJ) * (Pcom/PΣA) o Pcom = gepercipieerde intensiteit van de gemeenschappelijke prikkelelementen o PΣJ en PΣA = gepercipieerde intensiteit van prikkels J en A in hun totaliteit, resp. Ej = de excitatorische waarde van de gelijkende prikkel J zelf Wanneer ΔEA = β (λ – ĒA) negatief is (bv. λ = 0 omwille van afwezigheid US, en ĒA > 0), ontstaat er een afzonderlijke inhibitorische associatie, waarvan de netto sterkte wordt uitgedrukt als o ĪA = IA + iA IA = rechtstreeks verworven inhibitorische sterkte iA= gegeneraliseerde inhibitorische waarde vanuit perceptueel gelijkende prikkels o ΔIA = |ΔEA| Dus meer algemeen geldt: ΔEA = β (λ – VA) o waarbij VA = (ĒA + ĪA) = EA + eA – (IA + iA) ! het model maakt dus een onderscheid tussen excitatorische kracht welke geconditioneerd is op en stimulus (E) en degene die ertoe gegeneraliseerd is (e) formule ASA’ = (Pcom/PΣA) * (Pcom/PΣA’) o ASAB = 1/1 * 1/2 = .50 (bij intensiteit A=B) A (1 blokje) A B (1vd 2 blokjes) o BSAB = 1/1 * 1/2 = .50 (bij intensiteit A=B) o ABSAC = 1/2 * 1/2 = .25 (bij intensiteit A=B=C) A B A C o ASAB = 1/1 * 1/3 = .33 (bij intensiteit B = dubbel intensiteit A) 28 o BSAB = 2/2 * 2/3 = .66 (bij intensiteit B = dubbel intensiteit A) Generalisatie van excitatie o Overshadowing AB+ training, test A? Acquisitie: VAB = Test: VA = ABSA* VAB, dus VA = 0.5 (want ABSA = .5) Conform RW: VA+B = (VA+ VB) = ; en VA= VB= 0.5 De invloed van prikkelcombinaties op “afzonderlijke” prikkels wordt verklaard via een systeem van perceptuele generalisatie van de door de “compound” verworven associatieve sterkte Dus: afzonderlijke prikkels verwerven zelf geen signaal- waarde in een prikkelcombinatie, maar ontvangen gegeneraliseerde signaal- waarde volgens perceptuele gelijkenis. Effect moet reeds zichtbaar zijn na 1 trial o Summatie A+ en B+ training, test AB? Acquisitie: VA = en VB = Test: VAB = ASAB*VA + BSAB*VB = 0.5 + 0.5 = Niet conform RW: VA+B = VA + VB = + = 2 !! (cfr. “over-expectation”) Generalisatie van excitatie en inhibitie o Super extinctie volgens RW A+, B+ en C+ training, dan AB- extinctie versus C- extinctie Acquisitie: VA = VB = VC = Test na acquisitie: VAB = VA + VB = 2 ; VC = Extinctie: VA = * * (0 - 2) (idem voor VB) VC = * * (0 - ) Test na extinctie: (CRA = CRB) < CRC R&W (1972) voorspelt sterkere extinctie via de prikkelcombinatie, omdat de verrassing van het uitblijven van de US groter is, en omdat de signaal-waarden van de afzonderlijke prikkels rechtstreeks aangepast worden. o Geen super extinctie volgens pearce A+, B+ en C+ training, dan AB- extinctie versus C- extinctie Acquisitie: VA = VB = VC = Test na acquisitie: VAB = (zie ‘summatie’), VC = Extinctie: ΔIAB = β ( – VAB) = β (0 – ), tot IAB = ΔIC = β ( – VC) = β (0 – ), tot IC = Test na extinctie: VA= de behouden eigen excitatie (EA= ) min gegeneraliseerde inhibitie (iA = ABSA* IAB = ½ ) = ½ VC= behouden eigen excitatie (EC= ) min eigen inhibitie (IC = ) = 0 Resultaat: (CRA= CRB) > CRC Dus: zwakkere extinctie via de prikkelcombinatie, omdat de verrassing van het uitblijven van de US gelijk is, en omdat de afzonderlijke prikkels slechts gedeeltelijke generalisatie ontvangen van het extinctie-leren met de prikkelcombinatie. 29 7. Instrumentele of operante conditionering Inleiding Belangrijk gemeenschappelijk kenmerk van habituatie, sensitisatie en pavloviaanse conditionering is dat ze onafhankelijk van de acties van het organisme bepaald worden o Het gedrag veranderd in functie van de prikkelaanbieding o Maar het gedrag heeft geen invloed op de aanbieding/ het optreden van de cruciale prikkels o DUS men leert over prikkels en prikkelrelaties waarover men geen controle heeft Instrumentele/ operante conditionering: o Situaties waarbij de aanbieding/ het optreden van een ongeconditioneerde stimulus afhankelijk is van het gedrag van het organisme o Controle over prikkel(verandering) in de omgeving o De consequente uitkomst: bekrachtiger of straf Positieve bekrachtiger: iets positiefs toevoegen Negatieve bekrachtiger: iets negatiefs wegnemen Positieve straf: iets positief wegnemen Negatieve straf: iets negatief toevoegen o Instrumentele conditionering: het gedrag/ respons is het middel waardoor de prikkelwijziging in de omgeving bekomen wordt o Operante conditionering: het organisme voert een bepaalde manipulatie/ operatie van of op de omgeving uit 7.1de tradities van Thorndike en skinner 7.1.1 methodologische consideraties De discrete trial methode: o Thornike o Geïntreseerd in het bestuderen van intelligentie bij dieren o Subjecten zijn jonge katten o Puzzle box: er moeten één of meerdere acties ondernomen worden om uit de box te geraken o Een katje wordt in de box geplaatst en er werd gemeten hoe lang ze erover deden om uit de box te geraken, waarbij ze een stukje vis kregen Bij herhaalde aanbiedingen in eenzelfde box, werden de katjes steeds sneller om eruit te geraken o De deelnemer heeft slechts op bepaalde momenten de mogelijkheid om de instrumentele respons uit te voeren, wat getermineerd wordt door de experimentator. (bv. katten kunnen maar ontsnappen wanneer ze in box geplaats worden. Thorndike bepaalt wanneer dit plaatsvind) o Straight alley runway: het dier wordt geplaatst in de start box. De deur van startbox gaat omhoog, wat het dier toelaat om naar de doel box te gaan aan de andere kant van de baan ( dus het dier moet gewoon rechtdoor lopen) o T-maze: nadat het dier vrijgelaten wordt van de start box, kan het naar een keuze punt gaan, waar het moet kiezen tussen de rechter of de linker kant. Geschikt om keuze gedrag te onderzoeken o Vereist verschillende manipulaties Experimentator moet de rat in de box zetten, hem vrijlaten, wachten tot het zijn doel bereikt heeft, het oppakken en in een wacht ruimte steken voor intertrial interval Experimentator bepaalt hoe lang de deelnemer moet wachten tussen trials Free- operant methode o Skinner 30 o Interesse in het construeren van geautomatiseerde profopstelling waarbij het subject bepaalt wanneer een nieuwe trial wordt toegediend o Skinner box: rechte box. Langs één zijde een drukknop en een voedselbakje. Elke druk op de knop wordt automatisch gedetecteerd en wordt gevolg door eten o Respons van interesse: frequentie van drukken o Operante respons kan eender welk moment voorkomen o Deelnemer kan herhaaldelijk de instrumentele respons uitvoeren 7.2 de oprichting van een instrumentele of operante respons 7.2.1 leren waar en waarvoor te lopen Het gedrag zelf ( het lopen) is volledig gekend De dieren moeten leer waarvoor (motivatie) en naar waar ze moeten rennen 7.2.2 construeren van nieuwe responsen van familiaire componenten Bv. hendeldrukken in skinnderbox Verschillende componenten van het gedrag zijn gekend o Op achterpoten zitten, voorpoten opheffen, uitsteken boven hendel, naar beneden duwen Maar de combinatie/ coördinatie van de componenten is nieuw en moet dus aangeleerd worden 7.2.3 nieuwe responsen vormen Volledig nieuwe gedragingen (= spontaan nooit uitgebracht gedrag) leren is mogelijk door de variabiliteit in gedrag en het systematisch verschuiven van het criterium voor bekrachtiging Shaping: wordt gebruikt wanneer het doel is om een instrumentele respons te conditioneren welke niet bestaat in het gedragsrepertoire van de participant o Het uiteindelijk wenselijk gedrag moet duidelijk zijn o Het bestaande gedragsrepertoire van het proefdier moet gedocumenteerd worden zodat het startpunt van het proces goed bekend is o Een sequentie van trainingsstappen moeten opgesteld worden om de deelnemer van zijn startpunt naar zijn uiteindelijke doekgedrag te leiden o Gedrag is steeds variabel. Door kleine veranderingen in het gedrag te bekrachtigen, en het criterium van bekrachtiging telkens een beetje op te schuiven, zal het gedrag opschuiven in de richting van het gestelde criterium Shaping is nuttig voor het aanleren van volledige nieuwe responsen, maar ook voor het aanleren van nieuwe combinaties van bestaande responsen Vaak gebruikte procedure voor het aanleren van nieuwe, complexe handelingen/ vaardigheden 7.3 het belang van onmiddellijke versterking Instrumentele conditionering is een respons selectie procedure Het is cruciaal voor dit proces dat de bekrachtiger onmiddellijk achter het gewenste gedrag aangeboden wordt (hoewel dit niet altijd haalbaar is) Gedragsactiviteiten stoppen nooit. Bij uitgestelde bekrachtiging is de kans groot dat andere responsen bekrachtigd worden. Geconditioneerde ( of secundaire bekrachtiger): een stimulus die geassocieerd is met (en later inruilbaar is voor) een primaire bekrachtiger (bv. geld, tokens) Markeerprikkel: een korte visuele/ auditieve cue die het subject attendeert op het cruciale target en deze beter memoriseerbaar maakt 31 7.4 prikkel relaties bij instrumentele conditionering Vraag: wat is de inhoud van het geleerde bij operante conditionering Drie componenten in instrumenteel gedrag: o S: de prikkelconfiguratie waarin het gedrag uitgebracht wordt o R: het uitgebrachte gedrag o O: de outcome, de consequente omgevingsverandering 7.4.1 de S-R associatie: Thorndike’s wet van effect Instrumenteel leren= de associatie tussen de omgevingsstimuli en de respons o De bekrachtiger zorgt enkel voor het versterken van deze associatie, maar wordt zelf niet geëncodeerd o S-R associatie Elk operant wordt uitgebracht in een unieke configuratie van omgevingsprikkels De bekrachtiger zorgt ervoor dat er een associatie wordt ingestampt tussen deze omgevingsprikkels en de instrumentele respons Er is GEEN leren over, maar door de bekrachtiger ( geen R-O associatie) 7.4.2 S-O en S(R-O) relaties Relatie tussen de stimuli en de outcome Wanneer in een bepaalde situatie (S), door instrumentele respons (R) een bepaalde outcome (O) wordt veroorzaakt, is er ook een kans voor S-O leren S-O associatie: lijkt op de pavloviaanse VP-OP associatie Drie termen contingentie : S signaleert de aanwezigheid van de R-O associatie o S(R-O) associatie o Analoog met de B(A-OP) associatieve structuur in Pavloviaanse conditionering Experimentele evidentie voor het belang van S-R, S-O, R-O en S(R-O) associaties Onderscheid tussen S-R en R-O relaties: o Outcome van de-/ revaluatie studies (analoog met OP inflatie en OP devalutie) Actie: R-O Gewoonte: S-R 7.4.3 implicaties voor neurale mechanismen Pavloviaans leren: eenvoudige (S-S) associaties of complexe B(A-OP) associaties kunnen experimenteel afzonderlijk geïnduceerd/ geïsoleerd worden Operant leren: meerdere binaire associaties (S-R, S-O, R-O) en complexe S(R-O) associaties kunnen niet experimenteel geïnduceerd/ geïsoleerd worden Gevolg: pavloviaans leren is eenvoudiger te bestuderen dan operant leren wat betreft het neuronaal substraat 7.4.4 implicaties voor beperkingen van instrumentele conditionering Net zoals bij klassieke conditionering gaat niet elke VP even gemakkelijk geassocieerd worden met om het even welke OP o OP activeert het gedragssysteem dat relevant is voor de OP in kwestie o Ieder gedragssysteem wordt gekenmerkt door specifieke responsen en een verhoogde aandacht voor specifieke prikkels Ook bij operant leren is er evidentie voor selectiviteit bij het tot stand komen van S-R, S-O, RO en S(R-O) leren Bijvoorbeeld: o Varkens leren dat het afgeven van een muntstuk leidt tot voedsel o Mogelijke verklaring: muntstuk (afgevenvoedsel) bevat pavloviaanse S-O associatie (munt voedsel) 32 Pavloviaanse VR= toenadering, manipuleren, bijhouden Pavloviaanse VR incompatibel met operante R= afgeven Bijvoorbeeld o Interactie aard R en aard O bij mannelijke stekelbaarzen o Respons 1: door ring zwemmen o Respons 2: op staafje bijten o Outcome 1: mannelijke soortgenoot o Outcome 2: vrouwelijke soortgenoot o Resultaat: R1 – O2 > R1-O1 en R2-O1 > R2-O2 Dus: O activeert een bepaald gedragssysteem. Dit impliceert een verhoogde sensitiviteit voor een bepaalde stimuli en activatie van een bepaalde respons( MAPS) Het al dan niet compatibel zijn hiervan met de gebruikte S en R in sequentie S(R-O) is medebepalend voor het succes van operant leren Extra: evaluatieve conditionering !! extra tekst: meta-analyse Tabellen bekijken!!! Inleiding Mensen zijn niet onverschillig tegenover stimuli: elk object, situatie, gebeurtenis, actie wordt onmiddellijk en automatisch geëvalueerd We interageren met een wereld die beladen is van waarden (positief-negatief continuüm) Bepaalde acties resulteren in veranderingen in de omgeving die als goed of als slecht geëvalueerd worden o Enkel die acties die resulteerden in positieve veranderingen, zullen frequenter gesteld worden o Implicatie van deze fundamentele wet van gedrag : bij organismen die ongevoelig zou zijn voor de waarde van een stimulus, ook het essentiële criterium voor leren ontbreekt o Geen gedragsmatige flexibiliteit zonder waarde Merendeel van onze voor en af keuren zijn niet vaststaand en aangeboren maar vloeien voort uit onze ervaring met de stimuli o Waarde kan komen door een louter herhaalde blootstelling aan een stimuli o Evaluatieve veranderingen kunnen resulteren door het verstrekken van op taal gebaseerde symbolische informatie (bv. X is een moordenaar) o Evaluatieve veranderingen kunnen voortkomen uit de opeenvolgende of contingente paring van origineel neutrale stimuli met gebeurtenissen die reeds een positieve/ negatieve waarde heeft Evaluatief leren is hierop gebaseerd: een neutrale stimulus kan een pos/neg waarde krijgen door een louter spatio- temporeel samengaan met een stimulus die reeds een waarde heeft Evaluatief leren in eerste instantie bekeken als ene vorm van pavloviaans leren Preparatorische conditionering: in welke mate heeft kennis die je opdoet invloed op je voorbereiding tot het krijgen van een bepaalde prikkel 1. van intrinsieke verandering naar slechts referentiele relaties als het fundament van evaluatief leren 1.1de intrinsieke veranderingshypothese 1.1.1 Martin en levey’s rudimentaire ideeën over evaluatief leren In de geest van de informatieverwerkingsbenadering werd menselijke klassieke conditionering geconceptualiseerd als een fenomeen waarvan de kern de acquisitie is van kennis over predictieve relaties tussen stimuli in de omgeving gebracht door een aandacht vragend , capaciteit gelimiteerde, gecontroleerde verwerking 33 o De belangrijkste functie van klassieke conditionering is de detectie van betrouwbare predictoren o =signaal leren Het meest fundamentele proces in pavloviaans associatief leren is geen signaal leren of verwerving van kennis over voorspelbare relaties, maar een directe en automatische transfer van de waarde van de US tot de CS Evaluatieve conditionering bestaat essentieel uit een intrinsieke hedonische verschuiving in de waarde van de CS door de spatio temporele samenhang van de CS met een US welke reeds een bepaalde waarde draagt o De verworven waarde van de CS moet aanwezig zijn zonder referentie naar de US 1.1.2 evaluatieve conditionering: het afbeelding-afbeelding paradigma Gebruik van cover story Kleur foto’s van menselijke gezichten werden gebruikt als stimulus materiaal Eerste fase: proefpersonen moeten deze foto’s evalueren op basis van hun eerste indruk op een schaal Vervolgens selecteert de proefleider voor elke proefpersoon de 12 meest neutrale, 3 meest positieve en 3 meest negatieve foto’s en construeert 9 paren Hypothese: de herhaalde paring van een neutrale foto met een foto welke reeds sterke negatieve/ positieve waarde had, is een goede conditio om de neutrale foto te veranderen in een stimulus met een pos/neg waarde Fase 2: de paren worden in een random volgorde getoond Fase 3: proefpersoon moet de foto’s terug beoordelen 1.1.3 evaluatieve conditionering en CS-US contingentie bewustzijn Procedure werd eerst gebruikt voor onderzoek naar de rol van bewustzijn over de contingentie CS-US o M&L: evaluatieve conditionering vereist geen expliciete kennis/ bewustzijn van de contingentie (verschillend bij signaal leren) Indien dit bewezen kan worden is het een eerste indicatie dat evaluatief leren verschillend is van signaal leren Dergelijke evidentie zou een plausibele verklaring bieden voor evaluatieve conditionering in termen van een automatische, intrinsieke waarde verschuiving Als op proces niveau een evaluatieve verandering niet gebaseerd is op een associatieve band tussen CS en US representaties, maar op een modificatie van de CS zelf,evaluatief leren kan optreden zonder bewuste kennis over de associatie tussen CS en US (CS-US relationele kennis is niet de informationele basis voor evaluatieve veranderingen) Vervolg afbeeldingsparadigma paradigma: herkenningsprocedure o Deelnemers moeten na de waarde verschuiving voor elke CS aangeven door welke foto die gevolgd werd Deelnemer was zich bewust van de band tussen CS en US als de US van de juiste waarde aangeduid werd ( juiste gezicht was niet noodzakelijk) o Resultaat: ster evaluatieve effecten en duidelijke indicatie dat het verwerven van een stimulus waarde niet noodzakelijk een bewustzijn van de CS-US associatie vereist Kennis over de CS-US associatie had noch een positief effect, noch een negatief effect o DUS we kunnen de verklaring van evaluatieve conditionering in termen van het verwerven van expliciete propositionele CS-US kennis door middel van gecontroleerde processen 34 ! dit zorgt er niet voor dat de intrinsieke veranderingshypothese het meest plausibele alternatief is De mogelijkheid dat evaluatieve conditionering gebaseerd is op impliciete kennis over de CS-US relatie (door automatische processen) blijft open 1.1.4 evaluatieve conditionering en extinctie M&L speculeerde dat evaluatieve conditionering bestand is tegen extinctie o Een CS met verworven pos/neg waarde zal deze waarde niet verliezen als een resultaat van een daaropvolgende CS alleen representaties Experimentele bevestiging van deze hypothese zou meer inzicht bieden in de representatieve structuur onderliggend evaluatieve conditionering o Het laat toe te beslissen tussen de intrinsieke veranderingshypothese en de verklaring in termen van de verwerving van impliciete kennis over de predictieve CS-US relatie o Als de valentie van de CS intrinsiek veranderdehet feit dat de CS het optreden van US niet meer voorspeld, mag de voorgaande verworven waarde niet beïnvloeden o Als de verworven waarde gebaseerd is op impliciete kennis dat de CS de US voorspelt als de CS positief/negatief werd door de kennis dat het een US voorspelt, moet de nieuwe ervaringen dat er geen voorspelling meer is, schadelijk zijn voor de verworven waarde van de CS Eerste studie o Acquisitie fase: 10 trials van elke N-N, N-D en N-L paren o Gevolgd door een beoordeling van het leer effect o Between group: CS’en krijgen 5 of 10 trials zonder US o Vergelijking van de post extinctie beoordelingen met de post acquisitie beoordelingen maakten duidelijk dat de extinctie procedure geen effect had op de origineel verworven evaluatieve differentiatie Tweede studie o Kritische within subject vergelijking was tussen de eind beoordeling van de CS welke acquisitie kregen gevolgd door extinctie en de CS die geen extinctie kende o Het sterke en betrouwbare evaluatieve conditioneringseffect dat gevonden werd, werd niet beïnvloed door de extinctie behandeling Verwerping van de hypothese dat de geconditioneerde waarde gebaseerd is op impliciete kennis over de predictieve CS-US associatie Combineren we dit met het gegeven dat evaluatief leren geen contingentie bewustzijn vereist, besluiten we dat evaluatieve conditionering gebaseerd is op een intrinsieke waarde verschuiving Bijkomende hypothese: deze waarde verschuivingen worden veroorzaakt door automatische processen, welke onafhankelijk werken van de mechanismen die verantwoordelijk zijn voor de acquisitie van expliciete kennis over stimulus contingenties 1.2 van de intrinsieke veranderingshypothese naar het concept van slecht referentiele CS-US relaties 1.2.1 het effect van US revaluatie Zwaktes intrinsieke veranderingshypothese o Moeilijk om een intrinsiek veranderingsmechanisme te begrijpen of een verklaring te bieden voor het proces dat er bij betrokken is o De conclusie dat evaluatieve conditionering een intrinsieke verandering in de waarde van CS omvat, is op niets meer gebaseerd dan indirecte argumenten, niet op een directe test van de hypothese Meer directe test: post conditionering US revaluatie techniek o CS-US associatie vestigen 35 o Waarde van US wordt veranderd in afwezigheid van CS Methode om sterke waarden van de US te veranderen: combinatie van verbale informatie en foto’s (bv. een negatieve persoonsbeschrijving geven) o De waarde van de CS wordt terug beoordeeld o Kritieke vraag: had de revaluatie van de US invloed op de verworven waarde van de CS Er treedt verandering op: verworven waarde van de CS is gebaseerd op zijn referentiele waarde van de US Er treedt geen verandering op: CS heeft intrinsieke waarde verworven o Resultaat: US revaluatie heeft een invloed op de verworven waarde van de CS We moeten dus concluderen dat geconditioneerde waarde niet intrinsiek is, maar op een of andere manier afhangt van de associatie tussen CS en US representaties Gevolg o De observatie dat evaluatieve conditionering geen bewustzijn vereisen over de CS-US associatie betekend NIET dat de verworven waarde niet gebaseerd is op de relatie tussen CS en US Juistere interpretatie: de CS-US relationele kennis onderliggend evaluatief leren is niet noodzakelijk toegankelijk voor het bewustzijn o Belangrijkste uitdaging: de geobserveerde gevoeligheid voor US revaluatie verzoenen met de eerder gedocumenteerde weerstand tegen extinctie van evaluatief leren. (voorgestelde oplossing: 1.2.2) 1.2.2 de loutere referentiele relatie als de basis van evaluatief leren Twee kwalitatief verschillende types van CS-US relaties o Relatie waarbij CS de verwachting activeert van het optreden van US in het hier en nu of de onmiddellijke toekomst Werkelijke signaal. Verwachtingsrelatie o Presentatie van de CS activeert een representatie van de US zonder dat die aanleiding geeft tot het actieve verwachting van echt US optreden in het hier en nu of de onmiddellijke toekomst CS doet louter aan US denken Louter referentiële CS-US associatie Implicaties extinctie procedure o In het geval waarin het subject verwacht dat de US zal optreden, leidt het niet optreden van de US tot frustratie of een staat van opluchting o Na een aantal extinctie trials zal de verwachting van het optreden van US ontkracht worden o In de mate dat CS een waarde verworven heeft en een conditionele reactie welke de signaal waarde weergeeft gemeten is, zal de nieuw verworven kennis dat CS niet langer voorspeller is van US gereflecteerd worden in een daling (en uiteindelijk verdwijning) van de conditionele respons o Als de CS louter doet denken aan de US is het irrelevant of de US al dan niet optreedt Stel nu dat de CS een louter referentiële relatie heeft met de US dan zal een extinctie procedure de referentiële waarde van de CS niet beïnvloeden. Omdat de CS waarde verschuiving enkel vereist dat de CS verwijst naar de US, zal de geconditioneerde waarde niet uitdoven Dit allen is gerelateerd aan het volgende: o In geval van de CS-US verwachting relatie kan de intentionele status die uitgelokt wordt door de CS bevat worden in termen van een ‘propositionele attitude’ o In termen van louter referentiële CS-US relatie kan de intentionele status gevat worden in termen van een niet propositionele of een minder dan propositionele attitude 36 o In het eerste geval kan de propositie juist of fout zijn, in het tweede geval kunnen we deze categorieën niet toekennen o Dus verwachtingsrelaties (maar niet referentiële relaties) kunnen beïnvloed worden door de stand van zaken die gevestigd is in extinctie Oplossing voor conflicterende bevindingen (weerstand tegen extinctie en sensitief voor US revaluatie) o Het verklaard weerstand tegen verandering door erkenning dat de natuur van de CS-US associatie kwalitatief verschillend is dan is het geval van verwachtingsleren o US revaluatie effecten omdat de waarde van de CS niet intrinsiek veranderd maar gemedieerd wordt door de (huidige) waarde van de US o Geschikt voor instanties van zowel contingentie bewustzijn als contingentie onbewust zijn in evaluatief leren 2. condities en functionele karakteristieken van evaluatieve conditionering: stand van techniek 2.1 robuustheid en ecologische validiteit van evaluatieve conditionering 2.1.1 thematische variaties op het face-face paradigma In alle voorgaande experimenten is dezelfde conditioneringsprocedure gebruikt (paarsgewijze aanbieding van discrete neutrale/pos/neg stimuli) Ander onderzoek demonstreert evaluatieve conditionering met een formeel identieke procedure maar met een selectie van foto’s met een andere semantische categorie: reproducties van figuurlijke en abstracte schilderijen of afbeeldingen van sculpturen en fonteinen Ook wanneer de CS en US stimuli waren van een andere semantische categorie, observeerde men evaluatieve conditionering Dus evaluatieve conditionering lijkt effectief te zijn ongeacht de specifieke semantische inhoudscategorie van de CS en de US, tot zover er gebruik gemaakt wordt van discrete visuele stimuli 2.1.2 verbale evaluatieve conditionering Het verbale of semantische evaluatieve conditionering paradigma vertrekt van de foto-foto paradigma op twee kritische punten o De stimulus materialen zijn neutraal (betekenisvol of onzin) of hebben een waarde o Over de series van acquisitie trials is de conceptuele US de gedeelde waarde van een serie verschillende woorden in plaats van 1 enkel woord dat telkens met dezelfde CS gekoppeld wordt Typische bevinding: de origineel neutrale CS verwerft een evaluatieve waarde congruent met de waarde van de geassocieerde US woorden Dit soort experimenten belicht dat een serie van verschillende stimuli/ gebeurtenissen , die niets meer delen dan een positieve/negatieve waarde, kunnen ook aan effectieve US zijn om de waarde van de neutrale CS te veranderen 2.1.3 cross-modale evaluatieve conditionering Discreet en autonoom visueel (verbaal of non verbaal) CS wordt herhaaldelijk gepaard met een US van een andere sensorische modaliteit dan de CS Bv. Us = goede of slechte geur met CS= foto’s van menselijke gezichten (andere voorbeelden zie extra document blz. 13) In elk van deze cross-modale evaluatieve conditioneringsvoorbereidingen welke gebruik maakt van een visuele CS en een niet visuele US, werden betrouwbare assimierende evaluatieve leer effect verkregen 2.1.4 evaluatieve conditionering met een invariante eigenschap als CS 37 In al de voorgaande conditioneringsopzetten was de CS een discrete, autonome stimulus configuratie Er bestaat evidentie dat evaluatieve conditionering ook mogelijk is wanneer de CS een invariant kenmerk is van een variabel stimulus complex of configuratie Bv. CS= kleur van een serie verschillende geometrische figuren met US= goed bevonden muziek In deze studies werd gevonden dat deelnemers een evaluatieve discriminatie verwerven tussen stimulus configuraties welke het kenmerk bevatten dat gepaard ging met de positieve US en stimuli die het kenmerk bevatte welke gepaard ging met de negatieve US 2.1.5 het smaak-smaak paradigma Dit paradigma behoudt het idee van paarsgewijze presentatie van discrete en waardevolle stimuli maar maakt gebruikt van het smaak- olfactorisch domein Daarboven presenteren ze de CS en de US als elementen van een simultane CS/US samengestelde stimulus Acquisitie fase: deelnemers nemen een serie drankjes in welke water, neutrale kleurloze fruit smaken en smaakloze kleurstoffen bevatten US: bittere smaak Het ene drankje bevat een specifieke fruitgeur en is bitter, een andere specifieke fruitgeur wordt gekoppeld met een goede smaak Kleur is een irrelevante variabele om de aandacht af te leiden Test fase: geuren worden terug aan geboden zonder de bittere smaak Standaard observatie: deelnemers ontwikkelen snel een afkeer voor de geur die gepaard ging met bittere smaak Dit effect is even sterk ongeacht de aan of afwezigheid van de kleur context in de test 2.1.6 evaluatieve conditionering met tonische stimuli De US en/of de CS zijn geen korte en discrete stimuli met een duidelijk start- en eindpunt, maar zijn relatief constante en blijvende contexten/situaties/gebeurtenissen/acties Ze vormen bijkomende voorbeelden van cross-modaal evaluatief leren waarbij CS en US simultaan aangeboden worden Bv. CS= neutrale Griekse letters met US= luisteren naar goede/slechte muziek Dergelijke experimenten leiden naar het inzicht dat evaluatieve conditionering effectief is in situaties die dichter bij het dagelijkse leven staan dan het geval was in het originele fotofoto experiment 2.1.7 observeerbare evaluatieve conditionering Heeft nog niet veel experimentele aandacht gekregen Er bestaan indicaties dat evaluatieve conditionering ook kan optreden op een indirecte, observationele manier De deelnemer wordt niet rechtstreeks blootgesteld aan een CS-US contingentie maar observeert een andere persoon die hieraan blootgesteld wordt en zijn evaluatie van de kritische stimuli expliciet maakt Kritische vraag: verwerft de CS een waarde die congruent is met de waarde van de CS van het model? Twee paradigma’s laten zien dat dit inderdaad het geval is 2.1.8 affectieve priming als een indirect non verbale meting van evaluatief leren Recente tendens is om te proberen indirecte, non-verbale metingen de ontwikkelen voor verworven stimulus waarde. o Minder opdringerig 38 o Minder vatbaar voor vraageffecten Meest prominente methode: affectieve priming o Serie van positieve/negatieve stimuli wordt getoond welke zo snel mogelijk geëvalueerd moeten worden als positief of negatief o Elk target wordt voorgegaan door een prime stimulus die pos/neg/neutraal kan zijn. deze prime moet genegeerd worden door de proefpersoon o Resultaten tonen dat de tijd die nodig is om een target stimulus te evalueren wordt gemedieerd door de valentie van de primes Congruente prime: snellere reactietijden Affectieve priming is gebaseerd op automatische verwerking van de waarde van de prime, wat betekend dat snelle, onvrijwillige en relatief inefficiënte processen onderliggend het effect te vinden zijn Als de conditioneringsfase succesvol de waarde van de CS veranderd heeft in de verwachte richting, dan zal de aanbieding van een CS die gepaard ging met een positieve US het proces van een positief target moeten faciliteren en het proces met een negatief target inhiberen (dit wordt ook teruggevonden!) 2.1.9 evaluatief leren gelijktijdig met verwachtingsleren Het is niet omdat evaluatief leren meestal onafhankelijk van verwachtingsleren bestudeerd is, dat beide niet samen kunnen voorkomen De laatste reeks van studies gaan over zowel evaluatief als verwachtingsleren o Evaluatief leren: differentiële pos/neg beoordelingen van de CS en affectieve priming data o Verwachtingsleren: differentiële US verwachtingsbeoordelingen en huidgeleidingsresponsen op neg/pos CS In al deze experimenten was er duidelijke evidentie voor evaluatief leren gelijktijdig met signaal/ verwachtingsleren Het belang van deze bevinding is dat de een experimentele demonstratie bieden dat evaluatieve conditionering en signaal leren niet als wederzijds exclusief beschouwd moeten worden Ze moeten gezien worden als een potentieel samen bestaand fenomeen welke zal verschijnen van zodra de condities voor leren in beide gevallen voldaan zijn 2.1.10 addertje onder het gras Op basis van al het voorgaande zouden we kunnen besluiten dat evaluatieve conditionering een doordringend en ecologisch valide fenomeen is welke optreedt in een verscheidenheid van situaties en een veelheid van stimuli beïnvloed MAAR dit treedt niet op in elke situatie waarin een neutrale stimulus gepaard gaat met een stimulus met bepaalde waarde We kunnen speculeren over de oorzaken van het falen, maar het blijven speculaties 2.2 functionele karakteristieken van evaluatieve conditionering 2.2.1contingentie bewustzijn en impliciete/ expliciete kennis dissociaties De resultaten van de eerste experimenten die de relatie onderzochten tussen evaluatief leren en de acquisitie van expliciete CS-US relationele kennis, suggereren een orthogonale relatie tussen contingentie bewustzijn en de modificatie van een stimulus valentie o Het is geen implicatie van deze orthogonale hypothese dat evaluatieve conditionering moet optreden in de afwezigheid van contingentie bewustzijn o Het impliceert dat het niet uitmaakt of er contingentie bewustzijn is opdat evaluatieve conditionering optreedt 39 Het bestaan van onbewuste of impliciet evaluatief leren is overtuigend gedemonstreerd in verschillende experimenten welke gebruik maakte van subliminale presentaties van de US Ook experimenten welke supraliminale CS en US presentaties hanteren bieden bijkomende evidentie voor de mogelijkheid van evaluatief leren zonder contingentie bewustzijn Het lijkt niet enkel mogelijk voor evaluatief leren om op te treden op het niveau van impliciete, onbewuste informatie verwerking maar de geobserveerde CS-US contingentie bewustzijn blijkt de conditioneringseffecten niet de versterken o Bepaalde experimenten laten zien dat er een toename is in de contingentie bewustzijn, maar niet in een sterkere evaluatieve respons Dit opent de mogelijkheid dat in sommige omstandigheden de voorgestelde orthogonaliteit tussen contingentie bewustzijn en evaluatief leren niet stand houdt, in die zin dat de CS-US relationele bewustzijn tegen de verschuiving van de CS waarde werkt (werd gevonden in latere studies) In andere conditionele settings werd net het tegenover gestelde gevonden Er blijkt dus geen eenvoudige samenvatting te zijn voor de relatie tussen contingentie bewustzijn en evaluatieve conditionering, toch niet wanneer de verschillende taken en conditionele situaties mee in rekening gebracht worden Een voorzichtige en minimale conclusie van het onderzoek is dat in sommige omstandigheden evaluatief leren kan optreden in de afwezigheid van contingentiebewustzijn 2.2.2weerstand tegen extinctie De theoretisch en pragmatisch belangrijke claim dat evaluatieve conditionering bestand is tegen extinctie heeft bijkomende steun verkregen in verschillende conditionering opzetten o Smaak paradigma o 6 of 12 trials met de bittere smaak o Test fase: 2 blokken met elk 4 onbekrachtigde presentaties van CS+ en CSo Resultaten: de verworven evaluatieve CS-/CS+ differentiatie was even sterk in het twee als in het eerste extinctie blok o Gelijkaardig experiment: de origineel verworven evaluatieve differentiatie blijven stabiel en betrouwbaar doorheen elke extinctie fase Deze observatie heeft belangrijke klinische/ toegepaste consequenties o Men kan niet verwachten dat een behandeling die enkel uit extinctie (=exposure) bestaat volledig effectief is 2.2.3 contiguïteit vs. contingentie: de ineffectiviteit van niet bekrachtigde CS en/ of US alleen presentaties Er is evidentie dat de toevoeging van niet bekrachtigde CS+ presentaties tijdens de acquisitie fase de ontwikkeling van een evaluatieve CS-US associatie verhinderen/vertragen Dit suggereert dat evaluatieve conditionering eerder bepaald wordt door het aantal spatiaal- temporele opeenvolgende CS-US representaties dan door de mate van statistische contingentie tussen het optreden van CS en US o Het aantal trials de zowel de CS als de US bevat lijkt cruciaal te zijn, niet het aantal trials welke enkel een CS of US presentatie bevatten als er twee CS’en gebruikt zijn, waarvan de eerste meer contingent met de US maar minder spatiaal temporele contigu US dan de andere, dan is het niet de meer contingente CS maar de meer contigue CS welke associatieve waarde verwerft 2.2.4 tegenconditionering een serie onbekrachtigde CS alleen presentaties volstaat niet om de verworven waarde van een stimulus uit te wissen 40 o dit impliceert niet dat geconditioneerde waarde ongevoelig moet zijn voor eender welke sub sequentie manipulatie empirische evidentie dat evaluatieve conditionering sensitief is voor tegenconditionering (US andere waarde geven) resultaat van dergelijk onderzoek: de origineel verworven waarde van de CS wordt ingetrokken en neigde te verschuiven in de richting van de meest recente gepaarde US tegen conditionering kan ook effectief zijn wanneer een US met tegengestelde waarde gepaard gaat met een CS tijdens (in plaats van na) acquisitie 2.2.5 codering van specifieke sensorische karakteristieken of algemene affectieve karakteristieken van US post conditionering US alleen presentaties (wat vermoedelijk resulteren in habituatie van de US) resulteert in een significante afname in de origineel verworven voorkeur voor de geassocieerde CS foto gevoeligheid voor post conditionering US revaluatie impliceert meer dan de louter referentiele waarde van de US: het vereist ook dat de CS geassocieerd is met een representatie van de US welke voldoende gedetailleerde informatie bevat over de specifieke sensorisch beschrijvende karakteristieken van de US US moet opgevat worden als een stimulus met minstens 2 kenmerken welke elk afzonderlijk geassocieerd kunnen worden met CS o Emotioneel affectieve kenmerken o Sensorisch beschrijvende kenmerken o Emotionele representatie wordt meer algemeen bevonden dan de sensorische representatie van de US o Als er gevoeligheid is voor US revaluatie: CS is geassocieerd met de emotioneel affectieve en de sensorisch beschrijvende kenmerken van US o Als de CS de veranderde waarde van de US niet bij houdt: CS is enkel geassocieerd met het emotioneel affectieve niveau van US representatie US infatie experiment (variant van US revaluatie experiment) o Men wijzigt het evaluatieve teken van de US niet maar men wijzigt de mate van afkeer/voorkeur o De resultaten van post conditionering US inflatie staan dezelfde conclusies toe als die van US revaluatie o Flavor- Flavor paradigma: Acquisitie fase: CS wordt gekoppeld met licht bittere smaak Inflatie fase: hoog bittere smaak Post inflatie CS beoordelingen Resultaat: post acquisitie evaluatief leer effect verhoogde niet door US inflatie Suggereert dat in evaluatief smaak-smaak leren enkel de affectieve karakteristieken van de US gerepresenteerd en geactiveerd worden door de CS Waarom gaat het bij dit type van evaluatief smaak-smaak leren enkel om een codering van de affectieve US karakteristieken waartegen bij het face- face paradigma bleek dat het gebaseerd was op de associatieve link met de sensorisch descriptieve karakteristieken van de US o Hypothese: dit verschil kan te wijten zijn aan de verschillende aard van de US in beide paradigma’s Foto’s van gezichten bevat meer gedetailleerde sensorische descriptieve karakteristieken dan een smaak Een smaak leidt meer tot affectief emotionele karakteristieken 41 o Hieruit stellen we de hypothese dat US inflatie ongevoeligheid niet noodzakelijk een karakteristiek is van smaak-smaak leren in het algemeen maar grotendeels afhankelijk is van de specifieke aard van de US 2.2.6 sensorische pre conditionering Sensorische preconditionering betreft een procedure waarin twee CS’en eerst geassocieerd worden met elkaar waarna één van de twee geassocieerd wordt met de US Resultaat: niet enkel CS2 maar ook CS1 ( die nooit rechtstreekst gepaard was met US) verwierf de valentie van US Dus het zijn niet enkel neutrale stimuli die direct gerelateerd zijn afkeur/voorkeur gebeurtenissen, maar ook andere neutrale stimuli die voordien geassocieerd zijn met de neutrale stimulus die het doel kunnen worden van evaluatieve verandering 2.2.7 evaluatieve associaties zijn niet sensitief voor modulatie Een verworven voorkeur/ afkeur voor stimulus A blijkt vaak gemoduleerd te zijn door de aan-/afwezigheid van een andere stimulus X of door de specifieke context waarin A aanwezig is Er is onderzocht ov de acquisitie van dergelijke conditionele waarde gemodelleerd kan worden in een feature positive (FP) discriminatie taak o Target stimulus A wordt enkel bekracht wanneer A samen aangeboden/ vooraf gegaan wordt met een andere stimulus X Leidt tot totstandkoming A-US associatie die gemoduleerd woord door X o Toegepast op smaak- smaak paradigma Neutrale smaak werd bekrachtigd door bittere smaak als het vergezeld ging van een bepaalde kleur Er was geen evidentie voor modulatie verkregen: men kreeg een afkeur voor A maar die was niet conditioneel, niet gemoduleerd door X Dergelijke studies focuste op: o De relatieve mate van beloning van bepaalde categorieën van stimuli om te functioneren als een modulator van een bepaalde categorie CS-US associatie Meer specifiek: het idee dat smaak-smaak associaties niet vatbaar zijn voor modulatie door een kleur, maar door een andere smaak stimulus o Evaluatieve ambiguïteit hypothese: gelegenheid setting mag enkel optreden wanneer de target ambigu is wat opgelost kan worden door een ander kenmerk X mee in rekening te brengen o Configuraal leren als fenomenologisch verwacht met gelegenheid setting, maar ervan verschillend in termen van de condities van leren en het betrokken proces o Het idee dat conditioneel leren enkel optreedt na uitgebreide training De data steunde geen enkele van deze hypothesen 3.verwachtingssysteem vs. referentieel systeem 3.1 louter referentiële vs. verwachte relatie: gewogen tegen en bevredigend bevonden De observatie dat evaluatieve conditionering geen contingentie bewustzijn suggereert het construct ‘louter referentiële CS-US relatie’ als de hoeksteen voor evaluatief leren o We karakteriseren het als een relatie welke een louter activationele associatieve link tussen CS en US representatie inhoudt, welke geen echte US verwachting genereert Deze descriptieve noties blijken valide te zijn om de essentiële en functionele karakteristieken van beide vormen van klassieke conditionering te vatten o Het grote verschil tussen verwachtingsleren en louter referentiële relaties is dat de eerste ontkracht kan worden door het niet optreden van US 42 o Evaluatieve conditionering lijkt ongevoelig te zijn voor de graad van statistische correlatie tussen CS en US ( verwachtingsleren niet) De observatie dat sommige instanties van evaluatieve conditionering gevoelig zijn voor US revaluatie/- inflatie en andere niet, is niet problematisch voor de notie van louter referentieel leren 3.2 de systeem benadering Het fenomenologisch onderscheid tussen verwachtings- en louter referentiele relaties is een reflectie van het bestaan van twee functionele systemen welke verschillen wat betreft de condities die controleren voor associatieve sterkte herziening en wat betreft de expressie van de associatieve kennis in verschillende types van overt gedrag 3.2.1 het verwachtingssysteem (ES) De ES zoekt voor betrouwbare predictoren/ signalen van biologisch significante gebeurtenissen (US) en bereid het organisme biologisch voor op een kosten efficiënte manier om optimaal om te gaan met een dreigende US Dit vereist een tijdelijke activatie van stimulus en context specifieke autonome en motorische responsen welke appetitief, defensief of oriënterend kunnen zijn Omwille van de grote kost van het voorbereid reageren… o ES reageert enkel op stimuli (CS) die betrouwbaar , niet redundant en duidelijke predictors zijn voor het optreden van US Vereist gevoeligheid voor CS-US contingentie en voor de relatief informationele waarde en de relatieve saliëntie van de verschillende kandidaat predictoren (cue competitie) o De ES initieert enkel responsen zo lang dat de predictieve CS-US relatie valide is, niet wanneer het detecteert dat de verwachte US niet langer optreedt De ES is gevoelig voor het feit dat sommige predictieve CS-US relaties conditioneel zijn Processen welke verantwoordelijk zijn voor de creatie van dergelijke staat hebben een hoge prioriteut en roepen automatisch voor aandacht. Dit kan uitleggen waarom verwachtingsleren en CS-US contingentie bewustzijn hand in hand gaan 3.2.2 het referentiële systeem (RS) Verantwoordelijk voor het vormen van de algemene voorkeuren en afkeuren van een organisme voor stimuli It biedt de representaties van stimuli met affectieve labels welke verondersteld worden in de meeste theorieën van emoties en gemoed of meer algemeen van affectieve informatie verwerking RS bepaald de algemene richting van het gedrag: creëert een algemene respons tendens tov bepaalde stimulus Deze indirecte manifestatie van de RS vereist een modulatie van mogelijke responsen De RS drukt zichzelf uit op een manier die weinig kosten met zich mee brengt RS kan zich gedragen als een zeer eenvoudig mechanisme, welke enkel spatiaal temporele contiguïteit tussen CS en US in rekening brengt RS kan werken zonder beroep te doen op kosten besparende mechanismen zoals gevoeligheid voor statistische contingentie, extinctie, conditionele aard van een bepaalde CS-US relatie of de relatieve informationele waarde/stimulus saillantie van de CS’en Associaties in de RS worden waarschijnlijk gevorm op basis van een simpele hebbian leer regel welke de kracht van een associatie tussen 2 stimuli doet toenemen wanneer de stimuli samen voorkomen. Maar laat de associatie sterkte intact wanneer de stimuli apart optreden 43 En stimulus valenties blijken een directe vertaling te zijn van deze associaties 3.2.3 adaptiviteit van de RS Zo lang er een valide correlatie is tussen CS en US is het vanzelfsprekend dat dit adaptief is om een voor-/afkeur te vertonen voor de CS, welke keuzegedrag kan leiden of kan een neg/pos respons tendens aansporen Zolang er geen hoge differentiële respons kost geassocieerd is met voor-/afkeur voor een stimulus, is het waarschijnlijk in bepaalde mate van toepassing dat “als het niet goed is, schaadt het ook niet” o Sommige karakteristieken van de RS welke blijkbaar geen duidelijk adaptief voordeel bieden, kunnen eenvoudigweg niet adaptief zijn. niet in de zin van ‘tegen adaptief zijn’ maar in de zin van extra adaptieve consequentie te zijn van een anders adaptief mechanisme Zo lang de RS omgaat met keuze situaties/ keuze gedrag/ met de activatie van algemene respons tendenties, kan er op de lange duur een voordeel zijn in de zin dat de RS omgaat met bijvoorbeeld statistische contingentie of extinctie 3.2.4 de relatie tussen ES en RS Deze functionele benadering van het onderscheid tussen verwachtingsleren en evaluatief leren zegt niets over de vraag hoe beide vormen van leren behandeld worden op proces niveau noch laat het zich verbinden tot een algoritmische implementatie van deze systemen Het spreekt niet over de relatie tussen ES en RS noch over hoe ze zich verbinden tot een bepaalde algoritimische uitvoering van deze systemen Een mogelijke lezing van het onderscheid zou zijn: accepteren dat verwachtingsrelatie en referentiële relaties letterlijk gerepresenteerd worden als kwalitatief verschillende gestructureerde mentale representaties en dus zo betekenisloze associaties te verplaatsen door gekwalificeerde relaties o Implicatie: we gaan verder dan het pure niet propositionele associatief kader en treden een domein toe van klassieke cognitieve theorieën waarin de CS-US associaties voorgesteld worden als een gestructureerd symbool Ondanks dat ze beide gebaseerd zijn op onvoorwaardelijke CS-US associaties, gedrag beide systemen zich zodanig dat van een puur descriptief zichtpunt ze resulteren in een outcome die goed gevat kan worden in termen van de notie van kwalitatief verschillende verwachtings-vs. referentiële relaties De werking van de twee systemen is niet mutueel exclusief 8. Bekrachtiging schema’s Inleiding S(RO): soms is de kans op een bepaalde outcome quasi 1 (outcome zal altijd volgen) De kans op een bepaalde outcome kan ook kleiner dan 1 zijn Of een bepaald optreden van de instrumentele respons resulteert in een bekrachtiging hangt af van verschillende factoren o Soms moet de instrumentele respons een aantal keer uitgebracht zijn alvorens er bekrachtiging komt o Soms moet er een bepaalde tijd verstrijken na het uitbrengen van de instrumentele respons alvorens die bekrachtigd wordt o Soms zijn beide (tijd+ respons herhaling) van belang 44 Schema van bekrachtiging: de regel welke specificeert welk optreden van de instrumentele respons bekrachtigt is Bekrachtigingsschema’s bepalen: o Frequentie van het gedrag o Respons-patroon o de persistentie van instrumenteel gedrag in extinctie, wanneer er geen bekrachtiging meer aanwezig is o De keuze tussen respons- alternatieven R1 en R2 8.1 de cumulatieve record Om het effect van bekrachtigingsschema’s te onderzoeken wordt vaak gebruik gemaakt van de ‘free operant methode’ o Automatische registratie van de re responsen en automatische toediening van bekrachtigers o Training sessies duren een uur per dag en meestal vinden er meerdere sessies plaats Cumulatieve record: soort grafiek (trappatroon) o X-as: tijdsverloop o Y-as: cumulatieve frequentie van de responsen op een bepaald tijdsmoment o Helling: frequentie van uitbrengen responsen binnen een bepaalde tijdseenheid Berekend door de verticale verschuiving tussen 2 punten op de grafiek te delen door de horizontale verschuiving tussen deze 2 punten Hoe scherper de helling, hoe meer responsen 8.2 eenvoudige schema’s van bekrachtiging Ratio schema o Frequentie van respons is kritische factor welke de bekrachtiging bepaald Interval schema o Timing van de responsen is kritische factor In beide gevallen krijgt het individu geen bekrachtiging voordat het een respons heeft uitgebracht 8.2.1 ratio schema’s Er moeten een aantal responsen uitgebracht zijn sinds de laatste bekrachtiging alvorens het individu een volgende bekrachtiging krijgt Fixed ratio schema (FR) o Deelnemer moet een vast aantal responsen uitvoeren om een bekrachtiging te bekomen o Bv. FR4= de 4de respons wordt telkens bekrachtigd, onafhankelijk van de tijd die nodig is om 4 responsen te stellen o Vinden plaats in situaties waar er altijd een vaststaande hoeveelheid moeite gedaan moet worden om een taak te beëindigen/ bekrachtiger te verkrijgen o Grafiek: Getrapt patroon Postreinforcement pause: Na een bekrachtiger worden er telkens even geen responsen uitgebracht 45 Hoe hoger de ratio vereisten, hoe langer de pauzes duren (bv. bij FR10 zijn er langere pauzes dan bij FR2) Ratio run: Na een pauze krijg je een hoogfrequente responsreeks die leidt tot een bekrachtiging Variabel ratio schema (VR) o Er moet een bepaald aantal responsen uitgebracht worden alvorens er een bekrachtiging komt. Het aantal varieert over verschillende bekrachtigingen heen o Bv. VR4: gemiddeld zijn er 4 responsen nodig voor er een bekrachtiging komt, onafhankelijk van de tijd die nodig is om de responsen uit te brengen o Grafiek Lineair patroon Er is een regelmatige en hoogfrequente responsreeks Er zijn geen voorspelbare pauzes na een bekrachtiging 8.2.2 interval schema’s Tijd is de kritische factor Of een respons bekrachtigd wordt is afhankelijk van wanneer de respons optreedt na het begin van de interval cyclus Fixed interval schema (FI) o Een vaststaande hoeveelheid tijd moet gepasseerd zijn voordat een respons bekrachtigd word o Vinden plaats in situaties waarin het een zekere hoeveelheid van tijd vereist voordat de bekrachtiger bereid is/ opgezet is o Bv. FI4: het moeten altijd 4 minuten verstrijken voordat een nieuwe respons bekrachtigd wordt o Maar de bekrachtiger wordt niet automatisch gegeven na het einde van het interval! De instrumentele respons moet uitgebracht zijn Een het kritische interval verstreken is, blijft de bekrachtiger beschikbaar tot de eerst volgende respons o Te vroeg uitgebrachte responsen hebben geen effect. Ze worden noch beloond, noch bestraft o Grafiek: Schelpjes/ golfjes patroon postreinforcement pauze: Weinig/ geen reactie in het begin van een interval uitbrengen van responsen neemt toe naarmate het einde van het interval dichterbij komt, hoge mate van uitbrengen respons Variabel interval schema (VI) o De hoeveelheid tijd varieert van trial tot trial o Bv. VI4: gemiddeld moeten er 4 minuten verstreken zijn voor een nieuwe respons bekrachtigd wordt o Grafiek: Regelmatige en hoogfrequente responsreek ( wel minder hoge respons rates dan bij VR) Geen voorspelbare pauzes na bekrachtiging FI/VI met limited hold 46 o Eens het kritische interval verstreken is, blijft de bekrachtiging normaal beschikbaar tot de eerstvolgende respons o Bij limited hold: zodra de bekrachtiger beschikbaar is, blijft hij slechts een beperkte tijd beschikbaar o Het effect hiervan is dat de response- rate hoger is 8.3 mechanismen van schema performantie De aanbieding/ het optreden van een bekrachtiging geeft feedback over de operante respons Verschillende bekrachtigingsschema’s verschillen in de aard van de feedback die ze verschaffen Feedback functie: kijken hoe de mate van bekrachtiging gerelateerd is aan de mate van uitbrengen response 8.3.1 feedback functies van ratio schema’s Hoe snel een organisme beloond wordt, wordt bepaald door hoe snel het vereiste aantal responsen uitgebracht wordt o Hoe sneller het organisme reageert, hoe sneller het bekrachtigd wordt Feedback functie van een ratio schema is altijd een lineaire functie Hoe meer responsen er uitgebracht worden, hoe meer bekrachtiging Hoe hoger het ratio vereiste, hoe lager het lineaire verband 8.3.2 feedback functies van interval schema’s Als het organisme geen respons uitbrengt, zal het geen bekrachtiging krijgen Tot op een bepaalde hoogte zal een toegenomen aantal responsen gepaard gaan met hogere mate van bekrachtiging Wanneer alle responsen waarop men bekrachtigd kan worden gesteld zijn, krijg je geen extra bekrachtiging door nog meer responsen te stellen ( je krijgt dus een afvlakking van de curve) Niet enkel hoeveel responsen gesteld worden is van belang, hoe wanneer de responsen gestel worden o Er is geen lineaire toename o Het moment van de afvlakking van de curve is afhankelijk van wanneer de responsen uitgebracht worden 8.3.3 feedback functies en gedrag op bekrachtigingsschema’s Ratio schema’s resulteren in hogere mate van respons dan interval schema’s (ook bij vergelijkbare bekrachtigingsfrequentie) Hypothese: het verschil in feedbackfunctie is de oorzaak o Soort meta- leren: organisme weet wanneer het beloond zal worden o Ratio schema: hoe meer responsen, hoe meer bekrachtiging Differentiële bekrachtiging van hogere mate van respons o Interval schema: vanaf een bepaald moment leiden meer responsen niet tot meer bekrachtiging Vanaf dat punt is er geen differentiële bekrachtiging van hogere mate van respons Feedback functies zijn soms moeilijk te karakteriseren 8.4 chained bekrachtigingsschema’s Bij FR, VR, FI en VI gaat het om slechts één type respons Veel instrumentele respons situaties omvatten een sequentie van responsen/ respons componenten Chained bekrachtigingsschema’s o Sequentie van verschillende responsen 47 o Alle responsen moeten in een bepaalde volgorde uitgebracht worden voordat de finale uitkomst volgt o Elk respons component heeft een eigen geassocieerde stimulus 8.4.1heterogene ketens Sequentie van verschillende responsen (kwalitatieve verschillenà, waarvan elke respons uitgevoerd wordt in de aanwezigheid van een andere stimulus Elke respons component van de ketting produceert een nieuwe stimulusconfiguratie (tussentijdse outcome) die de stimulus vormt voor de volgende respons component Bv. pull aantrekken Er is geen bevrediging door bekrachtiging wanneer de respons sequenties halverwege onderbroken wordt 8.4.2 homogene ketens De verschillende componenten bevatten dezelfde respons maar elke component vindt plaats in de aanwezigheid van een eigen stimulus en heeft een eigen bekrachtigingsschema Komen minder frequent voor in het dagelijkse leven Een persoon moet dezelfde respons uitvoeren in verschillende contingenties gedurende verschillende delen van de taak Elke component van de keten produceert een patroon van responsen welke karakteristiek is voor het eenvoudige schema dat feitelijk van kracht is in dat component 8.4.3 trainen van respons ketens Backward chaining o De laatste respons van de ketting wordt eerst aangeleerd omdat het zich het dichtste bevindt bij de bekrachtiger o Vroegere responscomponenten worden toegevoegd eens het organisme het einde van de ketting onder de knie heeft o Primaire bekrachtiger duidt de laatste repons van de keten aan o Secundaire/ geconditioneerde bekrachtigers duiden het einde aan van een component respons o Kan zeer effectief zijn Forward chaining o Starten bij het begin en aanvankelijk de eerste respons in de ketting bekrachtigen o Eens de eerste respons aangeleerd is, kan de tweede volgen enz. o Elke component van de ketting moet aanvankelijk bekrachtigd worden met de primaire bekrachtiger o Erna wordt de bekrachtiging pas gegeven als het gedrag gesteld wordt die nodig is voor het verkrijgen van de volgende discriminatieve stimulus 8.5 concurrerende (gelijktijdige) schema’s Bij eenvoudige en chained schema’s: het organisme heeft de keuze: ofwel stelt het de vereiste respons, ofwel niet (= iets anders doen) In het echte leven moet er continu gekozen worden tussen verschillende mogelijke gedragingen/ activiteiten De analyse van het keuzegedrag vereist meer controle over of registreerbaarheid van het ‘iets anders doen’ Bij gelijktijdige schema’s staat de analyse van de keuze tussen twee/ meer gecontroleerde gedragsalternatieven centraal Of je het ene of het andere gedrag stelt, is afhankelijk van de voordelen die je krijgt bij elk van de alternatieven 48 Concurrerende schema’s vereisen minsten 2 respons alternatieven o Respons A en respons B gaan gepaard met een verschillend bekrachtigingsschema o Beide alternatieven zijn tegelijkertijd beschikbaar o Deelnemer kan op eender welk moment van de ene activiteit op de andere overschakelen Verschillende factoren beïnvloeden hoe organismen hun gedrag verdelen tussen de twee respons alternatieven o Aard van de verschillende responsen o Tijd/ moeite die verbonden is aan switch van de ene naar de andere respons o Aantrekkelijkheid van de verschillende bekrachtigers o Verschillende bekrachtigingsschema’s Meestal bestudeerd men situaties waarin enkel de aard van de bekrachtigingsschema’s verschilt bij beide alternatieven o Vaak uitgevoerd met duiven o 1 muur heeft 2 respons sleutels op dezelfde hoogte van het hoofd van de vogel met eronder een voedselbakje De twee responsen vereisen dezelfde moeite Bekrachtiging is de zelfde (voedsel) Dieren kunnen makkelijk overschakelen van de ene naar de andere respons Matching law o In een situatie van gelijke bekrachtigers, gelijke responsen en een lage switch kost geldt dat de relatieve mate van antwoorden op een respons alternatief gelijk is aan de relatieve mate van bekrachtiging die verkregen wordt door deze respons alternatief o R1 en R2: frequenties voor de respons alternatieven r1 en r2: frequenties van de (verdiende) bekrachtiging op beide alternatieven o Dus: als er twee mogelijke gedragingen kunnen worden gesteld, alternatief 1 en 2, en alternatief 1 heeft dubbel zoveel bekrachtigingen opgebracht dan alternatief 2, dan zal het organisme dubbel zoveel kiezen (in termen van frequentie of tijd) voor alternatief 1 dan voor alternatief 2 9. Theorieën over bekrachtiging Inleiding Elke goede theorie moet consistent zijn met de bevindingen die ze willen verklaren Goede theorieën moeten nieuw onderzoek stimuleren welk dient om de precisie van de theorie te evalueren en te doen toenemen Goede theorieën bieden inzicht in nieuwe manieren van denken over vertrouwde fenomenen Een theorie over bekrachtiging moet 2 vragen beantwoorden over instrumentele conditionering o Wat maakt iets een bekrachtiger en hoe kunnen we voorspellen of iets een succesvolle bekrachtiger is? Vraag naar identiteit van bekrachtigers o Hoe produceert een bekrachtiger zijn effecten of hoe produceert die een toename in de waarschijnlijkheid van de bekrachtigde respons Vraag naar het mechanisme van bekrachtiger 9.1Thorndike en de wet van effect Eerste systematische theorie over bekrachtiging Een positieve bekrachtiger is een stimulus welke een ‘bevredigende stand van zaken’ produceert Maar hij geeft geen antwoord op de wat vraag 49 o Waarom is iets bevredigends? o Enkel empirisch vast te stellen door het effect van een potentiele bevredigende stimulus X na te gaan: stijgt de probabilitiet/ frequentie van het operant dat resulteert in X? Thorndike geeft een label voor bekrachtigers, maar hij geeft geen verklaring voor wat iets een effectief maakt als bekrachtiger Law of effect (antwoord op de hoe vraag) o Een bekrachtiger maakt een associatie/ connectie tussen de instrumentele respons R en de stimuli S in de aanwezigheid waarvan de reactie uitgevoerd wordt Positieve bekrachtiger versterkt een S-R associatie Sterkere S-R relaties zullen leiden tot een hogere probaliteit van R in aanwezigheid van s o Bekrachtiger is niet iets waarover men leert, maar iets waardoor men leert Ondanks het feit dat de wet van effect een toegenomen instrumentele respons voorspelt in de training omgeving, het doet het door ‘een beetje magie’ in plaats van door een goed gevestigd proces Dus Thorndike biedt weinig meer dan een naam als antwoord op de vraag ‘wat maakt iets een positieve bekrachtiger’ Zijn antwoord op de hoe vraag was succesvol in die manier dat het het gedragsmatige effect van de bekrachtiger voorspelt. Maar het antwoord was oppervlakkig omdat het louter stelde dat een S-R associatie gevormd werd zonder te specifiëren hoe dit kwam 9.2 Hull en Drive reductie theorie Hull accepteerde het S-R versterkingsmechanisme dat gespecifieerd werd in de wet van effect Maar concentreerde zich meer op de vraag ‘wat maakt iets een effectieve bekrachtiger’ Homestase: o Organismen verdedigen een stabiele staat ten opzichte van bepaalde kritische biologische factoren Bv. voedseldeprivatie leidt tot een toegenomen honger toestand Voedselconsumptie reduceert deze honger toestand o De psychologische consequentie hiervan is een motivationele of behoefte toestand o Wat een stimulus een bekrachtiger maakt is zijn effectiviteit om een behoeftetoestand te reduceren 9.2.1 primaire bekrachtigers Deprivatie procedures die biologische homeostatische systemen uitdagen, maken bepaalde prikkels automatisch (zonder training of leerervaringen) tot efficiënte bekrachtigers o Bv. voedsel, warmte, drinken Met dit soort bekrachtigers zal gradueel de behoefte bevredigd worden en zal de prikkel steeds meer mate van bekrachtiging verliezen Primaire bekrachtiger: stimulus welke effectief zijn in het reduceren van een biologische nood zonder een eerdere training 9.2.2 secundaire bekrachtigers en verworven drives Stimuli die geen behoefte toestand reduceren maar hun bekrachtigingskenmerken verkrijgen door associatie met een primaire bekrachtiger o De stimuli zijn via Pavloviaans leren geassocieerd met een primaire bekrachtiger Bv. geur (VP) van voedsel (OP) o Ze reduceren op zich geen biologische behoefte toestand o Maar ze verwerven een bekrachtigend vermogen door de associatie met prikkels die wel rechtstreeks een biologische behoefte toestand reduceren 50 Stimuli die geassocieerd worden met een primaire behoefte toestand worden veronderstelt een conditionele / verworven toestand ontlokken Prikkels die een verworven behoeftetoestand reduceren, zijn ook effectieve bekrachtigers o Dit concept is vooral gebruikt in de context van aversief- gemotiveerd gedrag (negatieve bekrachtiging) o Bv. geconditioneerde vrees en ontsnappings-/vermijdingsgedrag 9.2.3 sensorische bekrachtigers De theorie was succesvol uitgebreid naar situaties welke geen primair biologische behoeften bevatten Maar theorie was niet in staat om al de instanties van bekrachtiging te verklaren Bepaalde gedragingen worden in stand gehouden door prikkels die noch als primaire noch als secundaire bekrachtiging kunnen worden geconceptualiseerd o Bv. hendeldrukkenlicht/ donker voor ratten die lange tijd in het donker/licht verblijven o Allerlei vormen van prutsen, bewegen Hiervoor wordt de term sensoriële bekrachtiging gebruikt o In veel situaties, kan een sensorische stimulatie, zonder duidelijke relatie met een biologische nood of behoefte toestand dienen als een effectieve bekrachtiger (bv. muziek) 9.3 bekrachtigers als responses David Premack: zag bekrachtigers van en volledig verschillend perspectief Hij kaderde het probleem van bekrachtiging in termen van activiteiten/gedrag niet in termen van de stimuli o Bv. hendel drukkenvoedsel Vroeger: voedsel: bekrachtiger Premarck: het opeten van het voedsel: bekrachtiger/ bekrachtigde respons 9.3.1 het Premack principe Wat maakt eten anders dan hendel drukken? o Hendel drukken moet aangeleerd worden, eten niet o Eten kan overal plaats vinden, hendel drukken niet o Vereisen andere spieren o… De kritische preconditie voor bekrachtiging is niet een behoefte toestand. Het is het bestaan van twee responsen die verschillen in hun probabiliteit van optreden wanneer het organisme vrije toegang krijgt tot beide activiteiten Premarck principe: de gelegenheid om de respons met de hoogste probabiliteit uit te voeren zal dienen als bekrachtiger voor de respons met de lagere probabiliteit o = differentiële probabiliteit principe o Bv. als hendel drukken (lage probabiliteit)eten (hoge probabiliteit) dan zal eten fungeren als bekrachtiger voor hendel drukken o De specifieke aard van de instrumentele respons en bekrachtiger maakt niet uit o De enige vereiste is dat de ene respons meer waarschijnlijk is dan de andere 9.3.2 de Premack revolutie Premack principe o Noodzakelijke en voldoende vorowaarde voor een bekrachtiging is dat er een contingentie bestaat tussen een laag- waarschijnlijke en een hoog- waarschijnlijke activiteit 51 o Irrelevant Onderscheid tussen primaire en secundaire bekrachtigers (HULL) Onderscheid tussen reductie van behoefte toestand vs. sensoriële bekrachtiging (HULL) Biedt handig hulpmiddel voor de toepassing van instrumentele conditionering in een verscheidenheid van educationele setting 9.3.3 toepassingen van het Premack principe Educationele contexten: studenten worden aangemoedigd om nieuwe responsen te leren en uit te brengen o Doel: de probabiliteit van lage probabiliteit responsen te verhogen o Instrumentele conditionering is hier uitermate geschikt voor, maar men moet eerst een geschikte bekrachtiger vinden Volgens Premack is een bekrachtiger eender welke activiteit die de participant meer waarschijnlijk zal uitvoeren dan de instrumentele respons Alles wat je moet doen is toegang te bieden tot de hoge probabiliteit respons enkel als de student eerst het gedrag met de lage probabiliteit uitvoert 9.3.4 theoretische problemen Twee tekortkomingen met het differentiële probabiliteitsprincipe o Hoe meet je en bereken je precies de baseline- probabiliteit van een respons? Daarboven op is de probabiliteit van een respons geen constante maar kan fluctueren In praktijksettings kan het omzeild worden met token systeem o Dit principe biedt enkel een antwoord op de wat vraag, niet op de hoe vraag Hoe/ via welk mechanisme zorgt contingentie tussen laag waarschijnlijk en hoog waarschijnlijk gedrag voor een toename in de probabiliteit/ frequentie van het laag waarschijnlijk gedrag 9.4 de respons deprivatie hypothese Timberlake & Allison Poging om een antwoord te bieden op de theoretische problemen die het Premack principe niet kon oplossen Ze denken aan bekrachtigers als responses ipv als stimuli (PREMACK) Startpunt: verschil tussen een instrumentele respons en een bekrachtigende respons Ze suggereerde dat het kritische verschil tussen instrumentele responsen en bekrachtigersresponsen is dat de deelnemers vrije toegang hebben tot de instrumentele respons maar beperkt zijn om de bekrachtigende respons te stellen o Instrumentele conditionering situaties ontnemen de deelnemers de vrije toegang tot de bekrachtigende respons o Bv. hendel drukken is vrij beschikbaar, eten is beperkt en conditioneel beschikbaar De restrictie op de beschikbaarheid van de bekrachtigende respons, maakt deze tot bekrachtiger o Eten wordt bekrachtiger, niet omwille van een behoefte reductie of omdat het een hoog waarschijnlijke respons is maar omwille van de door de operante contigneties ingevoerde restrictie op eetgedrag 9.4.1 Respons deprivatie en de wet van effect Bv. 1 keer op hendel drukken voldoende voedsel voor 1 week o Thorndike: “een positieve bekrachtiger is een prikkel die een bevredigende toestand teweeg brengt” 52 Het zou dus een sterke bekrachtiger moeten zijn, dus een sterke S-R connectie, dur P(R) stijgt sterk o Respons deprivatie analyse: er is geen restrictie op de bekrachtigende respons (eten) dus is er een weinig bekrachtigende waarde, dus P(R) stijgt weinig Er is geen restrictie meer op eetgedrag, dus de motivatie tot hendel drukken valt weg De kritische factor is dat een instrumentele conditionering procedure een restrictie plaats op het eten Deze respons deprivatie maakt van eten een bekrachtiger Wanneer de respons deprivatie verwijderd wordt, zal instrumenteel reageren niet toenemen; de instrumentele respons zal niet bekrachtigt worden 9.4.2 respons deprivatie en respons probabiliteit Respons deprivatie hypothese vereist geen berekening van respons probabiliteiten Om respons deprivatie toe te passen moet iemand slecht de rate van responsen tijdens een baseline periode te bepalen in de afwezigheid van eender welke restrictie en dan moet men de toegang tot de bekrachtigende respons beperken tot onder het baseline niveau Voorspelling: zelfs een respons met een lage waarschijnlijkheid kan een bekrachtiger worden o De mogelijkheid om een lage probabiliteit respons uit te brengen kan gebruikt worden om een gedrag met een hogere respons probabiliteit te bekrachtigen wanneer de toegang tot de laag probabiliteit respons reeds beperkt is tot onder de baseline o Tegengesteld aan Premack principe, maar wel evidentie voor gevonden! 9.4.3 respons deprivatie en de locus van bekrachtigers effecten In eerdere theorieën werd bekrachtiging verklaard in termen van factoren buiten de instrumentele conditioneringsprocedure zelf Respons deprivatie theorie: de locus van bekrachtiging blijft bij hoe de instrumentele conditioneringsprocedure de activiteiten van het organisme beperkt o Dus in de verklaring van ‘wat iets tot bekrachtiger maakt’ vindt er een verschuiving plaats van factoren gelegen buiten de operante contingentie naar factoren die intrinsiek verbonden zijn aan de operante contingentie zelf Net zoals het Premack principe biedt de respons deprivatie hypothese enkel antwoord op de Hoe vraag 9.5 de gedragsregulatie benadering Veel gelijkenissen met de respons deprivatie hypothese o Bekrachtigers niet zien als prikkels, maar als responsen / activiteiten o Geen speciale soort activiteiten, maar elke soort activiteit die ingeperkt is onder de baseline frequentie kan als bekrachtiger fungeren Wil ook een antwoord geven op de HOE vraag o Maakt gebruik van het begrip homeostase en breid het uit tot respons keuze o Gedragsmatige homeostase in analoog aan psychologische homeostase Zijn beide gericht op het behouden van een optimale toestand van een systeem Bij afwijking van de optimale toestand worden processen geactiveerd die een terugkeer naar de optimale toestand moeten bewerkstelligen 9.5.1 het gedragsmatige bliss point = distributie van gedrag over verschillende respons alternatieven in de afwezigheid van eender welke restrictie o Bliss= opperste vreugde, extase 53 o Wat iemand zou doen op een dag indien hij zonder enige beperking van welke aard ook zou kunnen doen waar hij zin in heeft o De geprefereerde respons keuze voordat een instrumentele conditionering procedure opgelegd is 9.5.2 instrumentele contingentie opleggen De realiteit staat haaks op het gedragsmatige bliss point Instrumentele contingenties leggen restricties op op de beschikbaarheid van verschillende respons alternatieven Instrumentele contingenties maken verschillende respons alternatieven conditioneel op, afhankelijk van elkaar o ‘schedule line’: afhankelijke relatie tussen twee alternatieve gedragingen, welke het gedragsmatige bliss point niet kruist o Zie schematische voorstelling blz. 147 Dit veroorzaakt afwijking van het gedragsmatig bliss point. Het zal een aanpassingsproces activeren die gericht is op de terugkeer naar de optimale toestand o Aanpassingsproces: verschuivingen in de distributie tijd/ activiteit die besteed wordt aan verschillende respons alternatieven o Gericht op het zo dicht mogelijk benaderen van het gedragsmatige bliss point o Vaak is er slecht een benadering van het bliss point mogelijk, nooit echt een bereiken van de optimale toestand 9.5.3 reageren op schema beperkingen Afhankelijk van de (relatieve) kosten en vaten die verbonden zijn aan de verschillende mogelijke verschuivingen in distributie o Bv. als schoolwerk maken erg vervelend is, zal ze niet meer schoolwerk doen, en minder muziek beluisteren o Als muziek erg belangrijk is, en schoolwerk niet echt aversief, zal ze meer schoolwerk doen en zo ook meer muziek kunnen luisteren Afhankelijk van de aan-/afwezigheid van substituten voor ingeperkte activiteit o Bv. als muziek beluisteren onvervangbaar is, zal ze meer schoolwerk doen o Als tv kijken een goed substituut is voor muziek, zal ze niet meer schoolwerk maken, minder muziek beluisteren en meer tv kijken o ! men moet zeer voorzichtig de toegankelijkheid van substituten beoordelen wanneer men een applicatie van instrumentele conditioneringsprincipes ontwerpt o Het is belangrijk om de volledige rang van activiteiten van het individu te controleren wanneer een instrumentele conditioneringsprocedure opgelegd wordt om een gewenste verandering in gedrag te bekomen 9.5.4 bijdragen van gedragsregulatie Gedragsmatige regulatie benadering heeft onze begrijpen van instrumenteel gedrag bevorderd omdat het denken over instrumentele conditionering en bekrachtiging aangemoedigd heeft binnen de context van het totale gedragsmatige repertoire van de participant Instrumentele conditioneringsprocedures treden niet op in een gedragsmatig vacuüm, ze verstoren de vrije doorgang van gedrag Focust de aandacht op het feit dat beperkingen op respons keuze niet enkel effecten kan hebben op instrumentele en bekrachtigende responsen. Kan ook resulteren in veranderingen aan gerelateerde responsen welke niet onmiddellijk deel uit maken van de instrumentele procedure Moedigt aan om te denken over instrumenteel gedrag van een breder perspectief 54 10. Extinctie van geconditioneerd gedrag Inleiding Extinctie gaat om het weglaten van de bekrachtiger of ongeconditioneerde stimulus In klassieke conditionering: herhaalde presentaties van geconditioneerde stimulus zonder US Instrumentele conditionering: de bekrachtiger niet meer aanbieden als een consequentie van de instrumentele respons Resultaat: afname van conditionele respons Geen spiegelbeeld van acquisitie Extinctie ≠vergeten o Vergeten resulteert uit het verloop van de tijd o Extinctie treedt op als gevolg van herhaalde presentatie van CS alleen of door herhaalde gevallen van de instrumentele respons zelf 10.1effecten van extinctie procedures Bv. thuis komen en sleutel werkt niet meer in het slot o Na S(RO) krijg je S(R/) Twee soorten effecten o Primair gedragsmatig effect van extinctie: Eerst R een tijdje blijven herhalen Dan afname/ verdwijnen van R Toename in de variabiliteit van R o Emotioneel effect Frustratie/ agressie 10.2 extinctie en het oorspronkelijk geleerde Voornamelijk binnen het Pavloviaans leren zijn er duidelijke aanwijzingen dat de extinctieprocedure de voordien geleerde VP-OP associatie niet uitwist 10.2.1 spontaan herstel Eén van de kenmerkende eigenschappen van extinctie is dat het verdwijnt met de tijd Het louter verstrijken van de tijd zorgt vaak voor een terugkeer van de voordien uitgedoofde geconditioneerde responsen o Acquisitie gevolgd door extinctie gevolg door periode van rust o Terugkeer is vaak partieel o De respons na een rust periode is hoger dan het was op het einde van de eerste reeks extinctie trials Dit effect vinden we terug bij zowel klassieke als bij operante conditionering Te vergelijken met “spontaan herstel” na habituatie Dit effect toont aan dat de oorspronkelijke associatie niet uitgewist wordt Dit is één van de redenen waarom slechte gewoonten kunnen terugkeren na een poging om ze uit te wissen 10.2.2 renewal van originele exitatorische conditionering Bouten e.a Verwijst naar het herstel van VR wanneer de contextuele cues die aanwezig waren tijdens extinctie veranderd zijn ABA renewal o Acquisitie wordt in context A gegeven, extinctie in context B o In de test wordt terug gekeerd naar de acquisitie context o Resultaat: R was hersteld na terugkeer naar de acquisitie conditie ABC renewal 55 o Acquisitie wordt in context A gegeven, extinctie in context B o De test wordt in een nog andere context C gegeven (neutrale context) AAB renewal o Extinctie en acquisitie worden in dezelfde context A gegeven o De test vind plaats in een nieuwe, neutrale context Renewal effecten treden op omdat het geheugen specifiek is voor cues die aanwezig waren tijdens de extinctie fase Implicaties o Extinctie effecten zijn specifiek o Extinctie effect impliceert niet dat de associatie verleerd is o Assymetrie: acquisitie generaliseert goed naar nieuwe contexten, extinctie niet o Hypothese bouton: extinctie is een functie van de context- gecontroleerde inhibitorische VP-OP associatie Bouton o In de acquisitie fase wordt een exitatorische associatie aangeleerd tussen CS en US VP is eenduidig en voorspelt OP o Tijdens extinctie wordt een inhibitorische associatie aangeleerd VP heeft twee betekenissen: voorspelt zowel de aanwezigheid als de afwezigheid van OP o Een prikkel die zowel acquisitie als extinctie heeft gekend is ambigu Op deze ambiguïteit op te lossen wordt gebruik gemaakt van de context Acquisitie: VP voorspelt OP Extinctie: VP voorspelt OP, maar niet in context X extinctie leren is specifieker dan acquisitie leren Belangrijke implicaties voor gedragstherapie : o exposure behandeling: in therapie kan angst overwonnen zijn, maar buiten therapie terugkeer o Problemen die gecreëerd werden door conditionering lijken meer verspreid te zijn dan de oplossingen voor deze problemen Experiment o Acquisitie fase: angst ontwikkelen voor gezichten (gezichtshock) o Extinctie fase: gezichten aanbieden zonder shock o Test fase: angst meten bij CS Bij AAA is er geen terugkeer van verwachting Bij ABA is er een terugkeer van verwachting o De CR neemt toe na een switch in de context ABA>ABC>AAB 10.2.3 reinstatement van geconditioneerde bekrachtiging Terugkeer van VR door post extinctie ervaringen met de OP alleen Procedure o Acquisitie in context A (CSUS) o Extinctie in context A (CS/) o US ongesignaleerd alleen aanbieden (US) o Terug CS aanbieden (CS) 56 Cruciaal dat de test plaatsvindt in dezelfde context waarin de reinstating OP ervaren werd Als de US in de test kwalitatief verschilt maar emotioneel gelijk is aan de US in acquisitie, kan het zelfde effect bekomen worden o Resultaat: enorme terugkeer naar geconditioneerde respons Experiment o Acquisitie fase: cirkelshock o Extinctie fase: cirkels aanbieden zonder shock o Fase 3: onvoorspelbare US aanbiedingen o Test fase: o Resultaten: Toename van geconditioneerde angstrespons na het aanbieden van een onvoorspelbare US Men is wel angstig voor CS+, niet voor CS- (dit komt doordat CS+ ambigu is) 10.2.4 gevoeligheid aan post extinctie OP/bekrachtiger devaluatie Uitgangspunt: proefopstelling waarbij postconditionerings- OP devaluatie effect aantoonbaar is o Fase 1: CSUS+ o Fase 2: US-: betekenis US veranderen in afwezigheid CS o Fase 3: reactie op CS nagaan Als extinctie een intacte CS-US associatie overlaat, dan zal US devaluatie de reactie op een uitgewiste CS verstoren net zoals het de reactie op een CS die niet uitgewist was verstoort Probleem: na extinctie is er geen observeerbaar gedrag meer o Oplossing: er is terug een hoge VR door de associatie van VP met een andere OP Resocorla: o appetitieve conditionering ratten VP1-OP1 (lichtvoedsel) VP2-OP2 (toonsucrose) VR= magazine behavior o Extinctie van VP1 en vP2 in de extinctie groep (niet in controle groep) Uitdoving tot gedrag helemaal niet meer getoond wordt o Training met nieuwe OP3 VP1-OP3 (licht – polycoce) VP2-OPR (toon-polycose) o OP1-devaluatie Voedsel-LICL o Test: VP1? VP2? o Resultaat: Het algemene niveau van CR ligt lager in de extinctiegroep dan in de controle groep In beide groepen is er een even sterke gevoeligheid aan OP devaluatie Het post extinctie revaluatie effect is even groot als het post acquisitie revaluatie effect extinctie laat de associatie intact o Kritiek: geconditioneerde stimulus bleef gevoelig voor devaluatie van zijn geassocieerde US omdat er te weinig extinctie trials uitgevoerd werden Gelijkaardig experiment met operante R-O associatie o R1-O1 en R2-O2 training o Extinctie van R1 en R2 (niet in controle groep) o R1-O3 en R2-O3 training o Devaluatie O1 57 o Test: R1 is kleiner dan R2 ook zo in controlegroep R-O associaties zijn relatief ongevoelig voor modificatie eens ze getraind zijn 10.3 wat wordt er geleerd in extinctie 10.3.1 Inhibitorische S-R associaties Onderzoekers kwamen tot de conclusie tan niet bekrachtiging produceren een inhibitorische S-R associatie o Het niet bekrachtigen van een respons in de aanwezigheid van een specifieke stimulus produceert een inhibitorische S-R associatie welke dient om de respons te onderdrukken als S aanwezig is o Deze hypo voorspelt dat de effecten van extinctie hoog specifiek zijn voor de context waarin de respons uitgewist werd Extinctie gaat over een specifiek type van niet bekrachtigen, namelijk niet bekrachtigen na een geschiedenis van bekrachtigen o Niet bekrachtigen zonder deze voorgeschiedenis is geen extinctie maar eerder habituatie Extinctie gaat gepaard met gedragsmatige en emotionele effecten o Frustratie wordt uitgelokt wanneer een verwachte bekrachtiger uitblijft o Men verwacht dat het uitblijven van een bekrachtiger in het licht van de verwachting van een beloning ene ongeconditioneerde aversieve frustratie reactie uitlokt Dit dient om het reageren te ontmoedigen tijden de extinctie door de oprichting van een inhibitorische S-R associatie Experiment o Fase 1: discriminatie training Bepaalde respons (Rc) leidt tot voedsel in de aanwezigheid van licht (L) of toon (N) Doel: bij beide discriminatieve stimuli de verwachting van voedsel installeren zodat tijdens de extinctie fase frustratie opgewekt kan worden o Fase 2: nieuwe respons leren in afwezigheid van discriminatieve stimuli Hendeldrukken (R1)voedsel Touw trekken (R2)voedsel Doel: de target responsen voor de extinctie fase installeren zonder dat S-R leren met betrekking tot L en N een rol kan spelen bij acquisitie o Extinctiefase Presentaties van L en N met R1 en R2 Bij N zal R1 niet leiden tot beloning Bij L zal R2 niet leiden tot beloning Doel: nagaan of er tijdens extinctie ene inhibitorische S-R associatie onstaat tussen (N-R1) en (L-R2) o Test fase L aanbieden en dier kan kiezen tussen R1 of R2 uitbrengen Als inhibitorische associatie zal R1 minder frequent uitgevoerd worden dan R2 N aanbieden en dier kan kiezen tussen R1 of R2 uitbrengen Als inhibitorische associatie zal R2 minder frequent uitgevoerd worden dan R1 o Resultaten ITI= basislijn De stimuli welke extinctie ondergingen: (uitbrengen van de respons bij de prikkel waarbij uitgedoofd werd): aantal R2 bij L en aantal R1 bij N Stimuli die geen extinctie ondergingen: aantal R2 bij N en aantal R1 bij L De reacties bij extinctie waren duidelijk lager dan die zonder extinctie 58 Deze resultaten duiden aan dat de extinctie procedure een inhibitorische S-R associatie tot stand bracht elke specifiek was voor een bepaalde stimulus en respons 10.4 paradoxale beloningseffecten Algemeen idee: als extinctie veroorzaakt wordt door het frustrerende effect van de afwezigheid van de verwachte bekrachtiging, zou men des te sneller extinctie bekomen naargelang tijdens acquisitie een grotere/ sterkere verwachting van de bekrachtiging gecreëerd werd 10. 4.1 overtraining extinctie effecten Effect van extensieve bekrachtigde training gevolgd door extinctie Hoe meer training (acquisitie) met bekrachtiger, hoe sterker de verwachting voor een beloning gecreëerd wordt o Overtraining: bij het bereiken van plafond toch verder aanbieden o Controle groep: bereiken ook criterium maar geen voertraining De frustratie effecten zullen groter zijn De daling in respons in extinctie is te wijten aan frustratie effect. Daardoor zal een meer extensieve training een snellere extinctie veroorzaken Paradoxaal: minder responsen in extinctie na een meer extensieve training (dus de respons is niet in meerdere mate bestand tegen extinctie) 10.4.2 omvang van bekrachtiging extinctie effecten Respons neemt sneller af in extinctie wanneer een sterkere bekrachtiger gebruikt werd, zeker wanneer training een continue bekrachtiging inhoudt Meer frustratie wanneer men een grote beloning verwachtte dan wanneer men een kleine beloning verwachtte 10.4.3 partiële bekrachtiging extinctie effecten Dit effect is het meest extensief onderzocht Een sleutel begrip welke de kracht van zowel de emotionele als de gedragsmatige effecten van extinctie bepaald is het schema van bekrachtiging dat voor extinctie geïntroduceerd wordt Het dominante schema kenmerk welke extinctie beïnvloed is continue bekrachtiging vs. partiële/ onderbroken bekrachtiging o Bevinding: extinctie is trager en betreft minder frustratie reacties als er gebruik gemaakt werd van gedeeltelijke bekrachtiging in plaats van continue bekrachtiging Bv. bij FR5 heb je trager extinctie dan bij FR1 (hoe frequenter bekrachtiging, hoe sneller extinctie 10.4.4 mechanismen van partiële bekrachtiger extinctie effecten Discriminatie hypothese: na een continue bekrachtiging is het veel eenvoudiger om de overgang van de bekrachtigde fase naar extinctiefase te detecteren dan na partiële bekrachtiging o Discriminatie tussen beide fasen is eenvoudige o Maar de hypo klopt niet : EXP Fase 1 Groep 1: partiële bekrachtiging Groep 2: continue bekrachtiging Fase 2 Continue bekrachtiging voor beide groepen voordat extinctie wordt uitgevoerd 59 Als er sprake is van discriminatie zouden beide groepen even snel extinctie moeten vertonen Fase 3: resultaat van extinctie Bij partiële bekrachtiging daalt de respons trager dan bij continue bekrachtiging Het lijkt dus dat subjecten iets lang durend leren van de partiële bekrachtiging wat overgedragen wordt door de fase van continue bekrachtiging Discrimineerbaarheid blijkt dus niet cruciaal te zijn o Ondanks een episode van continue bekrachtiging krijg je tragere extinctie o Tijdens de partiële bekrachtigingsfase leerde men om niet op te geven bij een mislukking, deze aangeleerde volharding overleeft de episode van continue bekrachtiging o Hoe zorgt partiële bekrachtiging ervoor dat een stop in de bekrachtiging niet nefast hoeft te zijn? twee alternatieven welke complementair zijn Frustratietheorie Sequentiële theorie Frustratietheorie o Gebaseerd op wat subjecten leren over de emotionele effecten van niet beloond te worden tijdens partiële bekrachtigingsfase o Leren gebeurt in verschillende stadia bij partiële bekrachtiging Initieel krijg je bij partiële bekrachtiging tegenstrijdige verwachtingen wat leidt tot een responsconflict (de ene keer wel bekrachtiging, de andere keer niet) Soms verwacht je geen beloning bij het uitbrengen van de respons, maar krijg je er toch één (beloning is niet voorspelbaar)subject leert het gedrag te stellen ondanks dat ze verwachten geen beloning te zullen hebben Zo wordt het conflict opgelost: altijd een respons stellen. Wat leidt tot een trage extinctie o Bij een continue bekrachtiging is het onmogelijk om te leren dat het nuttig is om gedrag te blijven stellen Sequentiële theorie o Gebaseerd op wat subjecten leren over geheugen over niet beloond worden o Aanname 1: subjecten herinneren of ze al dan niet bekrachtigd werden voor het uitbrengen van de instrumentele respons in het recente verleden ze herinneren zich zowel trials met bekrachtiging als zonder bekrachtiging o Aanname 2: tijdens partiële bekrachtigingstraining wordt de herinnering aan de nietbekrachtigde trials een cue op de operante respons uit te brengen Dit produceert volharding tegen extinctie Hoe dit precies gebeurt hangt grotendeels af van de sequentie van de beloonde en onbeloonde trials welke toegediend waren in het partiële bekrachtigingsschema o Bv. RNNRRNR Met R: bekrachtiging en N: geen bekrachtiging 4e trial is cruciaal: bekrachtigd worden na twee keer niet beloond te worden Subject herinnert zich de voorbij 2 trials Herinnering aan NN wordt een cue om de respons uit te brengen Laatste trial cruciaal: Herinnering aan N wordt cue om respons uit te brengen o Algemene regel: als op de vorige trials geen bekrachtiging verkregen is, dan gaat men respons uitbrengen biedt weerstand tegen extinctie 60 Extra: context en conditionering 1. Inleidende gevalsstudie: Lucy Fictieve beschrijving van een klinische case van paniekstoornis o Eerste paniekaanval in auto terwijl ze onderweg was naar sterfbed grootmoeder o Nu heeft ze herhaaldelijk paniek aanvallen welke in ernst en frequentie toenemen Klinische beeld van paniekstoornis bevat twee unieke aversieve emotionele fenomenen: vrees/ paniek en angst o Bv. eerst vrees voor de paniekaanvallen, daarna angst dat er een paniekaanval zou kunnen komen Vanuit pavloviaans leren zijn onvoorspelbare stressoren gekend voor hun mogelijkheid om een conditioneringen aan contextuele kenmerken te installeren 2. angst versus vrees: een klinisch onderscheid Vanuit een evolutionair perspectief zijn vrees en angst adaptieve (automatische, aangeboren) en noodzakelijke functionele gedragssystemen die overleving van een organisme bevorderen in schadelijke of bedreigende situaties o Deze adaptieve verdedigingstoestanden kunnen nefast worden wanneer ze Te vaak optreden Optreden buiten iemands controle om Significante disstress veroorzaken welke interfereert met het dagelijkse leven Vanuit een klinisch perspectief is het algemeen aanvaard dat vrees en angst unieke aversieve emotionele toestanden zijn welke verschillende aspecten van angststoornissen representeren o Vrees: Een fasische respons uitgelokt door de blootstelling aan of anticipatie met een aversieve, goed gedefinieerde en onmiddellijk bedreigende stimulus Het subjectieve gevoel van intense vrees wordt typisch vergezeld met Een sterke automatische arousal Sterke tendens tot vermijdingsgedrag o Angst Meer aanhoudende, toekomst georiënteerde, en algemene vorm van disstress in de afwezigheid van een objectieve bron van gevaar Geassocieerd met de ongeruste anticipatie van opkomende potentieel gevaar en volgt een meer persistente weg Gegeneraliseerde angststoornis: prototypische angst pathologie Paniekstoornis Bestaat zowel uit vrees als angst Paniek aanval: een plotse ervaring van intense vrees/ onbehagen welke gepaard gaat met een aantal fysische en mentale symptomen Daarnaast is er een substantiële en aanhoudend niveau van angst, zorgen maken en spanning, veroorzaakt door de anticipatie op mogelijk terug optreden van onvoorspelbare paniek aanvallen en hun potentiële desastreuze consequenties Post traumatische stress stoornis Ontwikkelt na de blootstelling met een hoge fysisch of psychologisch traumatische gebeurtenis Ontwikkelen symptomen van vrees voor discrete aanwijzingen welke als herinnering fungeren aan de traumatische gebeurtenis Patiënten vertonen ook persistente symptomen van angst Obsessief compulsieve stoornis Terugkerende obsessies/ compulsies welke in grote mate interfereren met het dagelijks functioneren 61 Obsessies: terugkerende en aanhoudende ideeën, gedachten, impulsen en impressies welke ervaren worden als opdringerig en ongepast (Angst) Compulsie: herhaaldelijke en rigide rituele/mentale acts met als doel om de obsessieve gedachten te voorkomen/neutraliseren (vrees) 3. vrees conditionering als een model voor geactiveerde vrees 3.1 vrees conditioneringsprocedure Een initieel neutrale stimulus (CS) (bv. geometrische vorm) wordt herhaaldelijk aangeboden met een aversieve outcome (US) (bv. elektrische shock) Na een aantal gepaarde presentaties wordt de CS en een betrouwbare voorspeller voor de US en begint anticiperende vrees responsen uit te lokken (CR) Associaties worden gevormd tussen de mentale representaties van de CS en de US Door de herhaalde paring, verwerft de CS de mogelijkheid om de mentale representatie van de US te activeren, wat zal resulteren in de productie van de CR door de presentatie van de CS alleen De vorming van de associatie tussen US en CS wordt gezien als het sleutel mechanisme onderliggend de oorsprong van vrees en fobieën 3.2 extinctie van verworven vrees Pavloviaanse extinctie procedures zijn sterk capabel in het reduceren van specifieke angst leren Geconditioneerde vrees reacties zwakken/ verdwijnen na een herhaalde exposure aan de vrees ontlokkende stimulus in de afwezigheid van de aversieve outcome Exposure= basiselement van de behandeling van fobie en angststoornissen = de herhaalde confrontatie met het object van vrees Uitwissen van vrees o Consolidatie: korte termijngeheugen opslaan in lange termijn geheugen o Reconsolidatie: een adaptief update mechanisme waarbij nieuwe informatie samengevoegd wordt met oude, volledige geconsolideerde herinneringen o Na retrieval (= heractivatie) van vrees herinneringen worden deze herinneringen tijdelijk vatbaar voor veranderingen Farmacologische blokkade van het reconsolidatie proces Medicijn (propranolol) op zicht zorgt niet voor een effect. Maar de daling in angst is te wijten aan de combinatie van het medicijn samen met het terug aanbieden van foto’s Het introduceren van nieuwe informatie tijdens het reconsolidatie venster Er is een bepaalde periode waarin goede exposure kan plaatsvinden Ook hier geldt dat het 10 minuten interval niet voldoende is, er is ook een reminder van de spin nodig 3.3 herstel van verworven vrees CR kan herstellen door o het verstrijken van de tijd o na een verandering in context o of volgend op een ongesignaleerde aversieve gebeurtenis Extinctie wist het voordien verworven vrees geheugen niet uit, maar brengt het leren van een nieuwe, contextueel gecontroleerde veilig geheugen met zich mee, welke tijdelijk de voordien verworven vrees geheugen onderdrukt Er is dus nood aan nieuwe methodes die de originele angst/vrees herinnering meer permanent kunnen veranderen o Retrieval cues 62 Experiment Conditie 1 (ABA) o CS+ en CS- aanbiedingen samen met een cue o In extinctie fase de CS aanbieden zonder de cue en zonder de US o In test fase CS en cue aanbieden Conditie 2 (ABA) o CS+ en CS- aanbiedingen o In extinctie fase de CS aanbieden met cue en zonder de US o In test fase CS en cue aanbieden Resultaten: sterke renewal wanneer getest met een acquisitie retrieval cue dan met een extinctie retrieval cue o Extinctie in meerdere contexten Als je in meerdere contexten extinctie toepast heb je een grotere kans dat de testcontext en de extinctiecontext gemeenschappelijke kenmerken hebben 4. onvoorspelbaarheid en context conditionering: een model van angst Angst wordt niet uitgelokt door discrete stimuli welke de aanwezigheid van een stressor signaleren, maar wordt gekarakteriseerd door de afwezigheid van specifieke predictoren van bedreiging 4.1 onvoorspelbaarheid van angst Voorspelbaarheid van bedreiging is inherent voor de oorsprong van specifieke vrezen en fobieën Onvoorspelbaarheid = de afwezigheid van een objectieve voorspeller van gevaar o Heeft centrale rol in de ontwikkeling en het behoud van een meer chronische anticiperende angst respons Onvoorspelbaarheid is karakteristiek voor verschillende angststoornissen 4.2 empirisch onderzoek over onvoorspelbaarheid Onvoorspelbare aversieve gebeurtenissen zijn meer verstorend/ stressvol dan situaties waarin de aversieve gebeurtenissen voorspelbaar zijn Labo studies met dieren o Onvoorspelbare aversieve condities ontlokken meer negatieve somatische stress reacties o Dieren geven voorkeur aan voorspelbare situaties ipv onvoorspelbare aversieve situaties Empirische studies met mensen o Inconsistente resultaten o Meerderheid van de studies rapporteren dat mensen meer chronische angst, fysische arousal en verminderde performantie ervaren wanneer ze geconfronteerd worden met onvoorspelbare stressors dan met voorspelbare stressors o Mensen verkiezen over het algemeen voorspelbaarheid boven onvoorspelbaarheid In het algemeen is het vastgesteld dat onvoorspelbare aversieve gebeurtenissen zowel bij dieren als bij mensen een variëteit van cognitieve, affectieve en somatische verstoringen kan produceren welke dicht gerelateerd zijn een psychopathologische symptomen zoals geobserveerd bij gegeneraliseerde/ chronische angst 4.3 veiligheidssignaal hypothese Selingman en Binik Een organisme kan makkelijk leren om gevaar of een bedreiging te voorspellen wanneer er betrouwbare predictoren beschikbaar zijn. Tegelijkertijd leert het organisme dat de afwezigheid van het signaal de afwezigheid van gevaar voorspelt 63 o Voorspelt een stress vrije periode waarin het organisme kan ontspannen en zich veilig voelt o Dit zal leiden tot een reductie van de totale hoeveelheid van aversiviteit geproduceerd door de grotere episode/ experimentele context Wanneer er geen discrete signalen beschikbaar zijn om de bedreiging te voorspellen, kan het organisme veiligheidssignalen niet identificeren en blijft het in een toestand van chronische angst in deze context 4.4 context conditionering als een model voor angst Vrees o Stimulus specifiek- discreet o Directe bedreiging o Prototypische pathologie: fobie Angst o Niet stimulus specifiek- ongebonden o Constant onbehagen/ stress/ spanning o Prototypische pathologie: GAS Leren over predictors voor bedreiging is een goed model voor de oorzaak van specifieke vrezen en fobieën Dit kan gemodelleerd worden door een geactiveerde vrees conditioneringsprocedure waarin een aversieve US herhaaldelijk gepaard gaat met een discrete CS. Na herhaalde paringen zal de CS een fasische CR ontlokken welke lijkt op vrees Vanuit associatief leer perspectief o Contextuele stimuli kunnen Directe exitatorische kenmerken verwerven en contextuele vrees uitlokken Directe inhibitorische kenmerken verwerven o RW: simultaan gepresenteerde stimuli concurreren voor de beschikbare associatieve sterkte Stimulus competitie perspectief Stimulus welke de US het beste voorspelt zal het grootste deel van de beschikbare associatieve sterkte verzamelen Uitdoving is te wijten aan het feit dat de associatieve sterkte van de CS afneemt o De context zal de meeste associatieve sterkte verwerven in situaties waarin de US onvoorspelbaar is De experimentele context is de enige gebeurtenissen welke systematisch samen gepresenteerd word met de onvoorspelbare aversieve US Bestudering van contextconditionering verdient specifieke aandacht voor verschillende redenen o Context conditionering en stimulus conditionering verschillen in de manier waarin ze het optreden van de aversieve gebeurtenis voorspellen Voorspelling op basis van stimulus is veel preciezer dan voorspelling op basis van context Stimulus voorspelt dat US zal optreden Context voorspelt alleen dat het mogelijk is dat US optreedt 5.menselijk onderzoek op onvoorspelbaarheid, context conditionering en angst 5.1 laboratorium gebaseerde conditionering procedure om angst in mensen te bestuderen Grillon en Davis: innovatief shock conditioneringsprocedure o Gebaseerd op startle reflex paradigma Vrees versterkende startle reflex o Operationele en solide meting van vrees en angst in dieren en mensen 64 o Automatische respons po een hoog intensieve en indringende stimulus met een abrupt begin (= startle probe)(bv. sterk geluid) o Als de startle probe gegeven wordt in een neutrale context, dan zal er geen systematische verandering zijn in de amplitude van de startle respons o Wanneer de context voordien gepaard was aan een aversieve ongeconditioneerde stimulus zal de amplitude van de startle reflex versterkt worden o Startle probes kunnen zowel aangeboden worden in de aanwezigheid van discrete stimuli als in de aanwezigheid van de experimentele context Experiment Grillon en Davis o 2 sessies die identiek zijn Habituatie fase Pre- conditioneringsfase (om startle op de CS te boordelen) Conditioneringsfase (CS en US worden aangeboden) Gepaarde conditie: Discrete CS (neutrale visuele stimulus) werd aangeboden met een aversieve shock (US) Ongepaarde conditie: De shock werd ongepaard aangeboden met de zelfde CS (dus was temporeel onvoorspelbaar) Postconditioneringsfase (beoordelen van conditionering op CS in afwezigheid US In sessie 2 fungeert dit als een retentie test Startle versterkt door de specifieke cues was een index voor ‘cued vrees’ basislijn van startle respons : Angst ontlokt door de experimentele context werd bekomen door startle probes aan te bieden in afwezigheid van CS o resultaten: gepaarde conditie startle respons was toegenomen in de aanwezigheid van een discrete stimulus onmiddellijk na acquisitie training en na het retentie interval geen substantiële toename van de baseline respons ongepaarde conditie toegenomen baseline respons o suggereert dat de contextuele stimuli die geassocieerd waren met het experiment, werden ontlokker van chronische angst in mensen na een administratie van onvoorspelbare shock aanbiedingen geen toegenomen startle respons voor de CS 5.2 context conditionering, associatief leren en online US- verwachting metingen onderzoek naar de ontwikkeling van cue- en context conditionering door online US verwachtingen ratings toe te voegen naast de vrees toenemende startle metingen online US ratings laten onderzoekers toe om de graduele ontwikkeling van US-(CS/context) contingentie leren op een trial bij trial basis te bestuderen in de afwezigheid van een betrouwbare voorspeller van bedreiging, verwerft de context gradueel associatieve sterkte over de trials heen dit suggereert dat context conditionering gebaseerd is op een associatief leer proces 5.3 vrees en angst conditionering in angststoornissen de vrees / angst distinctie is herhaaldelijk bevestigd in laboratorium gebaseerd onderzoek bij angstpatiënten verbeterde aanhoudende of contextuele angst is overvloedig aanwezig in individuen die lijden aan een zekere vorm van angststoornissen zoals PTSS en PS o patiënten vertonen angst om dreigend gevaar maar zijn oversensitief voor contextuele informatie 65 o vertonen ook significant toegenomen baseline startle respons vergeleken met gezonde personen mogelijke verklaring voor de toegenomen angst tijdens anticipatie van onvoorspelbare predictor is dat de patiënten abnormaal sensitief zijn voor onvoorspelbaarheid kinderen waarvan de ouders een geschiedenis van angststoornissen hebben, kennen een verhoogde magnitude van startle reflex individuen welke bewust waren van de CS-US contingentie vertonnen een toename van basline startle respons bevestiging veiligheidssignaal hypothese 5.4 de neurobiologie van vrees vs. angst in (dieren en) mensen veel dier onderzoek verricht om inzicht te krijgen in de neurobiologische basis van vrees en angst amygdala is betrokken in de acquisitie en expressie van vrees conditionering hippocampus is betrokken bij angst conditionering procedure o zowel stimulus en context conditionering werden geïnstalleerd in ween within subject design o deelnemers worden geconditioneerd op een neutrale stimulus door herhaalde CS-US paren aan te bieden in een voorspelbare context o in een tweede onvoorspelbare context werd de context geïnstalleerd door US aanbiedingen zonder CS vrees en angst zijn neurobiologische dissocieerbare aversieve toestanden Extra: conditionering angstgenese Inleiding klassieke conditioneringsvisie op het ontstaan van angst: o neutrale stimulus wordt herhaaldelijk aangeboden met een aversief gevolg o resultaat: de neutrale stimulus verwerft angst o dit is een vrij blind proces: dergelijke associatie kan ontstaan tussen eender welke stimuli angsten en fobieën vinden plaats op eender welke random groep van objecten die geassocieerd zijn met trauma 4 kritieken op deze visie o Hoe kan een angstreactie ontstaan zonder een directe traumatische ervaring meegemaakt te hebben? (bv. ontwikkeling hondenfobie wnr je nog nooit gebeten bent) o Een zelfde traumatische ervaring kan verschillende uitkomsten hebben (bv. hondenbeet leidt niet altijd tot fobie) o Waarom kan je niet voor elke stimuli even makkelijk een fobie ontwikkelen? o Hoe kunnen interindividuele verschillen geplaats worden binnen de theorie? 1. Kritiek 1: geen rechtstreekse traumatische ervaring Naast directe conditionering blijkt er ook sociaal leren te zijn van angst o Conditionering moet niet gaan over het instampen van een associatie tussen een stimulus en iets aversief. o Het gaat eerder om een proces van betekenisverwerving Kan verworven worden door observationeel leren en door leren via instructies Observationeel leren o Exp. Cook e.a: apen worden bang van slangen na het observeren van de fobische reactie van een andere aap o Exp. Helsen e.a. 66 Proefpersonen krijgen een filmpje te zien van iemand die meedoet aan een cold pressure taak Wanneer deze een hand in een roze bak steekt, vertoont die persoon een angstreactie Wanneer een hand in de gele bak gaat vertoont die persoon een neutrale reactie Wanneer de proefpersonen achteraf zelf hand in de bakjes moeten steken, valt op dat ze angstiger zijn bij het roze bakje Leren via instructies o Exp. Field e.a.: In een klasje worden 2 nieuwe stimuli (2 poppen aangeboden) De kinderen moeten aangeven hoe angstig ze zijn ( basislijn van angst) Daarna wordt een verhaal verteld over de knuffels Over knuffel 1 wordt een positief verhaal vertelt Over knuffel 2 wordt een negatief verhaal vertelt Achteraf terug een meting van angst Resultaat: angst voor knuffel 2 is hoger dan angst voor knuffel 1 Zijsprong: signaal leren kan gebruikt worden voor extinctie of voor het selectief maken van vrees o Bv. exp. Boddez e.a Fase 1: training waarbij CS1 en CS2 gevolgd worden door dezelfde US Fase 2: proefpersonen krijgen de instructie dat CS1 gevaarlijk is Fase 3: meting van angst Resultaat: afname van angst voor CS2 Als je identificeert wat de oorzaak is van het gevaar, dan gaan de andere prikkels hun potentieel om angst uit te lokken verliezen o Backward blocking procedure Fase 1: AB+/AC+ training Fase 2: proefpersonen krijgen te horen dat stimulus A de shock veroorzaakte tijdens de training Resultaat: meer angst voor prikkel A dan voor prikkel B terwijl ze beiden even informatief waren voor het voorspellen van shock 2. Kritiek 2: traumatische ervaring met verschillende uitkomsten Eenzelfde traumatische ervaring leidt de ene keer wel en de andere keer niet tot een angstpathologie Mensen verschillen in levenservaringen We moeten hierbij niet enkel kijken naar de traumatische leerervaring op zich maar ook naar o Ervaringen voor de traumatische gebeurtenissen o Situationele kenmerken tijdens de traumatische gebeurtenis o Ervaringen na de traumatische gebeurtenis 2.1 leerervaringen voor de traumatische ervaring Stress enhanced leren o Exp. Rau e.a Controle groep: proefpersonen krijgen een milde shock in context B Experimentele groep: proefpersonen kregen eerst 15 shock aanbiedingen in context A waarna een milde shock in context B In de experimentele groep wordt de milde shock in context B gevolgd door een buitensporige angstreactie o Welk proces zou hier aan de grondslag van kunnen liggen? Is er sprake van een generalisatie en summatie van de verschillende contexten? 67 Zou de angst van conditie 1 gegeneraliseerd worden naar conditie B? Zou de angst in A optellen met de angst in B? NEEN: als we voordat we de milde shock in context B aanbieden, de angst voor context A doen uitdoven, dan nog is er een buitensporige angst op te merken Is er door de aanbieding van 15 pijn shocken een verhoogde pijn reactiviteit? Als je al veel pijn gehad hebt, zal een nieuwe shock meer pijn doen NEEN: het gedrag van ratten vertoont geen verhoogde pijn reactiviteit Er is sprake van een sensitisatie effect waarbij men gevoeliger wordt voor de prikkels Het gaat dus om een niet associatief effect o Implicatie voor post traumatische stress stoornis Na een zeer traumatische gebeurtenis kunnen milde trauma’s ook zeer hoge angst opwekken Patiënten kennen een hogere gevoeligheid om ook voor andere stimuli fobieën te ontwikkelen Latente inhibitie o X- gevolg door X+: de voorafgaande X- training vertraagt de acquisitie o Bv. kinderen die een aantal keer naar de tandarts gaan zonder dat ze daarbij pijn ervaren zullen minder snel angst krijgen na een blootstelling van pijn bij tandarts Voorafgaande ervaringen kunnen dus kwetsbaar maken (stress enhanced leren) of immuniseren (latente inhibitie) 2.2 situationele kenmerken tijdens de traumatische gebeurtenis Bv. exp. Meulders et a.e o Marsmannetjes o Als je op spatie drukt, schiet je op marsmannetjes en krijg je punten o In de US alone conditie hebben marsmannetjes een schild. Als je dan schiet, verlies je veel punten o Conditie 1: door op andere knop te drukken kan je de invasie van marsmannetjes beëindigen o Conditie 2: geen controle over de invasie van marsmannetjes o Resultaten: minder contextconditionering als je controle hebt over het beëindigen van de US Exp. Sanderson e.a. o Proefpersonen moeten CO2 inademen o In beide condities wordt gezegd dat als er een lampje brand, ze de toevoer van CO2 kunnen toedraaien Conditie 1: lampje brandt altijd Conditie 2: lampje brandt nooit o Resultaat: minder subjectieve angst wanneer je controle hebt Klinisch voorbeeld: o Meisje 1 wordt gebeten door een hond maar kan de hond zelf van zich afduwen voor ze ernstig gewond raakt o Meisje 2 wordt gebeten door de hond maar kan de hond niet wegduwen o Resultaat: het tweede meisje ontwikkeld een fobie voor honden, het eerste meisje niet Controle hebben over een traumatische gebeurtenis heeft een grote impact om hoe sterk angst geconditioneerd is door de CS paring met het trauma 2.3 leerervaringen na de traumatische ervaring Exp. Rescorla: US inflatie o Dieren krijgen eerst een toon-shock paring o Daarna worden ze blootgesteld aan ongesignaleerde shocken 68 Zelfde intensiteit Iets hogere intensiteit Veel hogere intensiteit o Resultaat: dieren welke blootgesteld werden aan shocken met een hogere intensiteit dan de originele toon-Shock paring vertoonden een toegenomen angst US hoeft zelf niet opnieuw aangeboden te worden o Het is voldoende om (mondelinge) informatie te geven over de stimuli o De mentale representatie van de US kan veranderen door info te geven over de US o Bv. US-inflatie: pukkelpop: veel mensen zijn aan het drama ontsnapt zonder ernstige gevolgen. Door achteraf de erge gebeurtenissen te horen, ontwikkelen ze meer angst o Bv. US- devaluatie: behandeling van paniek: info geven dat paniekervaring niet levensbedreigend is en de patiënten dat laten ervaren vermindering in het potentieel van paniekaanvallen (minder angst voor de stimuli) Exp. Joos e.a. o Effecten van rumineren nagaan o Acquisitie fase: CS1 en CS2 worden gekoppeld aan zelfde US (een luide schreeuw) o Onmiddellijke rehaersal: vlak na acquisitie moet proefpersoon terug denken aan de paring van CS1 met US o Na een week volgt een tweede test o Tijdens de week moet de proefpersoon terugdenken aan de associatie tussen CS1 en US o Resultaat: tijdens de tweede rehearsal test is er een daling in de angst voor CS2 maar de angst voor CS1 blijft hoog o Verklaring US inflatie proces Door ruminatie begin je te catastroferen Als dit klopt zou je dezelfde angst moeten zien op beide CS’ en Dit is niet het geval, dus geen sprake van US inflatie Gaat om louter versterken van de associatie 3. Kritiek 3: verschillen tussen stimuli Als neutrale stimuli blind gepaard gaan met aversieve stimuli, waarom komen dan niet alle fobieën even frequent voor en ontwikkelen voor sommige stimuli geen fobieën 3.1 niet equipotentionaliteit voor CS-US Equipotentionaliteits principe gaat ervan uit dat om het even welke CS-US associatie met het zelfde gemak geleerd kan worden o Gaat niet op! Exp. Garcia e.a.: smaak aversie leren o CS bestaat uit een smaak of een audiovisuele stimulus o De US bestaat uit misselijkheid of een shock o De smaak-misselijkheid en de audiovisuele stimulus- shock kennen sterkste associatie o Dus niet elke associatie wordt even gemakkelijk aangeleerd 3.2 angst relevante stimuli Öhman e.a. o Evolutionaire theorie: evolutie zorgt ervoor dat we snel angst ontwikkelen voor stimuli die een bedreiging vormen voor ons voortbestaan o Het gaat niet om aangeboren fobieën maar wel om zeer snel aan te leren en moeilijk af te leren fobieën 69 3.3 prikkelcompetitie Verschillende stimuli worden samen gepresenteerd met de aversieve stimuli: alleen voor sommige van deze stimuli wordt er angst ontwikkeld Prikkelcompetitieprocedure: meerdere CS’ en gaan vooraf aan de US Bv. Blokking o A+ training gevolgd door AB+ o De angst voor B blijft laag ondanks paring met US Klinisch: als je paniekaanvallen steeds vooraf gaan door interne stimuli en je dan een paniekaanval krijgt in een winkel met deze interne stimuli. Dan ga je doorgaans geen vrees ontwikkelen voor de winkel, maar wel voor de stimuli 4. Kritiek 4: interindividuele verschillen Er zijn een groot aantal interindividuele verschillen die niet erkent worden door de klassieke conditioneringsvisie De psychologische interindividuele verschillen verklaren voor 41% angstresponsen De effecten van interindividuele verschillen zijn niet altijd aanwezig o Er moet voldaan zijn aan bepaalde grensvoorwaarden opdat individuele verschillen een impact hebben Wat is de rol van veiligheidsleren o Angstpatiënten kunnen CS+ niet goed onderscheiden van CSo Ze kunnen veilige situaties dus niet goed onderscheiden van gevaarlijke situaties Conditionele inhibitie o Chan en Lovibon A+ /AB-training Hoog angstige personen vertonen meer angst op AB-trials dan controle personen Dus ook in veilige situaties hebben ze angst Inhibitie van delay o Gebruik maken van een erg lange CS (bv. toon) gevolgd door een US o In het begin van het aanbieden van de trials zien we een angstrespons optreden gedurende de volledige duur van de CS o Na verloop van tijd leert het individu dat in het begin van de CS het nog veilig is, en krijg je pas een verhoogde angst respons gedurende de laatste 5 seconden van de CS o Sociale angststoornis Minder inhibition of delay: patiënten hebben angst tijdens ze een speech moeten geven, maar ook lang voordien kennen ze al angst Kennen een hoge mate van trait worry: piekeren over aversieve gebeurtenissen die zouden kunnen plaatsvinden Blokking o Exp. Boddez e.a. A+/ AB+ studie Bij een hoge mate van trait angst vertoon je minder blokkering het veiligheidsleren is dus verstoort Generalisatie studie: Lissek e.a. o Proefpersonen krijgen cirkels te zien van verschillende grootte CS-= kleine cirkel Cs+= grote cirkel o Wat is de mate van generalisatie? Controle groep: bij de gegeneraliseerde stimuli (de cirkels tussen in) vindt een daling plaats van de angstrespons Angstpatiënten vertonen meer generalisatie 70 Gaat het wel om een goed model? De CS heeft bewezen dat hij gevaarlijk is, dus automatisch wordt er angst voor ontwikkeldis dit dan wel een goed model voor angstpatiënten 5. nieuwe poging Hoe kan een bijgespijkerde theorie tegemoet komen aan de kritieken? We hebben ontdekt dat interindividuele verschillen een rol spelen maar welke mechanismen liggen hierbij aan de grondslag? RW verklaart blocking met weinig ruimte voor individuele verschillen o o Een US moet verrassend zijn/ onverwacht zijn opdat het effectief is om leren te produceren o Nieuwigheid van de US hangt af van de associatieve waarde van al de stimuli die de US voorafgaan op een gegeven trial o Vorming van de associatie tussen A en US op AB+ trials is geblokkeerd, doordat de US niet verrassend meer is gegeven de eerdere A+ trials Alternatief: cognitief stadia model o Stimulus competitie in associatief leren kan verkregen worden, ongedaan worden of beïnvloed worden door een variëteit van cognitieve processen welke kunnen spelen in 3 fasen in blokking Encoding fase: A+ / AB+ training Retentie fase Performantie fase (test fase) o Het model claimt recht te doen aan de plasticiteit van stimulus competitie o De processen komen ook aan bod in andere disciplines binnen de psychologie, maar door ander woordgebruik viel dit niet op o Evidentie gevonden voor een hele hoop cognitieve processen die een rol spelen bij blokking Aandachtsregulatie (tijdens encoding) Aandacht afwenden van redundante stimuli (stimulus B) Mensen met hoge trekangst hebben minder aandachtscontrole Werkgeheugen Dual task condities: andere taak interfereert met blokking Hoge mate van trekangst, minder capaciteit van werkgeheugen redeneren 11. Straffen Inleiding in een straf procedure wordt een aversieve gebeurtenis geleverd contingent op de performantie van een instrumentele respons straf kan zeer effectief zijn in het onderdrukken van gedrag zolang ze correct toegepast wordt aversieve gedragscontrole o positieve straf: positieve contingentie tussen de respons en een negatieve outcome o negatieve straf: negatieve contingentie tussen respons en positieve outcome hier in eerste instantie focus op positieve straf o verwachte effect: vermindering/ verdwijnen van de bestrafte operant o effectiviteit: afhankelijk van een hele reeks factoren, vaak intuïtief niet zo vanzelfsprekend maatschappelijk/ ethisch/ pedagogisch controversieel o straf is niet noodzakelijk lichamelijk pijnlijke prikkels o veel vormen van straf: verbaal straffen/ beripsen, boetes, time- out, verlies privileges, blaam,… 71 o onderscheid tussen toegediende en natuurlijke straf Positieve (R-O) contingentie Negatieve (R-O) contingentie Positieve, gewenste, voordelige outcome Positieve bekrachtiging Negatieve, ongewenste, schadelijke outcome Positieve straf Negatieve straf Negatieve bekrachtiging 11.1effectieve en ineffectieve straf 11.1.1 wanneer straf faalt voorbeelden o verkeer en verkeersboetes o gevangeniswezen en recidive o straf in pedagogische context o… In al deze gevallen wordt straf uitgevoerd door een individu ipv dat het automatisch gebeurt Straf vindt plaats met tussenpozen Straf wordt uitgesteld Straf is initieel mild en neemt dan toe in ernst na herhaalde overtredingen Straf wordt vaak aangekondigd door een discriminatieve stimulus 11.1.2 wanneer straf werkt Voorbeelden o Kachel aanraken, elektrische afsluiting van een weiland o Omkiepen kajak bij te ver naar zijkant leunen o… Straf vindt consistent plaats Straf vindt onmiddellijk plaats Vanaf de eerste overtreding is de straf intens Straf wordt niet aangekondigd 11.2 experimentele evidentie van straffen 11.2.1 Respons- outcome contingentie Straf betreft een positieve contingentie tussen de instrumentele respons en de outcome (~positieve bekrachtiging) Fundamentele variabele in straf is de respons-outcome contingentie Hoe sterker de respons- outcome contingentie, hoe meer specifiek de respons supressie is die geproduceerd wordt straf Straf is effectiever en specifieker naarmate P(O|R) >P(O| niet R) Effecten van de manipulatie van P(O&R) bij constant houding van P(O| niet R) o Fase 1: acquisitie: keypeckvoedsel o Fase 2: keypeckshock/voedsel (per conditie andere probabiliteiten) o Resultaten: Straf leidt tot een daling van het uitbrengen van het gedrag Bij een volledige contingentie tussen het gedrag en de straf verdwijnt het gedrag Dus hoe meer straf, hoe beter vermindering gedrag Wat als P(straf | niet R) ≠0 o O| nietR: pavloviaanse vreesconditionering CER op context of specifieke prikkels 72 o Bij een lage R-O contingentie krijg je soms een algemene suppressie van het gedrag door contextuele angst o Is er dan nog een onderscheid tussen Respons onafhankelijke en respons afhankelijke toediening van de aversieve stimulus? JA Rechtstreekste vergelijking respons-onderdrukking door respons- contingente straf vs. pavloviaanse CER Hendeldrukken voedsel CS1 (visuele prikkel)+ hendelshock (om de 3 hendel drukken) CS2 (toon)+ hendelshock (onafhankelijk van hendeldrukken) o Als er bv. op 20 en op 50 seconden een shock werd gegeven bij CS1, dan zal dit ook op die tijdstippen gegeven worden bij CS2 o Hier is dus enkel contextconditionering mogelijk Resultaten o In beide gevallen krijg je een onderdrukking van hendel drukken o Bij contextconditionering is er minder onderdrukking 11.2.2 respons- outcome contiguïteit Belang van onmiddellijke straf Interval tussen de doelrespons en het aanbieden van de straf is van cruciaal belang o In sommige omstandigheden veroorzaakt een gedrag automatisch een bepaalde consequente aversieve prikkel o In laboproeven/training/ therapeutische toepassingen is het de proefleider die bepaalt of en wanneer een aversieve prikkel wordt toegediend Straf is het meest effectief als de aversieve stimulus gepresenteerd wordt zonder vertraging na de doelrespons Bij uitgestelde bekrachtiging is de kans groot dat een ander gedrag dan het doelgedrag bestraft gaat worden 11.2.3 intensiteit van de aversieve stimulus De respons suppressie effecten van straf zijn direct gerelateerd aan de intensiteit van aversieve stimuli Lage intensiteit van straf produceert slecht milde suppressies van gedrag Dramatische suppressie van gedrag kan resulteren uit het gebruik van intense aversieve stimuli De effecten van de intensiteit van straf hangt grotendeels af van de eerdere ervaringen met straf o In het algemeen reageren individuen op een nieuw niveau van straf op dezelfde manier als hoe ze reageerde gedurende eerdere ontmoeting met straf Als er eerst een milde straf is aangeboden zal een sterke straf slecht geringe effecten hebben in tegenstelling tot wanneer er direct een sterke straf gegeven wordt Als er eerst een zeer intense straf gegeven wordt en erna een milde straf, dan zullen de effecten bij de milde straf veel groter zijn dan wanneer er onmiddellijk milde straf gegeven wordt 11.2.4 gesignaleerde straf Discriminatieve straf: straf welke gesignaleerd wordt door een discriminatieve stimulus Algemene principes van prikkelcontrole op operant leren zijn ook geldig bij straf Discriminatieve straf procedures resulteren in discriminatieve suppressie van gedrag Discriminatieve controle van straf responsen kan problematisch zijn maar niet altijd o Als je wil dat de respons altijd uitblijft, moet je zorgen dat ze niet gesignaleerd wordt door een bepaalde prikkel 73 11.2.5 straf en mechanismen voor het behoud van de bestrafte respons Straffen worden toegepast op responsen die reeds voorkomen door een of andere reden Bestrafte responsen worden soms behouden door een vorm van positieve bekrachtiging De effecten van straf zijn afhankelijk van het type bekrachtiging en bekrachtigingsschema welke de doelrespons steunt o Je krijgt een kosten baten probleem o Gedrag dat vaak/altijd bekrachtigd is, is minder gevoelig voor straf dan gedrag dat slechts gedeeltelijk wordt bekrachtigd o VI of FI schema’s: het algemene niveau van het gedrag daalt maar de temporele distributie blijft behouden o FR: post- reinforcement pauzes zullen langer duren, weinig effect op ratio run 11.2.6 straf en bekrachtiger van alternatief gedrag De effecten van het bestraffen van een bepaald gedrag hangt sterk af van het al dan niet aanwezig zijn van een alternatief gedrag welke tot dezelfde outcome leidt o Is er geen alternatief aanwezig, dan zal er relatief weinig effect zijn van straf o Is er een alternatief aanwezig dan zal er een sterk effect zijn van straf Men heeft een alternatief, dus men bekomt zeker het gewenste gedrag, het heeft geen nut meer om straf te blijven krijgen voor een bepaald gedrag Dus bekrachtiging van een alternatief gedrag zorgt voor een sterkere onderdrukking van het bestrafte gedrag Zeker indien het alternatieve gedrag incompatibel is met het bestrafte gedrag Experiment mannelijke rokers o Fase 1: hendel drukken R1 en R2 bekrachtigd met de aanbieding van een sigaret o Fase 2: introductie van straf contingentie R1- aversief geluid, bovenop de bekrachtiging contingentie Conditie 1: enkel R1 is beschikbaar Conditie 2: R1 en R2 zijn beschikbaar o Resultaten Is er een alternatief aanwezig, dan verdwijnt het doelgedrag bij straf Is er geen alternatief aanwezig, dan krijg je een afzwakking van het gedrag maar de respons rate is nog steeds relatief hoog 11.2.7 paradoxale effecten van straf Straf zal niet effectief zijn wanneer de bestrafte respons behouden wordt door een sterk positief bekrachtigingsschema o Het bestrafte gedrag zal juist meer uitgebracht worden Straf als een signaal voor een positieve bekrachtiging o Bv. een kind dat gestraft wordt, krijgt ook aandacht o Experiment Fase 1: keypecks worden bekrachtigd met voedsel Fase 2: indroductie van strafcontingentie, milde shock tot er een reductie is van de respons rate tot 50% Fase 3: alternatie tussen 2 periodes, niet gesignaleerd Keypeckbekrachtiging voedsel en straf Keypeckgeen bekrachtiging en geen straf Resultaat: meer keypecking tijdens de straf dan tijdens de veilige periodes Straf werd een signaal voor de beschikbaarheid van een positieve bekrachtiging Straf van vermijdingsgedrag 74 o Vermijdingsgedrag dient om een aversieve stimulus te beëindigen (voorbeeld van negatieve bekrachtiging) o Negatieve bekrachtiger: een respons beëindigd een aversieve stimulus en doet daarbij de probabiliteit van de respons toenemen o Vermijdingsgedrag wordt uitgebracht in aanwezigheid van aversieve stimulus. Dit maakt de aanwezigheid van de aversieve stimulus een discriminatieve cue voor het vermijdingsgedrag o Bv. een kooi met 2 delen. Het dier zit in 1 deel waar het shock’s krijgtmen springt naar andere kant. Als dit gedrag ook bestraft wordt door shock zal het die het geleerde gedrag (naar andere kant springen) toe passen o Straf is inefficiënt bij ontsnappingsgedrag 11.3 kunnen en moeten we een samenleving creëren die vrij is van straf We kunnen geen straf vrije omgeving creëren o Straf is een onoverkomelijke consequentie van verschillende aspecten van de fysische en biologische omgeving Het soort straf dat het meest verwerpelijk is, is fysische pijn toegebracht door een persoon met als doel het gedrag van iemand anders te controleren Als straf voortvloeit uit frustratie of woede, dan wordt het meestal niet gelinkt aan een ongewilde respons o Vaak niet systematisch gestraft o Niet temporeel contigu op het ongewenste gedrag o Frustratie straffen is meestal onder discriminatieve stimulus controle waarbij de SD ongerelateerd is aan het bestrafte gedrag o Is wordt zelden vergezeld van een positieve bekrachtiging van alternatief gedrag o Straf als uiting van agressie of frustratie doet schade aan veel van de parameters van effectieve straffen en daardoor produceert het geen constructieve veranderingen in gedrag 11.4 Alternatieve voor straf 11.4.1 time- out Time out: tijdelijk ontzeggen van bronnen van positieve bekrachtiging, consequent op het stellen van het gedrag De consequentie van een ongewild gedrag vertonen is heen fysisch aversieve gebeurtenis maar een time-out van bronnen van positieve bekrachtiging De effectiviteit van deze procedure hangt af van het tijdsinterval tussen het doelgedrag en de time out consequentie. En op hoe consequent het gehanteerd wordt Of een substantiële reductie in bekrachtiging ervaren wordt, hangt af van hoe veel bekrachtiging op voorhand beschikbaar was vergeleken met de hoeveelheid bekrachtiging die aanwezig is tijden de time-out o Hoe meer bekrachtigers aanwezig voor time- out, hoe effectiever o Hoe minder bekrachtigers aanwezig tijdens Time- out, hoe effectiever 11.4.2 differentiële bekrachtiging van ander gedrag Differentiële bekrachtigingsprocedure (DRO) betreft een negatieve contingentie tussen een doelrespons en een bekrachtiger Negatieve straf: negatieve contingentie tussen doelrespons en positieve prikkel o Hoe meer het gedrag gesteld wordt, hoe minder je de positieve prikkel krijgt DRO veronderstelt dat indien ongewenst gedrag niet wordt gesteld, de positieve prikkel wel gegeven wordt Impliceert dat ander gedrag dan het ongewenste gedrag wel wordt bekrachtigd 75 En impliceert dat indien ongewenst gedrag achterwege blijft, de positieve prikkel blijvend gegeven moet worden 11.5 Theorieën over straf CER theorie van straf (Estes) o Pavloviaanse vreesconditionering van (contextuele) prikkels die bestrafte R voorafgaan freezing/ suppressie niet compatibel met R onderdrukking R o Bv. onzichtbare elektrische afsluiting (halsband hond) o Conform effecten intensiteit straf o Conform effecten respons- contingent vs. niet respons- contingent toedienen van straf Bij respons contingentie toediening: prikkels die CER uitlokken hebben meer kans om nauw verbonden te zijn met R en dus krijg je suppressie van R Vermijdingstheorie van straf (dinsmoor) o Vertrekt van CER assumptie: aversieve klassieke conditioneringsprikkels die bestrafte R voorafgaan o Organisme leert te ontsnappen aan deze vrees ontlokkende prikkels door alternatief gedrag te stellen dat niet compatibel is met het bestrafte gedrag o Het organisme leert deze prikkels te vermijden o Het effect van de straf is niet het afzwakken van het bestrafte gedrag maar het versterken van het alternatieve, niet compatibele ontsnappings-/vermijdingsgedrag o Problemen: post hoc karakter, wat zijn ‘vrees ontlokkende prikkels’, wat zijn de ‘alternatieve , niet compatibele responsen’ precies? 12. Vermijdingsleren Inleiding In straf procedures leidt de performantie van de instrumentele respons tot de presentatie van een aversieve stimulus In vermijdingsleren voorkomt/ blokkeert de performantie van de instrumentele respons de representatie van het aversieve gebeuren o Dus de motivatie is een aversieve stimulus o De contingentie tussen instrumentele respons en de motivationele stimulus is negatief o Het stellen van de vermijdingsrespons zorgt ervoor dat de negatieve outcome niet optreedt Voorbeelden o Leuning van trap vasthouden niet vallen o Afremmen met autogeen aanrijding o Jas aantrekkenniet ziek worden/ geen kou hebben o … Klinisch voorbeeld: smetvrees o Schrik voor bacillen o Handen wassenvorkomen van ziekte o Respons geen US / geen respons US 12.1 Belangrijkste vragen in de analyse van vermijdingsleren Wat bekrachtigt een vermijdingsrespons? o Vermijdingsgedrag wordt gevolgd door het uitblijven van een aversieve prikkel o Hoe kan ‘niets’ een gedrag bekrachtigen en leren produceren o De grootste verklaringen verwerpen het idee dat vermijdingsresponsen optreden omdat ze het optreden van de aversieve stimulus voorkomen Op welke manier zijn pavloviaanse processen betrokken bij vermijdingsleren o Historisch wordt vermijdingsleren beschouwt als een speciale vorm van pavloviaans leren o Nu is dit ontkrachtigd 76 o Maar de meeste theorieën erkennen nog steeds een belangrijke rol van Pavloviaanse conditionering 12.2 oorsprong van de studie van vermijdingsleren Bechterev Procedure o Mensen moeten vinger op metalen elektrode plaatsen o Een milde shock wordt toegediend via de plaatproefpersoon heft vinger op o Na een tijdje wordt de shock voorafgegaan door een toon o Resultaat: de proefpersonen heffen hun vinger op bij het horen van de toon In eerste instantie beschouwt hij dit als pavloviaanse conditionering Later bleek het eerder om instrumentele conditionering dan op pavloviaanse conditionering te gaan o De pavloviaanse contingentie wordt doorbroken door het opheffen van de vinger (terwijl dit juist zou moeten optreden onafhankelijk van het gedrag o Deelnemers hebben controle over de presentatie van de ongeconditioneerde stimulus 12.3 hedendaagse procedures van vermijdingsleren 12.3.1 gediscrimineerde/gesignaleerde vermijding De contingentie tussen bekrachtiging en contingentie is niet altijd in werking o Negatieve bekrachtigingscontingentie onder stimulus controle o Enkel bij de aanbieding van CS geldt dat R geen US Respons uitbrengen verhinderd de aanbieding van de bekrachtiger niet enkel tijdens discrete periodes/ trials wanner een CS of waarschuwingssignaal aanwezig is Het uitbrengen van respons is enkel effectief in het voorkomen van de aversieve stimulus wanneer de respons optreedt tijdens de trial periode, wanneer het waarschuwingssignaal aanwezig is Wat er gebeurt hangt af van het gedrag van de deelnemer o Shuttle box met twee delen. o Proefdier wordt in één deel van de kooi geplaatst o Toon voetshock o Als het proefdier tijdens de CS (toon) naar de andere kant loopt, dan stopt de CS en treedt US niet op o Actieve vermijding: proefdier loopt naar andere kant voor einde CS o Ontsnappingsgedag: proefdier loopt naar andere kant tijdens aanbieding US One way avoidance: o Proefdier wordt altijd aan zelfde kant geplaatst o De vermijdingsrespons houdt altijd in dat je naar de zelfde kant moet gaan o De kant waar proefdier start is altijd potentieel gevaarlijk o De andere kant is altijd veilig o Redelijk eenvoudig aan te leren Two way avoidance o Trials kunnen zowel links als rechts starten o Het dier moet altijd naar de andere kant lopen om veilig te zijn o Beide kanten van de box zijn potentieel gevaarlijk o Moeilijker te leren 12.3.2 niet gesignaleerde of vrij opperante vermijdingsprocedure Sidman Trials zijn niet beperkt tot perioden waarin een discrete stimulus aanwezig is Het proefdier kan de instrumentele respons op eender welk moment uitbrengen 77 Er wordt geen expliciet waarschuwingssignaal gebruikt en er zijn geen discrete trials o Vermijdingsrespons kan op eender welk moment uitgevoerd worden en levert altijd een voordeel op Procedure o Een milde shock wordt geprogrammeerd zodanig dat het telkens optreedt na een bepaald interval (bv. om de 15 seconden een shock) o S-S interval (Shock- Shock interval): tijd tussen optreden van twee shocks zonder vermijdingsgedrag o Performantie van vermijdingsgedrag creëert een periode van veiligheid waarin geen shocks aangeboden worden Bij het uitbrengen van vermijdingsrespons blijft de eerst volgende shock achterwege Bij uitbrengen van vermijdingsrespons wordt het R-S interval gereset en start opnieuw R-S interval (respons- Shock interval) Wanneer de shock optreedt wordt niet voorafgegaan door veiligheidssignaal o Elk optreden van het vermijdingsgedrag geeft voordelen De mate van voordeel hangt af van wanneer de respons gesteld wordt Treedt het gedrag vroeg op in R-S interval, dan heb je minder voordeel dan wanneer het gedrag optreedt tegen het einde van R-S interval 12.4 theoretische benaderingen voor vermijdingsleren 12.4.1 test voor de rol van instrumentele contingentie Bechterev: de vermijdingsrespons is een pavloviaanse CR en het voorkomen van het optreden van US is irrelevant Het idee dat de aversieve stimulus voorkomen irrelevant is voor vermijdingsleren in contraintuïtief en werd fout bevonden Exp. Brogden e.a. o Marmotjes in loopwiel o Elke trial start met een CS (toon)= waarschuwingssignaal o Pavloviaanse groep CSshock (op elke trial) o Instrumentele groep CSshock tenzij ze beginnen te lopen tijdens aanbieding CS o Als pavloviaanse conditionering volledig verantwoordelijk was voor vermijdingsleren, dan moet de pavloviaanse groep hogere responsratio’s vertonen Want in pavloviaanse groep is er perfecte contingentie En instrumentele groep niet o Resultaten Pavloviaanse groep hebben lagere responsratio’s dan instrumentele groep Dus de instrumentele contingentie levert een belangrijke bijdrage voor vermijdingsleren Toch blijven de twee hoofdvragen onbeantwoord door dit experiment Kon de rol die pavloviaanse conditionering speelt in vermijdingsleren niet verduidelijken 12.4.2 de twee factoren theorie van vermijding O.H. Mowrer Vermijdingsleren betreft zowel klassieke als instrumentele conditioneringsprocedures Klassieke conditionering resulteert in een emotionele toestand, namelijk vrees o Op trials waar het vermijdingsgedrag niet optreedt: CSaversieve US o Dit resulteert in de conditionering van angst op de CS De reductie/ eliminatie van angst wordt als bekrachtiger gezien Tweede proces: angstreductie 78 o Als het vermijdingsgedrag plaatsvindt, zorgt het gedrag ervoor dat de CS stopt en dat US niet optreedt. Er wordt verwacht dat dit leidt tot een daling in de geconditioneerde angst o Dus de tweede factor is instrumentele conditionering van de vermijdingsrespons door vreesreductie Dus vermijdingsgedrag wordt niet bekrachtigd door ‘niets’ maar door angstreductie Angstreductie is een vorm van negatieve bekrachtiging Interacties tussen klassieke en instrumentele factoren o Zowel pavloviaanse als instrumentele processen leveren bijdrage een vermijdingsleren o De twee processen zijn wederzijds afhankelijk op verschillende manieren Klassieke conditionering van angst is een noodzakelijke voorwaarde voor de instrumentele component Vrees kan niet gereduceerd worden als er in eerste instantie al geen vrees is Het instrumentele proces is afhankelijk van de integriteit van het pavloviaanse proces Het pavloviaanse proces wordt beïnvloed door de instrumentele contingentie, maar de invloed is verstoren Instrumentele respons zal leiden tot een extinctie van de vrees welke geconditioneerd werd door het waarschuwingssignaal Frequent vermijdingsgedrag zal resulteren in pavloviaanse extinctie van geconditioneerde angst Extinctie van angst ondergraaft e effectiviteit van angstreductie als een bron van instrumentele bekrachtiging Als de instrumentele vermijdingsrespons niet langer gevolgd wordt door angstreductie, dan zal de respons extinctie ondergaan Gevolg is dat het waarschuwingssignaal na verloop van tijd dus terug zal eindigen in de presentatie van de aversieve US Dit zal op zijn beurt de conditionering van het waarschuwingssignaal reactiveren Vermijdingsgedrag wordt bepaald door een continu veranderend dynamische interactie van pavloviaanse en instrumentele processen Experimentele evidentie pro de twee factoren theorie o Er is sprake van pavloviaanse vreesconditionering t.o.v. signaal/CS o Exp. Brown & Jacobs Fase 1: in shuttle box wordt pavloviaanse conditionering aangeleerd CS (toon)US (shock) Controle groep krijgt enkel CS aanbiedingen Er is geen ontsnappen/ vermijden mogelijk Fase 2 Aanbieding van CS CS wordt beëindigd door ontsnappingsrespons (nmlk naar ander compartiment gaan) Resultaat De controle groep leert de ontsnappingsrespons niet In de experimentele groep is er een duidelijke leercurve te zien Dus het ophouden van het signaal voor de geconditioneerde vrees fungeert als een effectieve bekrachtiger Uitdagingen voor de twee factoren theorie o Wat doen met vrij operante vermijding? Shocken vinden periodisch plaats zonder waarschuwingssignaal Elk optreden van de vermijdingsrespons initieert een periode van veiligheid Twee factoren theorie vereist een waarschuwingssignaal 79 Hoe kan de theorie dan vrije operant vermijdingsgedrag verklaren? rol temporele cues o Observatie: eens het goed geleerd is, blijft vermijdingsgedrag bestaan op hoog niveau voor langer periodes, zelfs wanneer de shocks niet langer gegeven worden Een lange periode van vermijdingsresponsen zou resulteren in pavloviaanse extinctie van vrees wat op zijn beurt zou leiden tot extinctie van instrumenteel vermijdingsgedrag Dit lijkt niet te gebeuren rol serieel vermijdingsleren o Succesvol vermijdingsgedrag gaat gepaard met een daling en uiteindelijke een afwezigheid van vrees Toch blijft vermijdingsgedrag bestaan Exp. Kamin e.a. : Onafhankelijke assessment sterke vreesconditionering tijdens het vermijdingsleren Fase 1: conditionering: hendel drukken voedsel Fase 2 o Eerst: toonshock (tenzij ze naar andere kant lopen) o Daarna: na een aantal succesvolle trials (1,3,9,27 – afhankelijk van groep) stopt de trial fase Fase 3: suppressie hendeldrukken door CS (want ze lopen telkens naar andere kant Resultaten o Er vindt suppressie plaats, welke toeneemt in functie van het aantal vermijdingstrials van 1-9 o Maar bij 27 trials zien we terug een afname (tot verdwijnen) van de suppressie o Succesvol vermijdingsgedrag gaat samen met het ophouden van vrees rol veiligheidssignalen 12.4.3 geconditioneerde temporele cues Aannemen dat interne cues die gerelateerd zijn aan het verloop van tijd geconditioneerde aversieve kenmerken verwerven Shocks worden niet voorafgegaan door waarschuwingssignaal, maar ze treden wel op op voorspelbare tijdstippen Het tijdsverloop is voorspeller voor wanneer de volgende shock zal optreden Vrij operant vermijdingsleren kan verklaard worden in termen van de twee factoren theorie door aan te nemen dat individuen de tijd gebruiken als een cue voor wanneer de shock zal optreden Temporele cues karakteristiek voor het einde van de S-S en R-S intervallen zijn anders dan de temporele cues die karakteristiek zijn voor het begin van deze intervallen o In het begin kunnen proefdieren het einde en begin van S-S en R-S intervallen niet onderscheiden o Ze leren snel het verschil vermits vroege en late temporele cues andere consequenties hebben o Temporele cues karakteristiek voor begin van interval gaan nooit gepaard met een shock o Shocken treden altijd op op het einde van het interval Temporele cues die karakteristiek zijn voor het einde van S-S of R-S interval worden gepaard met een shock en verwerven geconditioneerde aversieve kenmerken Elk vermijdingsgedrag start een nieuw R-s interval en reduceert daarbij de geconditioneerde aversiviteit welke gecreëerd wordt door temporele cues die karakteristiek zijn voor het einde van de intervallen Een vermijdingsrespons kan zo resulteren in de reductie van geconditioneerde vrees en voldoen aan de grondbeginselen van de twee factoren theorie 80 12.4.4 veiligheidssignalen bij vermijdingsleren In plaats van te focussen op signalen welke gevaar voorspellen, focust de veiligheidssignaal hypothese op de afwezigheid van de shock, of het signaal voor veiligheid In een vermijdingsprocedure zijn periode van veiligheid het best voorspelbaar door het optreden van de vermijdende respons Vermijdingsgedrag verhinderd het optreden van aversieve stimulus Focus op interne proprioceptieve signalen (= feedback cues) die geassocieerd zijn met het uitbrengen van de vermijdingsrespons o Feedback cues gegenereerd door vermijdingsgedrag worden gevolgd door voorspelbare periode zonder aversieve US(dus veiligheidsperiode) o Stimuli welke betrouwbaar de afwezigheid van US voorspellen, kunnen pavloviaanse geconditioneerde inhibitorische kenmerken verwerven o Feedback cues die gegenereerd worden door vermijdingsgedrag kunnen pavloviaanse geconditioneerde inhibitorische kenmerken verwerven Feedback cues van de vermijdingsrespons verwerven pavloviaanse geconditioneerde inhibitorische kenmerken en worden zo signalen van veiligheid o In een situatie met potentieel gevaar worden veiligheidssignalen gezien als een bekrachtiger o Vermijdingsgedrag wordt positief bekrachtigd door geconditioneerde inhibitorische veiligheidssignalen Exp. Toedienen van een externe cue (toon) op het moment dat de veronderstelde proprioceptieve signalen optreden ( dus bij het uitbrengen van de respons) o De externe cue wordt een pavloviaanse geconditioneerde inhibitor voor vrees o Externe cue wordt een positieve bekrachtiger o Toevoeging van experimentele cues faciliteert vermijdingsleren De introductie van een externe respons feedback stimulus (welke meer saliënt is dan de interne proprioceptieve cues)vergemakkelijkt vermijdingsleren De veiligheidssignaal hypothese is eerder een aanvulling van de twee factoren theorie o Pavloviaanse conditionering van vrees voor signalen/temporele cues o Negatieve bekrachtiging door vreesreductie o Pavloviaanse conditionering van geconditioneerde inhibitors voor vrees o Positieve bekrachtiging door veiligheidssignalen Extra: serieel vermijdingsleren Waarom is er geen of een trage extinctie van pavloviaanse vrees uitdoving van vermijdingsgedrag? Levis o Hogere orde conditionering van VP’s (reeks prikkels ipv 1 VP) o Blootstelling aan VP3 (niet aan VP2-VP1) is een effectieve vermijdingsrespons o Uitdoving van VP3 treedt wel op, dier blijft zitten tot VP2, maar angst voor VP2 treedt onmiddellijk terug op en conditioneert opnieuw angst voor VP3 o Vicieuze cirkel en nooit uitdoving van primaire VP1 o Implosive therapy: achterhalen van en blootstelling aan VP1 12.4.5 vermijdingsleren en ongeconditioneerd defensief gedrag Geleerde responsen zijn het product van een interactie tussen de conditioneringsprocedure die gebruikt werd en de voordien bestaande gedragsmatige structuur van een organisme Twee factoren theorie en veiligheidssignaal mechanisme zijn gebaseerd op een eenvoudig zichtspunt over wat een organisme meebrengt in een aversieve conditioneringssituatie o Alles wat veronderstelt wordt is dat het organisme iets aversief vindt 81 Maar het is duidelijk geworden dat de voordien bestaande gedragsmatige tendenties die een organisme meebrengt in een conditioneringssituatie van vermijding, veel complexer zijn dan eerst voorgesteld. o Naast het feit dat ze iets aversief vinden hebben ze ook een rijk gedragsmatig repertoire om met een aversieve situatie om te gaan Bolles o Organismen kunnen niet overleven met enkel de mogelijkheid om aversieve stimuli te detecteren en de mogelijkheid om er over te leren via pavloviaanse en instrumentele conditionering o De twee factoren theorie en veiligheidssignaal leren vereist een extensieve training om vermijdingsresponsen te genereren o Maar in natuurlijke habitat hebben dieren geen tijd om dit aan te leren o Dus organismen reageren op aversieve situaties met een hiërarchie van ongeconditioneerde defensieve reacties o SSDR: species specific defense reactions De SSDR theorie van vermijding o Bv. SSDR: vluchten, vechten, freezing,… o Welke particuliere SSDR optreedt is afhankelijk van de natuur van de aversieve stimulus en de respons kenmerken aangeboden door de omgeving Als een gekende en effectieve manier van ontsnappen voorhanden is, zal het dier vooral vluchten Zonder gekende respons, zal freezing het meeste voorkomen o Defensieve responsen worden gevormd en geselecteerd door middel van positieve straf Als US optreedt gaan ze overschakelen naar een volgende SSDR uit de respons hiërarchie net zolang tot ze effectief US vermijden Focus ligt op het uitschakelen van ineffectieve responsen o Interessant perspectief Het benadrukt dat vermijdingsleren beïnvloed wordt door reeds bestaande defensieve gedragingen van het organisme o Weinig experimentele ondersteuning Straf bleek weinig effectief te zijn op SSDR’s te onderdrukken Selectie van SSDR’s is minder bepaald door situationele mogelijkheden dan door de probabiliteit/ nabijheid van een mogelijk letsel De predatory imminence continuüm o Fanselow o Verschillende toestanden van defensief gedrag worden geactiveerd, afhankelijk van de gepercipieerde kans op een letsel en de fysieke nabijheid van het gevaar o Vermijdingsleren bouwt op en interageert met dit genetisch bepaalde gedragssysteem Pre encounter mode: het defensieve gedrag van een dier voordat het een roofdier tegenkomt Predator encounter mode: defensief gedrag wanneer het dier een roofdier tegenkomt Dominante gedrag: freezing Predator contact mode: het gedrag nadat het roofdier fysiek contact gemaakt heeft In de lucht springen en uithalen naar het roofdier= circa strike response Conditionering betreft het opnemen van nieuwe stimuli in een bestaand gedragssysteem Aversieve US (Shock): predator contact mode o rat gaat o.a. opspringen Signaal voor shock (CS) : predator encounter mode o Rat gaat freezing vertonen 82 o Of als het gaat om een temporeel verder verwijderde cue: pre encounter mode dier gaat veiliger oord opzoeken Het al dan niet compatibel zijn van een (experimenteel) vereiste vermijdingsrespons faciliteert (of inhibeert als het niet aanwezig is) vermijdingsleren Er wordt dus een grotere rol toegekend aan de bijdrage van pavloviaanse conditionering bij vermijdingsleren o Reeds bestaande gedragsmatige tendenties predomineren tijdens vroege conditionionele vermijdingstrials voordat (veel) leren heeft plaatsgevonden o Met herhaalde training zullen de pavloviaanse en instrumentele mechanismen een rol spelen o Zelfs wanneer een organisme leert over een aversieve situatie, wordt hun gedrag sterk beïnvloed door de bestaande organisatie van defensief gedrag Cognitieve verklaringen o Seligman & johnston o Analyse van vermijdingsgedrag louter in termen van propositionele kennis/ regels/ verwachtingen en inferenties op basis van deze kennis o VP wordt gevolgd door OP o Als (vermijdings)respons gesteld, dan volgt OP niet op VP o OP is aversief en moet dus worden verhinderd o Dus vermijdingsrespons stellen wanneer VP aanwezig is Extra: conditionering en causaal redeneren bij mensen en ratten 1.algemene achtergrond Voor Darwin: discontinuïteit tussen mens en dier: o Mensen zijn niet het verlengde van dieren o Dieren hebben gewoonten en instincten o Mensen hebben een ratio, hanteren taal, hebben inzicht (en een ziel) o Onderscheid heeft te maken met geloofskwesties (mens geschapen naar evenbeeld van God) Sinds Darwin o Strikte tweedeling tussen mens en dier is niet meer te handhaven o Doel Darwin: aantonen dat er geen fundamenteel verschil is tussen mens en andere zoogdieren. o Volgens hem gaat het eerder om graduele verschillen dan om fundamentele verschillen o Vloeit noodzakelijkerwijs voort uit theorie van geleidelijke evolutie door selectie o Dit idee is lange tijd min of meer geaccepteerd geweest Toch zijn er blijvende pogingen om een (nieuwe) basis voor het fundamenteel verschil te vinden o Vooral bij comparative psychology o Voorstellen over wat uniek menselijk is en wat (andere) dieren niet zouden kunnen Slingerbeweging aan de gang tussen benadrukken van gelijkenis en benadrukken van verschillen tussen mens en dier Discussie focust op verschillende domeinen o Tool use: kunnen dieren gereedschap gebruiken op zelfde manier als mensen? o Taal o Symbolische relaties o… 2. inleiding causaal leren Over het algemeen zijn mensen (en dieren) erg goed in het detecteren van causale relaties en het onderscheiden van causaliteit en correlatie Vraag: hoe doen we dat? En verschillen we daarin van andere dieren 83 De mechanismen die hieraan ten grondslag liggen zijn al erg lang het onderwerp van onderzoek en discussie 3. zijn mensen precies als dieren? Hoe wordt causaal leren bij mensen onderzocht o Deelnemers krijgen informatie over de aan-/afwezigheid van een aantal potentiële oorzaken en mogelijke effecten, en moeten daarna de relatie tussen oorzaken en effecten beoordelen o Bv. tank explosie taak Proefpersoon krijgt 5 vakjes te zien. Er rijdt een tank over het scherm 1 vierkantje licht op en de tank ontploft/ er gebeurt niets Na een aantal trials: hoe groot is de kans dat als dit vierkantje oplicht, dat de tank ontploft? o Tot 1984 was het idee dat mensen deze taken oplosten door intuïtieve wiskunde te doen Dominante theorie: probalistisch contrastmodel: causale oordeel gebaseerd op vergelijking van de kans op het voorkomen van het effect in aanwezigheid van de potentiële oorzaak en de kans op het voorkomen van het effect in afwezigheid van de potentiële oorzaak Dus causale oordeel afleiden van geschatte conditionele probaliteiten Verschil [P(O|A)-P(O| niet A)] is indicator voor de sterkte van het causale verband Onderliggende idee: mensen zijn soort van intuïtieve statistischi o Na 1984: Procedurele gelijkenis tussen causale leertaken bij mensen en taken voor klassieke conditionering bij dieren Potentiële oorzaak al dan niet gevolg door effect. Wat doet dit met de inschatting van causale sterkte van potentiële oorzaken (mensen) VP gevolgd door OP wat is het effect hiervan op reactie op VP (dieren) Is er misschien sprake van een gelijkaardig onderliggend mechanisme? Kunnen theoretische modellen voor dierconditionering ook toegepast worden op causaal leren bij mensen? Steun voor het idee: forward blocking treed zowel op bij causaal leren en klassieke conditionering dierexperimenten o Fase 1: AUS o Fase 2: AXUS o Test: X? lagere conditionele respons dan in controle groep Een van de belangrijkste ontwikkelingen van RW model (associatief leren): meest invloedrijke model van klassieke conditionering bij dieren Omdat we voor blocking iets gelijkaardigs vinden bij mensen, suggereert dat RW misschien ook een goed model is voor causaal leren bij mensen te begrijpen Causale leertaak bij mensen o Within subject design o Fase 1: AUS o Fase 2: AXUS o Fase 3: KLUS o Test: causale sterkte van X,K en L Lagere inschatting voor X dan voor K en L (US was reeds voorspelt door A dus voegt niets toe. Op de KL trials, was er nog geen voorspelling mogelijk, dus beide stimuli verwerven evenveel associatieve sterkte) 84 Kruisbestuiving tussen onderzoek bij mensen en dieren o Cross over tussen onderzoek naar causaal leren bij mensen en onderzoek naar klassieke conditionering o Cross-validatie van empirische fenomenen die eerder aangetoond waren bij dieren. En omgekeerd werden procedures eerst uitgetest bij mensen vooraleer een toetsing plaatsvond bij dieren o In eerste fase was input van dier naar mens onderzoek het meest duidelijk o Andersom werd bij mensen eerst het fenomeen van backward blocking aangetoond en pas aantal jaren later is soortgelijk fenomeen bij dieren aangetoond omkering leerfasen: eerst leren AX+/ KL+/ M- en in fase 2: A+ en M effect: causale sterkte van X lager inschatten dan die van K en L om backward blocking te verklaren kan je niet meer toekomen met RW model na eerste fase is er geen reden waarom X minder sterkte zou hebben dan K of L na tweede fase geen reden waarom associatieve waarde van X zal veranderen (want niet meer aangeboden) aanleiding tot ontwikkeling nieuwe associatieve modellen conclusie van deze paragraaf: mensen zijn precies als dieren. Hoe mensen causale relaties leren tussen prikkels verloopt groso modo het zelfde als hoe dieren associaties verwerven conclusie hield echter niet stand (zie punt 4.) 4. mensen zijn niet precies als dieren vertrekpunt: vaststelling dat associatieve modellen ervan uit gaan dat causale oordelen puur en louter afhankelijk zijn van het samen voorkomen van stimuli o causaal leren zou enkel berusten op het verwerven van assocaties probleem: ondertussen zijn er meer aanwijzingen dat causale oordelen ook gevoelig zijn voor redeneerprocessen en allerhande voorkennis die mensen hebben bij causaal leren hoe blocking begrijpen als een redeneerfenomeen o je zou het kunnen begrijpen als uitkomst van een syllogisme o als P dan Q: algemene premisse: stel dat er 2 potentiële oorzaken (A en X) aanwezig zijn. stel dat ze beide effectief oorzakelijk resulteren in een bepaald effect, dan zouden ze samen moeten resulteren in een sterker effect dan elk afzonderlijk o niet Q: in typische blocking procedure geldt dat AX+ en A+ trials een even sterk effect hebben o daarom niet P: A en X kunnen niet allebei effectieve oorzaken zijn o A is een effectieve oorzaak (want leidt altijd tot effect) o Daarom is conclusie dat X geen effectieve oorzaak is, dus geven mensen een lage causale rating aan X wat leidt tot blocking o Dus blocking is het logische gevolg van een logische redenering ( manier om formeel naar dergelijke situatie te kijken) Hieruit vallen een aantal predicties af te leiden o Blocking treedt enkel op als mensen uitgaan van eerste algemene permise (twee effectieve oorzaken leiden tot een groter effect) o Blocking treedt enkel op als mensen kunnen zien dat het effect even sterk is bij AX samen dan bij A en X afzonderlijk o Blocking treedt enkel op als mensen de mogelijkheid en motivatie hebben om te redeneren Toetsing door food alergy taak (causale leertaak) o Procedure Proefpersonen krijgen verschillende soorten voedsel (en combinatie van voedsel) te zien al dan niet gevolgd door allergische reactie Voor elk soort voedsel afzonderlijk wordt bevraagd hoe waarschijnlijk het is dat allergische reactie volgt bij het eten van dit voedsel o Toetsing predictie 1: 85 Pre-training Fase 1 Fase 2 Additief G+ H+ GH++ I+ ZA+ ZAX+ KL+ ZNon additief G+ H+ GH+ I++ ZA+ ZAX+ KL+ Z Fase 1 en fase 2: blocking procedure Blocking zou betekenen dat ze minder allergie verwachten bij X alleen dan bij K of L alleen Pre-training: info over andere soorten voedsel Additief: 2 oorzaken van effect hebben samen een sterker effect dan de oorzaken afzonderlijk Non additief: 2 oorzaken van effect hebben samen geen sterker effect o Hiermee spreek je actief het idee tegen dat wee oorzaken samen resulteert in groter effect (zeker omdat proefpersonen zien dat een sterkere reactie wel mogelijk is bij inname van ander soort voedsel) Als assumptie 1 cruciaal is om tot blocking te komen. Dan moet er in non additieve groep minder blocking moeten zijn Voorspelling 1: vanuit associatieve verklaring verwacht je dat pre training irrelevant is (want andere stimuli) voorspelling 2: vanuit redeneeranalyse verwacht je dat in non additive groep minder blocking krijgt Resultaat: evidentie gevonden voor voorspelling 2: blocking effect aanwezig in additieve groep, niet in non additieve groep Dit suggereert dat blocking enkel optreedt als mensen ervan uitgaan dat oorzaken additief zijn o Toetsing predictie 2: Pre- training Fase 1 Fase 2 Maximaal + ++ A++ MAX++ KL++ MSub maximaal + ++ A+ MAX+ KL+ M Fase 1 en fase 2 is weer gewone blocking procedure Pretraining: info over allergische reactie zonder info over voedsel Blocking gebruikte Sterkste allergische reactie Minst sterke allergische reactie Als A gevolgd wordt door niet maximale reactie en combinatie van AX daar ook toe leidt, dan weet je met zekerheid dat X niets heeft toegevoegd Als A leidt tot maximale reactie en combinatie van A en X ook, kan je eigenlijk niet met zekerheid zeggen dat X er niets aan toevoegd Dus in maximale conditie zou je veel minder blocking moeten observeren volgens redeneeranalyse Associatieve analyse maakt deze voorspelling niet Resultaat: blocking effect bij submaximale groep maar geen blocking bij maximale intensiteit o Toetsing predictie 3: Causale leertaak (tank taak) oplossen en tegelijkertijd een secundaire taak uit voeren Makkelijke taak: bij toon op spatiebalk duwen (tonen kwamen voorspelbaar) Moeilijke taak: bij hoge toon op knop 1 duwen en bij lage toon op toetst 2 drukken (tonen waren onvoorspelbaar Voorspelling: minder blocking bij moeilijkere taak dan bij makkelijke taak Resultaat: meer belasting van werkgeheugen leidt tot minder blocking Moeilijk uit te leggen vanuit associatieve verklaring Voorlopige conclusie 86 o Meer en meer aanwijzingen dat causaal leren bij mensen kenmerken heeft die te verwachten zijn vanuit een redeneer analyse van causaal leren en die moeilijk te verzoenen zijn met het idee dat causaal leren enkel gaat over het verwerven van associatieve relaties o Dus mensen zijn niet precies als dieren 5. zijn dieren precies als mensen? Meest voor de hand liggende conclusie op basis van het voorgaande is dat leren bij mensen berust op fundamenteel andere mechanismen dan leren bij dieren. En dat het optreden van blocking nog fundamenteel anders is bij mensen als bij dieren – ondanks dat het plaatsvindt in gelijkaardige procedures Associatieve modellen zijn nooit ontwikkeld om causaal leren bij mensen te verklaren. Ze hadden als doen om klassieke conditionering bij dieren te verklaren. o Het feit dat ze tekort schieten om causaal leren bij mensen te verklaren suggereert dat causaal leren en dierconditionering berusten op fundamenteel andere processen Andere conclusie mogelijk: ook bij dieren berust blocking ten delen op niet associatieve processen, op meer redeneer achtige processen o Probleem: veronderstelt veel complexere cognitie bij dieren dan over het algemeen wordt aangenomen Voorspellingen vanuit een redeneeranalyse o Blocking treedt op omdat dieren additiviteit veronderstellen. Dus blocking moet verminderen door additiviteit tegen te spreken o Blocking treedt op omdat dieren kunnen vaststellen dat de geblokkeerde prikkel X niets toevoegt bovenop het effect van A. dus een niet maximale outcome zou blocking moeten versterken Toetsing eerste voorspelling o Fase 2 en fase 3 zijn blocking training o 3 blocking groepen en 3 controle groepen o Blocking zou betekenen dat X minder angst uitlokt in experimentele groepen en meer angst in controle groepen o 3 dagen training fase 2, 1 dag training fase 3 parameters waarvan we weten dat ze over het algemeen sterke blocking effect oproepen o Fase 1: pre training met andere voorwaardelijk prikkels Meeste van de dieren kregen informatie die verder weinig implicaties hadden 2 groepen (1 experimentele en 1 controle groep) hadden niet additieve pre training: GH samen leiden niet tot groter effect dan G en H afzonderlijk. o Als assumptie cruciaal is voor blocking zou je in niet additieve groepen een kleiner blocking effect moeten bekomen o Resultaat: Blocking fenomeen: sterk verschil tussen controle groepen en experimentele groepen Geen blocking effect bij non additieve training: geen verschil tussen controle groep en experimentele groep o Conclusie experiment 1: 87 Resultaat lijkt in tegenspreek met het idee dat blocking een gevolg is van vaste, ingebakken associatieve leerprincipes Suggereert dat blocking berust op assumptie van additiviteit waardoor ratten iets doen dat doen wat lijkt op redeneren Toetsing tweede voorspelling o o 3 experimentele en 3 controle groepen o 1 dag training fase 2 en 1 dag training fase 3parameters waarvan we weten dat ze tot beperkt blocking effect leiden o Fase 1: pre exposure: onvoorspelde shocks van verschillende intensiteiten (4 keer zwaardere en 4 keer lichtere shock o Blocking met de minst sterke of met de sterkste shock intensiteit die ze ooit meegemaakt hadden Minst sterke intensiteit: dieren zijn er zeker van dat effect op A+ trials en AX+ trials groter had kunnen zijn. dus X voegt niets toe Deze conclusie kan niet gemaakt worden in groepen met maximale intensiteit o Voorspelling van RW: Sterkere shock meer saillant (beta parameter) Sterkere shock laat een hogere asymptoot van leren toe (lambda parameter) Sterkere shock zou leiden tot sterker blocking effect dan bij zwakkere shock (omgekeerde van wat redeneeranalyse voorspelt o Resultaten in lijn met redeneervoorspelling Geen blocking effect bij maximale shock intensiteit Bij lagere intensiteit treedt er blocking op o Conclusie experiment 2: Komt overeen met redeneeranalyse Moeilijk te verklaren vanuit associatieve verklaring van blocking Blocking in dierconditionering lijkt aan dezelfde wetmatigheden onderhevig te zijn als blocking in causaal leren bij mensen Dieren lijken toch precies als mensen Regels en uitzonderingen o Als je ervan uitgaat dat blocking bij dieren en mensen typisch gebeurt omdat ze vertrekken van de assumptie van aditiviteit dan zeg je dat aditiviteit de basisregel is. met subadditieve training spreek je die algemene regel tegen (uitzondering op regel). o De vraag is dan: wanneer zal men die uitzondering toepassen /generaliseren op de blocking die erop volgt en wanneer niet o Parallel met extinctie (afhankelijk van context= contextverandering na uitdoving zorgt dat oorspronkelijk geconditioneerde respons terug opdaagt.) Je leert tijdens acquisitie een regel. Extinctie biedt hier een uitzondering op die gevoelig is voor context Stel dat dit ook zo is bij blocking: subadditive training is dan misschien aan hetzelfde onderhevig als extinctie o Experiment: context shift 88 Gelijkaardig experiment met subadditieve training in blocking procedure als voorheen Twee condities Shift: pre-training en blocking training vinden plaats in verschillende contexten Noshift: pre-training en blocking training vinden plaats in dezelfde context In de testfase wordt een nieuwe context aangeboden zodat die even nieuw is voor iedereen Fase 1: A (of B) wordt gevolgd door shock Fase 2 : AX wordt gevolgd door shock Deze twee fases vinden plaats in dezelfde context Pre-training: met andere cues: irrelevante pre-training in zelfde context als blocking of subadditieve training in een zelfde of in een andere context Resultaten Geen context shift: na irrelevante training krijg je standaard blocking effect Geen context shift: geen blocking effect na additieve training Context shift: additieve training kent wel een blocking effect Dus de uitzondering die geleerd is op algemene regel van additiviteit overleeft geen contextshift o Analoog aan renewal effect bij extinctie o Gelijkaardige effecten door het variëren van stimulusduur tussen pre-training en blocking training (geen gerenalisatie als er verschillende duur is) of door invoegen van retentie interval tussen pre- training en blocking training (na retentie is er geen generalisatie o Dus het effect van pre-training is beperkt tot gelijkaardige stimuli die in dezelfde context worden aangeboden in het zelfde tijdskader 6. zijn kinderen net als dieren? Blijkbaar is blocking bij dieren en mensen gevoelig voor gelijkaardige fenomenen Lijkt aan te sluiten bij redeneer verklaring Recent zijn er claims dat je dergelijke effecten toch ook associatief kan verklaren. De theorieën die dit tot nu toe postuleren, zijn niet geslaagd een goede verklaring te bieden. Maar dit wil niet zeggen dat er geen enkele andere manier is op het associatief te verklaren Je kan gaan kijken naar hoe causaal leren zich ontwikkeld o Idee: als blocking berust op redeneer processen. Dan zou het ontstaan van blocking hand in hand moeten gaan met ontwikkeling van redeneervaardigheden o Dus onderzoeken of blocking optreedt bij kleuters (want minder goed in causaal redeneren) Procedure regenvoorspeltaak o Kind krijgt kaartjes. Op voorkant staat symbool en om achterkant staat wolk met regendruppels o Taak: op basis van symbolen op voorkant voorspellen hoeveel regen er te zien was op achterkant o Twee mogelijke scenairios 89 Causale variant: dit zijn knoppen van regenmachine: als mannetje op knop duwt, dan regent het. Jij krijgt te zien op welke knop het mannetje duwt en hoeveel regen er komt Predictieve variant: mannetje gebruikt deze knoppen om te voorspelen of het zal regen. Je krijgt te zien welke knoppen het mannetje ziet en of het daarna al dan niet regent o Blocking kan je enkel verwachten in de causale leertaak, niet in de predictieve leertaak o Deelnemers zijn 4 of 8 jaar oud o Fase 1: A+ Z- training o Fase 2: AX+ KL+ Zo Test: voor elk symbool afzonderlijk aangeven hoeveel regen ze verwachten o ! ze hadden altijd een antwoordkaartje waar meer regen opstond dan dat ze ooit gekregen hadden ( dus submaximaal) o Blocking zou betekenen dat ze minder regen verwachten bij X dan bij K of L o Resultaten Blocking treed op in causale scenario, niet in predictieve scenario Resultaten zijn identiek voor 4 en 8-jarigen Kan 2 dingen betekenen Lijk in tegenspraak met het idee dat blocking berust op redeneerprocessen Lijkt in lijn met het idee dat blocking berust op causaal redeneren Vervolg experiment: kijken naar link tussen additiviteitsassumptie en blocking o Robot waar voedsel in kan en waarvan buik oplicht/geluid maakt (telkens 2 intensiteit) o 3 tot 6-jarigen o Ahalf oplichten o AXhalf oplichten o KLhalf oplichten o Vraag: licht de buik op door A? Als je buik moet oplichten, kies je dan voor A of voor K? Achteraf redeneervragen om te kijken of ze denken of oorzaken moeten optellen 2 soorten nieuw voedsel tegelijk in robot, welke half oplicht Vraag: denk je dat dit alle 2 soorten voedsel zijn die de robot doet oplichten, of is er maar eentje dat de buik doet oplichten? [redenering: als ze alle twee buik doen oplichten, moet die helemaal oplichten. Dat was niet het geval dus kan er maar eentje de buik oplichten] o Verwachting: correlatie tussen mate van blocking en mate van het juist oplossen van redeneervragen o Resultaat: we krijgen blocking er is correlatie tussen blocking en oplossing redeneertaken welke overeind blijft als je controleert voor leeftijd correlatie tussen leeftijd en blocking blijft niet overeind als je controleert voor redeneervaardigheid niet leeftijd aan zich is van belang maar wel de mate waarin ze het soort redeneervragen correct kunnen oplossen o alle kinderen die een sterk blocking laten zien, doen het perfect op redeneervragen o maar bij kinderen die weinig blocking laten zien, doet de helft het heel goed op redeneervragen o het kunnen redeneren over dit soort dingen is dus noodzakelijke maar geen voldoende voorwaarde om blocking te krijgen werkgeheugen zou ook kunnen meespelen: redenering kunnen toepassen in blockingcontext 90 o kinderen tussen 4 en 6 jaar o zelfde experiment samen met werkgeheugen taken (uit WISC en dieren herinner taak die ze achteraf in juiste volgorde moeten reproduceren) o hypo: mate van blocking is afhankelijk van redeneervaardigheid en werkgeheugen o resultaten blocking was significant bij kinderen die het bovengemiddeld goed doen op werkgeheugen taak geen blocking bij kinderen die het minder goed doen op werkgeheugen taak niet / moeilijk te rijmen met associatieve verklaring regressieanalyse: zowel redeneervaardigheid als werkgeheugen zijn onafhankelijk belangrijk voor het voorspellen van de mate van blocking. (verbaal IQ en chronologische leeftijd zijn geen unieke predictors) voorgaande experimenten zijn allen correlationeel. Dus er kunnen geen sterke causale conclusies uit getrokken worden experiment om na te gaan of je blocking actief kan manipuleren door de redeneervaardigheid te beïnvloeden o als kinderen moeten redeneren om tot blocking te komen en dat redeneerproces is een soort van modus tollens syllogisme dat ze moeten oplossen dan zou blocking sterker moeten zijn als je modus tollens redeneren faciliteert o bij volwassenen kan dit door training in counterfactual denken = hoe zou de situatie er hebben uitgezien als dit of dat anders was geweest o Twee groepen kinderen met blocking taak (robot taak) Counterfactial groep: denken over hoe een bepaalde outcome zou zijn geweest als één van de cues anders was geweest Bv. pizza licht half op/ Druiven licht niet op / Pizza+ brood licht half op Vraag: wat als druiven de buik ook deden oplichten Factual groep: kregen vragen over zaken die ze daadwerkelijk gezien hadden o Resultaten Manipulatiecheck: na counterfactual training doen kinderen het beter op redeneertaak Door de training wordt het blocking effect ook groter. wat suggereert dat blocking berust op modus tollens redeneren !dit effect treedt enkel op bij jongste kinderen (waarschijnlijk omdat oudste kinderen al heel goed deden op redeneertaken en er geen extra ruimte tot verbetering meer was Algemene conclusies o Als we de prestaties van mensen in causale leertaken toeschrijven aan complexe cognitieve processen (redeneren), dan moeten we wellicht hetzelfde doen voor de prestaties van ratten in klassieke conditioneringsproeven o Kunnen ratten redeneren? als mensen het kunnen, dan kunnen ratten het wellicht ook o Associatieve modellen moeten niet volledig over boord gegooid worden maar minstens moeten uitgebreid worden om te verklaren waarom sommige dingen moeilijker zijn, meer werkgeheugen vragen,… 91 Extra: Gedrag, taal en stimulus equivalentie 1. algemeen kader van waaruit gedragsanalyses opereren In het begin werd gedrag verklaard op basis van de antecedenten, het uitgelokte gedrag [ SR] o Descartes postuleerde een mechanische benadering van onvrijwillig gedrag Gedrag werd gezien als reflexen en geconditioneerde reflexen o Dit beeld is later herzien door een logisch positivistische benadering Bv. Watson: Enkel bezorgt om wat we objectief kunnen waarnemen We krijgen dus een wetenschappelijke verwerping van cognitie en emotie vermits ze niet observeerbaar zijn en enkel afgeleid kunnen worden van gedragsmatige metingen: de watsoniaanse restrictie Simplistisch methodologisch behaviorisme Later werd het S-R schema omgezet in een S-O-R schema o O: mentale representatie o Hoofdstroom= Bv. associatieve leer traditie Zowel mentalistische als mechanistische benadering van gedrag Mentalistische benaderin van gedrag : Gedrag doormiddel van de gemedieerde rol van mentale gebeurtenissen mechanistische benadering van gedrag :Doet een poging om deze gebeurtenissen te begrijpen door het verhelderen van processen (bv. hoe informatie opgemerkt, opgeslagen, opgeroepen wordt of gerepresenteerd wordt in knopen) o dus stimuli worden mentaal gerepresenteerd en er worden associaties gevormd tussen de stimuli o deze associatieve activiteit is direct verantwoordelijke voor het gedrag Een andere traditie veranderd het S-R schema in een R-S schema o Gedragsmatige analystische traditie o Skinner o Gedrag wordt gevormd door de omgeving, gebaseerd op zijn geschiedenis van consequenties (bekrachtiging, extinctie, straf) o Over verschillende voorbeelden van bekrachtiging, worden voorafgaande contextuele condities gediscrimineerd en lokken een respons uit Ze verkrijgen dus stimulus controle o Dit proces is gelijk aan operant gedrag SD ; RSR In de aanwezigheid van een discriminatieve stimulus (SD), stelt men een bepaalde respons (R) omdat deze bekrachtigd wordt (SR) Operant gedrag wordt dus functioneel bepaald door omringende contextuele gebeurtenissen Een geschiedenis van consequenties Een antecedente stimuli o Wat doen we dan met complexe zaken (bv. taal, gedachten, bewustzijn, geheugen,…) Deze cognitieve gebeurtenissen zijn gedraging die samen optreden met overt gedrag Het gaat hier om een radicaal behaviorisme omdat het alle publieke en private gebeurtenissen als gedrag beschouwt Men gaat op zoek naar functionele verbanden tussen gedrag en omgeving, niet naar structuren en andere mentalistische zaken Mentale gebeurtenissen verklaren gedrag dus niet omdat ze gedrag zijn De enige onafhankelijke variabelen die gedrag vorm geven zijn antecedente gebeurtenissen en consequenties (dus de enige stimuli die gedrag bepalen zijn contextueel) 92 Dit maakt dat er een mooi onderscheidt is Duidelijke variabelen waarmee we gedrag kunnen voorspellen Duidelijke en bereikbare variabelen waarmee we gedrag kunnen manipuleren en beïnvloeden 2. beschrijving van de originele benadering van verbaal gedrag Het gebruik van functionele analyse o Er wordt een analyse gehouden van gebeurtenissen welke gedrag vorm geven en uitlokken o Of er wordt een procedure gebruikt om die gedragingen te determineren die het gedrag functioneel controleren o Bv. functionele analyse van hoofd bonken bij autisten A. als ze in de keuken hoofd bonken krijgen ze voedsel B. als ze in de zetel hoofdbonken krijgen ze aandacht C. als ze hoofdbonken wanneer iemand ‘goedemorgen zegt’ worden ze gewassen het gaat hier telkens om eenzelfde topografische actie (hoofd bonken) in drie verschillende contingenties dus het gaat om 3 functioneel verschillende gedragingen A. hoofdbonken als gedrag om voedsel te zoeken B. hoofd bonken als gedrag om interactie te zoeken C. hoofd bonken als gedrag voor sensorische stimulatie o Gedrag wordt dus gevorm door zijn consequenties en uitgelokt door antecedente condities o Operante responsen zijn functioneel bepaald aan de basis van deze gebeurtenissen o Functionalisme is een vorm van Radicaal behaviorisme vermits het aanneemt dat cognitie en taal geen mentale gebeurtenissen zijn meer gedragsmatige processen De uitdaging voor gedragsanalyses o Taal is één van de grootste uitdagingen voor gedragsanalyses o Waarom interesse in taal: taal kan gedrag controleren Taal contexten zijn een bron voor leren en gedragsmatige veranderingen Elke dag volgen we instructies. Dit kan gezien worden als linguïstische gebeurtenissen waar we op reageren Maar er wordt ook klinisch gekeken naar de rol van gedachten Overtuigingen, automatische gedachten en regels kunnen een oorzaak zijn van gedrag en soms leiden tot pathologisch gedrag Bv. ‘ik ben niets waard’ bij depressie o Taal is een uiterst complex gedrag De basis van taal is een arbitraire en symbolische natuur Arbitrair: er is geen relatie tussen het geschreven en uitgesproken woord ‘hond’ en het beeld ervan Het woord staat symbool voor iets een referent (bv. geschreven woord hond) staat voor/ refereert naar een symbool (bv. het beeld van het hond of de klank hond) Dit alles ondanks het feit dat deze gebeurtenissen perceptueel ongelijk zijn en temporeel en spatiaal ongecorreleerd zijn Taal is veralgemeenbaar en nieuw We kunnen de verschijning van een verbale respons zien Welke coherent zijn Ondanks het feit dat ze nooit bekrachtigd zijn of eerder uitgelokt Verbaal gedrag lijkt op nieuw gedrag dat nooit speciaal bekrachtigd is Dit gaat verder dan een eenvoudige directe bekrachtigingsgeschiedenis Bv. bij het aanleren van een nieuwe taal moeten we niet alle woorden geleerd hebben. Sommige woorden kunnen we afleiden uit de context 93 o Skinner trachtte om deze vragen te beantwoorden door gebruik te maken van functionele analyse: hij probeerde te bepalen welke gebeurtenissen particuliere linguïstische gebeurtenissen controleren Een functionele analyse van verbaal gedrag o Skinner categoriseerde verbale gedragingen in aparte functionele groepen, welke bekend staan als operante klassen Eerst de echo: als het kind van 12-18 maand geluidjes begint te herhalen “zeg papa””papa”goed zo Dan de TACT: als een kind taaluitingen maakt naar een specifiek object Een gedrag dat lijkt op benoemen waarbij stimuli benoemd worden/ contact gemaakt wordt met stimuli Kind ziet papa zegt “papa”goed zo Derde komt de MAND: kind maakt taaluitingen om toegang te krijgen tot objecten of objecten te vragen. Een gedrag dat lijkt op vragen Kind heeft dorstzegt ‘sap’ krijgt drinken o Skinner stelde verschillende andere dingen voor (bv. intraverbaal, textueel,…) het belangrijke punt hierbij is dat het allen gaat om operante klassen welke functioneel verbale gebeurtenissen bepalen Problemen met skineriaanse benadering voor taal o Skinner’ s gedragsmatige analyse houdt in dat taal gedrag is dat gevormd woord door contextuele contingenties o Maar er is geen coherente, empirisch toegankelijke definitie aangeboden o Al de categorieën zijn hypothetisch en nooit experimenteel gedemonstreerd o Er werd gesteld dat taal gevorm is door contextuele condities maar dit is nooit aangetoond Skinner bood een arme functionele definitie van verbaal gedrag o Verbaal gedrag is elk gedrag van de spreker, dat bekrachtigd wordt door een luisteraard welke getraind is door een verbale gemeenschap om de bekrachtiging te mediëren o Het probleem met deze definitie is dat het organisme dat spreekt er niet toe doet, enkele het gedrag van de luisteraar is van belang Elk organisme gaan zich verbaal gedragen zolang als ze gevormd worden door iemand die getraind is door een verbale gemeenschap Voorbeeld wanneer een pc het vormgeven van het gedrag van een rat medieert, maar zelf niet gevormd is door een verbale samenleving, dan is het gedrag van de rat niet verbaal wanneer een mens het gedrag medieert dan is het gedrag van de rat wel verbaal !! belangrijk hierbij is dat het gedrag van de rat identiek blijft in beide gevallen, het gedrag is constant o Skinner’ s definitie was dus te breed en kon geen empirisch onderzoek bieden De basis was gezet voor een bevordering van gedragsanalyse 3. vooruitgangen in het veld (ontdekkingen die volgen op Skinner’ s oorspronkelijke werk) Stimulus equivalentie (Sidman) o = en complex gedrag dat vermeend is enkel geobserveerd te worden in mensen met verbale mogelijkheden o Optreden van accurate, non bekrachtigde stimuli-stimuli responsen gevolg door een bekrachtiging van andere stimuli- stimuli relaties 94 o Gebruik maken van arbitraire stimuli zonder enige relatie: we kunnen associatie aanleren Eerst toon je dat A samen gaat met B hieruit leidt men af dat B ook samen gaat met A Vervolgens toont men dat A samengaat met Cwaaruit men afleidt dat ook omgekeerd C samengaat met A Dan biedt men B aan waarbij men direct afleidt dat die samengaat met C ( en omgekeerd: als men C aanbied leidt men af dat die samengaat met B) ondanks het feit dat ze nooit samen aangeboden zijn/ bekrachtigd zijn De antwoordpatronen kunnen niet voorspeld worden door de gekende leerwetten o Stimulus equivalentie wordt geobserveerd met een matching to sample paradigma (MTS) Fase 1: equivalentie training MTS taak A1 wordt gevolgd door B1 A1 wordt gevolgd door C1 A2 wordt gevolgd door B2 A2 wordt gevolgd door C2 Deze 4 blokken worden elke twee keer aangeboden in blokken van 16 trials Proefpersonen krijgen stimulus aangeboden en moeten zeggen welke stimulus ermee gepaard gaat Criteria: proefpersonen moeten 15 van de 16 aanbiedingen correct beantwoorden Fase 2: equivalentietesten Eerst wordt er gekeken voor omkeerbaarheid o B1 wordt aangeboden; proefpersonen moet A1 aanduiden o B2 wordt aangeboden; proefpersonen moeten A2 aanduiden Dan wordt er getest voor verkregen equivalentie relaties of transitiviteit o Als A=B en A=C is B=C? o B1 wordt aangeboden; proefpersonen moeten C1 aanduiden o B2 wordt aangeboden,; proefpersonen moeten C2 aanduiden o C1 wordt aangeboden; proefpersonen moeten B1 aanduiden o C2 wordt aangeboden; proefpersonen moeten B2 aanduiden o Cruciaal: enkel verbale wezens (=mensen) hebben betrouwbaar getoond zowel de omkeerbare als de afgeleide relaties aan te leren o Relatie tussen A1 en B1 en tussen A1 en C1 is een symmetrische relatie o Relatie tussen B1 en C1 is een transitieve/ equivalentie relatie o A1, B1 en C1 nemen deel in een equivalentie class. Dit wordt enkel gezegd wanneer symmetrische en transitieve relaties geobserveerd zijn Symmetrie/ symmetrische relatie= een niet bekrachtigde, bidirectionele relatie tussen twee stimuli waarbij een individu antwoord op de ene stimuli in termen van de andere stimuli o Als A=B, dan B=A Equivalentie relatie is een verkregen, niet bekrachtigde relatie waarin wee of meer stimuli relaties met elkaar combineren o Als A=B en A=C dan B=C en C=B 95 Relevantie voor taal o We veranderen de abstracte vormen naar meer gekende objecten o Coherent met antwoorden op arbitraire stimuli Onmiddellijk verkrijgen van niet bekrachtigde relaties tussen gebeurtenissen (nieuwigheid en generativiteit) Consistent met de overeenkomsten van een verbale samenleving o Het woord ‘hond’ doet meer dan enkel refereren naar het geluid ‘hond’ of het beeld van een hond o Het heeft een psychologische inhoud of betekenis (bv. adoratie, paniek) o De transfer van stimulus functie De component van stimulus equivalentie dat de psychologische significantie geeft Definitie: wanneer een stimulus in een equivalente klas een gedragsmatige functie verwerft, dan zullen andere stimuli deze respons uitlokken/ ontlokken zonder enige bekrachtiging Bv. geconfronteerd worden met een beeld van een hond wordt gepaard met de perceptuele functie van een hond te zien. Dit wordt overgedragen naar het woord ‘hond’ welke het beeld van de hond ontlokt Bv. als een kind ooit gebeten wordt door een hond en hierdoor angst opwekt bij het zien van een hond, kan dit overgedragen worden en leiden tot angst bij het lezen van het woord ‘hond’ Dit is gedemonstreerd geweest door een serie van studies Dit vangt adequaat hoe taal gedrag kan controleren (bv. iemand gaat bordjes ‘beware of dog’ vermijden) o Noot: dit is van kritiek belang om de etiologie van angststoornissen en specifieke fobieën te begrijpen Enkel 50% van de mensen met specifieke fobieën rapporteren een directe ervaring. Er is dus een substantiële hoeveelheid van verkregen fobieën door een verbale gebeurtenis o Wordt dit een symbolisch/ verbaal gedrag? Stimuli kunnen indirect verwijzen naar een andere gebeurtenis door een verkregen equivalentie relatie Stimuli kunnen ook de referent met betekenis RE- presenteren. Dit is de transfer van stimulus functie Conceptuele correlaties tussen stimulus equivalentie en taal o Arbitraire stimuli kunnen makkelijk gerelateerd raken aan elkaar (abstracte natuur van taal) o Deze relaties kunnen verkregen worden zonder voordien bekrachtiging te krijgen (generativiteit en nieuwheid van taal) o Dit kan tellen voor de psychologische betekenis van verbale stimuli door de transfer van stimuli functie Ontwikkelingscorrelaties: evidentie voor links tussen stimulus equivalentie en taal o Stimulus equivalentie kan gebruikt worden om een collectie van betekenisvolle woorden aan te leren Bv. Sidman (1971) en Sidman & Cresson (1973) 96 Ze gebruikte MTS om de verbale mogelijkheiden van volwassen met intellectuele achterstand te doen toenemen Wanneer proefpersonen het woord ‘auto’ horen volgt ofwel het geschreven woord ‘auto’ of een beeld ervan Daarna zien we dat de proefpersonen het woord ‘auto’ en het beeld van de auto aan elkaar kunnen koppelen Dit proces is herhaald met verschillende geluiden, woorden en objecten En er werd essentieel een basis verbaal repertoire gevestigd o Kinderen met taalstoornissen vertonen geen stimulus equivalentie Devany, Hayes, e.a. Kinderen worden gematched voor chronologishce leeftijd (2-3 jaar) 3 groepen Normale ontwikkeling Ontwikkelingsachterstand met normaal taal mogelijkheden Ontwikkelingsachterstand met abnormale taal mogelijkheden Kinderen worden blootgesteld aan MTS paradigma Ze worden getraind en getest voor twee equivalente klassen A=B=C en D=E=F Er wordt gebruik gemaakt van nonsens items zodat er geen perceptuele gelijkenissen mogelijk zijn Resultaat: enkel kinderen met taal mogelijkheden konden stimulus equivalentie (zowel de symmetrische als de equivalentie relaties) demonstreren [ kinderen met ontwikkelingsachterstand maar met normale taalmogelijkheden hebben wel meer trials nodig om het verband aan te leren dan normale kinderen] o Stimulus equivalentie correleert met het optreden van verbale vaardigheden Barnes et al. Kinderen worden onderverdeeld in 3 groepen Normaal ontwikkelde 3-4-jarigen met normale verbale mogelijkheden Mild tot erg dove kinderen van 7-8 jaar met verbale mogelijkheden boven de 2 jaar Mild tot erg dove kinderen van 4-5 jaar met verbale mogelijkheden onder de 2 jaar De sleutel variabelen waren De verschillende niveaus van verbale mogelijkheden: normaal, boven de 2 jaar, onder de 2 jaar De aan-/afwezigheid van onmogelijkheid: normaal horen of ingrijpend doof De kinderen worden getest voor 2 equivalentie klassen: A1=B1=C1 en A2=B2=C2 Gebruik gemaakt van nonsensitems Enkel de kinderen die verbaal boven de leeftijd van 2 jaar stonden waren capabel om stimulus equivalentie te tonen o Het maakt niet uit of het kind al dan niet doof was, enkel de verbale capaciteit was van belang Ontwikkelingsstudies duiden om een associatie tussen stimulus equivalentie en taal maar wat is de natuur ervan- 3 mogelijkheden o Taalvaardigheden gaan vooraf aan de observatie van stimulus equivalentie Performantie op MTS is te wijten aan eerder bestaande taal vaardigheden Horne en Lowe o Stimulus equivalentie is een gedrag dat voorafgaat aan taal Is stimulus equivalentie een gedragspatroon welke leidt tot taalmogelijkheden? sidman o Taal en stimulus equivalentie zijn hetzelfde, welke opkomen van een particuliere leer geschiedenis Stimulus equivalentie en taal zijn synoniem Relation frame theory 97 4. theorieën van stimulus equivalentie 4.1 Murray Sidman’s benadering Vanuit deze benadering is stimulus equivalentie een basis gedragsmatig fenomeen dat noodzakelijk is voor taal Heeft een nogal gedetailleerde interpretatie Stimulus equivalentie is een fundamentele gedragsmatige gebeurtenis. Het is een nieuwe grondstelling in het veld van gedragspsychologie In deze mate is het verwant met bekrachtiging, discriminatie, extinctie, habituatie, straf,… (de wetten van gedragspsychologie) En daarom is stimulus equivalentie een noodzakelijke voorwaarde voor het optreden van taal Stimulus equivalentie is een fundamenteel gedragsmatige gebeurtenis o Zoals de capaciteit om gedrag bekrachtigd te hebben, stimuli te discrimineren en habitueren aan een US,… o Sidman stelt dat stimulus equivalentie gekomen is door de evolutie van soorten (essentieel is stimulus equivalentie evolutionair gegeven) o Maar dit is in conflict met twee hoofdobservaties Stimulus equivalentie is nog niet eerder geobserveerd in andere niet menselijke dieren Als stimulus equivalentie een evolutionaire trek is, dan moet het observeerbaar zijn in andere niet- menselijke soorten Chimpansees en andere primaten die capabel zijn om objecten te identificeren, vertonen geen equivalentie Stimulus equivalentie is nog niet voorgekomen in lagere zoogdieren (bv. ratten, duiven,…) ondanks substantiële pogingen Ontwikkelingsevidentie suggereert dat stimulus equivalentie ontwikkeld in kindertijd en niet ‘gegeven’ is Longitudinaal onderzoek heeft aangetoond dat equivalentie ontstaat in de kindertijd o Symmetrische relatie kunnen ontstaan rond 17 maand o Dit vindt plaats voor het ontstaan van transitieve relaties Huidige programma’s trachten kinderen te trainen om equivalentie relaties tussen stimuli te verkrijgen o Essentieel kan equivalentie als gedrag verworven wordt Alles samen suggereert evidentie dat Sidman’ s postulatie incorrect is 4.2 relational frame theory [RFT] (Steve Hayes) Stimulus equivalentie is synoniem met taal En dit is een geleerd gedrag gevormd door een particuliere geschiedenis van bekrachtiging in een verbale gemeenschap RFT is een expansieve en brede gedragstheorie welke tracht complexe problemen, zoals taal en cognitie aan te pakken Het postuleert niet dat stimulus equivalentie een fundamenteel gedragsmatige gebeurtenis is Het is daarentegen hoog beïnvloed door het geobserveerde optreden van stimulus equivalentie in de kinderjaren Het staat in dienst van het concept van operant gedrag om rekening te houden met stimulus equivalentie Daarbij worde stimulus equivalentie gezien als functioneel equivalent aan taal Taal en stimulus equivalentie is het zelfde RFT suggereert dat stimulus equivalentie een algemeen operante respons is o SD (antecedente gebeurtenis) ; R (respons)SR (consequent) o Dus stimulus equivalentie is onder de functionele controle van Consequente gebeurtenissen welke het vorm geven 98 En antecedente gebeurtenissen welke de productie ervan controleren Tijdens de kindertijd worden specifieke naam-object en object-naam relaties aangeleerd o “waar is de bal?”aanwijzen o “wat is dit””bal” o Juiste antwoorden worden beloond door verzorgers “good zo” o Dit wordt vooraf gegaan door specifieke cues (bv. ‘is’ ‘hetzelfde als’ ‘dit’) o Deze vorm van matching herhaald zich in herhaald leren met veel items in veel leer ervaringen o Na herhaalde leer mogelijkheden zijn bepaalde antwoordpatronen gevorm en bekrachtigd in de aanwezigheid van ‘zoals’ o Dus cues controleren symmetrie en equivalentie antwoorden Stimulus equivalentie vanuit RTF perspectief is o Een puur functionele, operante respons o Geabstraheerd binnen een socio- verbale samenleving o Welke toepasselijk gemaakt wordt door contextuele cues 99