Psychologie Hoofdstuk 3 Contactpersoon: [email protected] Hoofdstuk 3: Teach Your Children Bijgeloof, gokverslavingen en ratten kunnen leren om te ruiken = allen hebben een "leertraject" ondergaan Soort van conditioneringsprocessen = klassieke en instrumentele conditionering Twee vormen van leren Hond van Pavlov = reeds speekselafscheiding (zin) bij het zien van voeding = psychische reflex Hij bestudeerde fysiologische reflex (voorbeeld: afscheiden van speeksel) bij het voorafgaan van een bepaalde andere prikkel (bel, geluid, licht, ...) Resultaat klassieke of Pavloviaanse conditionering Puzzle box: kooit met klapdeur die kan geopend worden door hefboom in de kooi Test: Hongerige kat in kooi zetten en melkkommetje buiten bereik van opgesloten kat = dier ging panikeren en drukte perongeluk op hefboompje Thorndike vond wet van het effect = de dieren gingen steeds sneller het gewenst/bedoeld gedrag uitvoeren = basis van operante of instrumentele conditionering Het gedrag dat resulteert in positieve gevolgen wordt versterkt Het gedrag dat resulteert in negatieve gevolgen wordt verzwakt ! Belangrijk binnen het leerproces: beloning moet METEEN volgen op het gedrag = wanneer kooi vijf seconden later zou openen, zal het leerproces vele langer duren Temporele contiguïteit = snelle opeenvolging in de tijd tussen gedrag en beloning Klassieke conditionering Methode van Pavlov = passief proces = honden moeten geen handeling doen in hun leerproces Neutrale prikkel (rinkelen bel) wordt opgevolgd door prikken (toedienen voedsel) die reflexmatige reactie (speekselafscheiding) uitlokt Desondanks lokt de neutrale prikkel niets anders uit dan gebruikelijke oriënteringsreactie v/d hond (het spitsen van de oren, alertheid) Na herhaaldelijke koppeling van neutrale prikkel aan reflexuitlokkende prikkel zal de neutrale prikkel een reactie uitlokken = onvoorwaardelijke stimulus Voedsel: onvoorwaardelijke stimulus (prikkel) Speekselproductie: onvoorwaardelijke reactie Neutrale prikkel (bel): voorwaardelijke stimulus (prikkel) Reactie (leerproces): voorwaardelijke reactie Aversieve conditionering = onvoorwaardelijke reactie op schok verschilt van voorwaardelijke reactie ZIE SCHEMA PAGINA 42 BOEK Leerproces kan men snel afbouwen door -> voorwaardelijke stimulus geven, maar geen onvoorwaardelijke prikkel (bel luiden zonder voedsel geven) Uitdoving = proces v/h verdwijnen v/d voorwaardelijke reactie ! Uitdoven is niet vergeten = men kan veel sneller terug gedrag aanleren door voorwaardelijke prikkel te voorzien = spontaan herstel (komt ook soms onverwacht voor) Wanneer men hond eten geeft na horen van bepaald geluid en men past geluid lichtelijk aan, zal de hond nog steeds reageren = verschil tussen voorwaardelijke prikkel uit leerproces en testprikkel = prikkelgeneralisatie/prikkelveralgemening ! Maar ook vaststelling rond prikkeldiscriminatie = twee geluiden, gelijken op elkaar, beide lokken prikkel uit, slechts één belonen, hierdoor zal andere prikkel na verloop van tijd geen reactie meer uitlokken Hogere-orde conditionering Voorbeeld: lichtflits en daarna elektrische schok, hierdoor zal bij een lichtflits (niet gevolgd door schok) eveneens een angstreactie te voorschijn komen = nieuwe neutrale prikkels werden geconditioneerd Temporele contiguïteit bleek uiteindelijk niet zo noodzakelijk te zijn voor conditionering (eens het proces reeds is aangeleerd) Klassieke conditionering aversie opbouwen na slechts één negatieve impuls Voorbeeld: iets slecht eten, kan zorgen voor "degoutatie" t.o.v. bepaalde voeding Voedselaversie is ook erg robuust tegen uitdoving = gaat niet snel weg Voorbeeld: Kankerpatiënten vaak afkeer tegen "gewoon" voedsel doordat ze zich slechts voelen van chemotherapie = daarom vaak opteren voor "ongewoon" voedsel voor behandeling Geconditioneerde voedselaversie kan ook problemen oplossen Voorbeeld: lamsvlees vergiftigen waardoor dieren niet meer gaan jagen op lammeren Conditionering kan geen verband brengen tussen arbitrair gekozen voorwaardelijke en onvoorwaardelijke prikkels Test: Uitgedroogde ratten drinken aanbieden wanneer er lichtflits was en geluidsignaal Vervolgens kregen ze of X-bestraling of schok (onvoorwaardelijke prikkel) Resultaat: Ratten met X-bestraling: associëren smaak met misselijkheid, niet met flits of geluid Ratten met schok: associëren smaak niet met de pijn, wel de flits of geluid Voorbeeld: Tandarts pijnvolle ervaring => dooft niet snel uit (geur van praktijk zorgt nog steeds voor angst) Voorbeeld: Reclame met mooie vrouwen zorgt dat via conditionering dat men deze likt naar arbitraire producten Voorbeeld: Seksuele foto's tonen daarna foto's van doorsnee producten Enkele weken erna enkel doorsnee producten tonen = nog steeds link met vrouwen Operante conditionering Testen van Skinner: Rat in doolhof zetten op einde van doolhof voedsel Wet van effect vond plaats: rat kon na verloop van tijd het doolhof vele sneller doorlopen Skinnerbox: hefboompje in doos, bij indrukken komt er voedsel vrij = dieren hadden dit na verloop van tijd door Positieve bekrachtiging: gedrag dat systematisch gevolgd wordt door toedienen van bepaalde prikkel in frequentie toeneemt, zorgt de prikkel voor positieve bekrachtiging (beloning) Negatieve bekrachtiging = niet omgekeerde van positieve! Ook beloning, maar beloning bestaat er nu uit iets negatief weg te nemen of aversieve prikkel verwijden. Voorbeeld: paraplu meenemen als het regent om natte kleren te vermijden Uitdoving of extinctie = wegnemen van bekrachtiging Hoe moet je iemand het best opvoeden? Skinner maakt onderscheidt tussen continue en intermittente bekrachtiging Continue bekrachtiging: steeds belonen wanneer iemand iets goed doet Nadeel: snelle uitdoving, vergeten van bekrachtiging kan leiden tot uitdoving Nadeel: bekrachtiging kan zijn "effect" verliezen (voorbeeld altijd eten geven, op duur zal er geen honger meer zijn en is het eten dus ook niets positiefs meer) ! Optimale beloningsstrategie wijzigt zodra bepaald gedrag is aangeleerd = vanaf dan kan je gedrag beter in stand houden met Partiële of intermittente bekrachtiging = minder frequent belonen van gedrag Partieel bekrachtigen kan op twee verschillende manieren - Vast ratioschema: beloning nadat gedrag zich X-keer heeft voorgedaan Voorbeeld: rat krijgt om drie keer drukken koekje = ratioschema-3 - Variabel ratioschema: beloning niet na vast aantal keer, wel gemiddeld na bepaald aantal keer Voorbeeld: iemand die huizen verkoopt en daar elke 10% in slaagt, wordt met dat percentage beloond Beloning is bijgevolg op basis van intervalschema's - Vast intervalschema: tijdsinterval is steeds identiek - Variabel intervalschema: tijdsinterval verandert van keer op keer Voorbeeld: Hond elke dag voor uitvoeren van truckje belonen (vast intervalschema) Visser die eens vis vangt (variabel intervalschema) ! Variabele schema's zorgen ervoor dat gedrag vaker voorkomt dan bij vaste schema's Bij vaste schema komt het gedrag minder tot uiting en stijgt de frequentie naargelang de beloning dichterbij komt Bij een variabel schema wordt het gedrag met constante frequentie gesteld Probleem bij gokverslaafden: variabel schema = variabel schema verhoogt weerstand tegen uitdoving Primaire bekrachtiger: prikkel die elementaire bekrachtiging bevredigt Voorbeeld: drank voor dorstig dier, seks voor "geile" duif Secundaire/geconditioneerde bekrachtigers = krijgen bekrachtigende waarde omdat ze, door klassieke conditionering, gelinkt worden aan primaire bekrachtiger Voorbeeld: geld, glimlach, studieresultaten, etc. Hoe leer je iemand een bepaald gedrag? Voorbeeld: hoe leer je een hond om op een knop te drukken? Response shaping = criterium voor bekrachtiging stapsgewijs verschuiven in richting van uiteindelijk gewenst gedrag Voorbeeld: Belonen wanneer hond in richting knop kijkt Belonen wanneer hond in richting knop wandelt (enkel dan nog belonen) Bij het aanleren van reeks handelingen, leert men van achter naar voor Eerst leren om krant bij baasje te leggen, dan om binnen te wandelen met krant, dan om krant te nemen, ... = toevoegen van voorafgaand gedrag aan de hele scène = volgend gedrag is bekrachtiger van vorige gedrag = pas op einde (primaire) bekrachtiging (al dan niet continue toegediend) Test: Skinnerbox -> duif moet op knopje drukken bij lichtflits (krijgt dan voedsel) = discriminatieve controle v/d lamp lamp = discriminatieve prikkel Voorbeeld in leven: Hond doet truckje en krijgt beloning van "mij", maar niet van mijn "partner" = hond zal truckje niet meer doen bij partner = discriminatieve prikkel Training van APOPO-ratten Ratten kunnen explosieven opzoeken - Eerst laten wennen aan klik geluid via Pavloviaanse conditionering (via geconditioneerde bekrachtiger) - Trainen op detecteren van explosieven - Trainen op discriminatie: enkel belonen wanneer kop in gat gaat met effectief enkel TNT - ... Straf Positieve straf: het toedienen van iets onaangenaams Negatieve straf: het afnemen van iets aangenaams Straf is riskante manier om gedrag te veranderen = onmiddellijke gedragsverandering, maar geen duurzaam effect Gedrag kan men minder snel aanleren via straffen - Ongewenst onderdrukken is moeilijker wanneer dreiging van straf weg is (degene die straf toekent moet steeds in buurt zijn) = discriminatieve stimulus: gedrag enkel niet stellen bij bepaalde personen Het is beter gedrag te bekrachtigen dan te straffen Bijgeloof experiment Wanneer men verschillende katten in kooi zetten en op staafje laten drukken voor deur te openen merken we dat: Elke kat zal op een bepaalde manier, toevallig, merken dat het deurtje opengaat door het staafje en zal op deze (eigen) manier blijven op het staafje drukken Elk dier krijgt bijgevolg een "eigen strategie" = ander geloof opgebouwd rond gedrag om het deurtje te openen Supersition in the pigeon = verschillende duiven in verschillende skinnerboxen, om de 15 sec komt er korrel --> blijven wachten is beste optie, maar wat doen de duiven tijdens die 15 sec? Elke duif ander gedrag = soort van bijgeloof Gedrag toont aan dat dieren causale relatie zelf bedenken tussen gedrag en verkrijgen van voedsel Distinctief bijgelovig gedrag ook door mensen Voorbeeld: kleuters tijdens wachten (lees 57) Toevalligheden die hebben geleid tot een succes willen we herhalen = zeker wanneer het weinig inspanningen kost Vaak niets te maken met verband tussen geluksbrenger en resultaat = wel met vermijden van risico Te verklaren door algemeen geldend principe van conditionering Operante conditionering en behavioristische visie op gedrag Gedrag tussen soortgenoten neemt af wanneer men chimpansee voor spiegel zetten Gedrag zoals het wegplukken van voedsel tussen tanden of onzichtbare plekken (die nu zichtbaar waren) schoonmaken nam toe = evedentie voor zelfherkenning in een spiegel Men vond dat zelfherkenning een primitieve vorm van zelfbewustzijn enkel voorkwam bij mensen en hogere apensoorten (andere apen begonnen zich niet te kuisen) MAAR: lag de reden bij zelfherkenning? Zelfde proef, maar met duiven, die beloond werden bij afkuisen Duiven slaagden erin zich af te kuisen = zelfherkenning moet niet toegeschreven worden aan zelfbewustzijn of zelf-concept Er is een niet-mentalistische verklaring in termen van gedragscontrole op basis van discriminatieve prikkels en bekrachtiging Beperkingen bij conditionering Biologische beperkingen bij conditionering = kunnen we effectief alle fysiek uitvoerbare zaken aanleren Vertrouwheid met soort-specifieke instincten zijn noodzakelijk voor het volledig begrijpen van gedrag Voorbeeld: Varkens moeten geld in spaarpot steken, maar instinctief gedrag zorgde dat ze het gingen begraven (zoals ze doen met eten) = beperking op aanleren van gedrag door instinctive drift (vermenging van aangeleerd gedrag en instictief gedrag) Andere soorten van leergedrag Leerstrategieën niet beperkt tot - Pavloviaans gedrag - Skinneriaans leren Cognitief leren = zaken aanleren zonder dat we het te leren gedrag zelf uitvoeren (zonder bekrachtiging en straf) - Observationeel leren: iets aanleren louter door observatie (of door verwerven van inzicht) Behaviorisme in de jaren 2000 = eerste labo voor experimentele psychologie --> veel zaken afgeleid uit "introspectieve waarneming" (innerlijk zelfonderzoek) = manier werd uiteindelijk "afgeschaft" Overschakelen naar studie van objectief waarneembaar gedrag Skinner stelde voorspelling en controle van extern observeerbaar gedrag op als doelstelling van wetenschappelijke psychologie (behaviorisme) Studie van cognitie werd terug opgevat = veel minder studie rond conditionering Behaviorisme is wel meer dan voetnoot in geschiedenis of verlossing van introspectie Hedendaags gebruik van conditionering - afleren van fobieën (via uitdovingsprincipe) - autistische kinderen helpen via bekrachtiging - behandeling van stotteren - behandeling van afasie - trainen van dieren Neurobiologie gebaseerd op klassieke conditionering Klinische psychologie mag enkel toegepast worden door "evidence-based" therapie = moet dus wetenschappelijk bewezen zijn dat manier effectief is = technieken vooral uit leerpsychologie Wel twijfels rond het feit in welke mate de menselijke gedachten (die ratten/duiven niet hebben) geen invloed hebben op de correctheid van de technieken - Ze vragen zich het doel van het onderzoek af - Ze vragen zich af hoe ze geacht worden te reageren - ... Kunnen de resultaten dus veralgemeend worden naar veel rijkere situatie in het dagelijks leven? Token economy-systeem: gedrag aanleren via geconditioneerde bekrachtigers in vorm van speelgoed geld = vaak gebruikt in psychiatrische klinieken = tokens kan men inruilen voor beloningen/privileges