Psycho_2012_Hoofdstuk_3

advertisement
Psychologie
Hoofdstuk 3
Contactpersoon: [email protected]
Hoofdstuk 3: Teach Your Children
Bijgeloof, gokverslavingen en ratten kunnen leren om te ruiken
= allen hebben een "leertraject" ondergaan
Soort van conditioneringsprocessen
= klassieke en instrumentele conditionering
Twee vormen van leren
Hond van Pavlov
= reeds speekselafscheiding (zin) bij het zien van voeding
= psychische reflex
Hij bestudeerde fysiologische reflex (voorbeeld: afscheiden van speeksel) bij het voorafgaan van een
bepaalde andere prikkel (bel, geluid, licht, ...)
Resultaat klassieke of Pavloviaanse conditionering
Puzzle box: kooit met klapdeur die kan geopend worden door hefboom in de kooi
Test:
Hongerige kat in kooi zetten en melkkommetje buiten bereik van opgesloten kat
= dier ging panikeren en drukte perongeluk op hefboompje
Thorndike vond wet van het effect
= de dieren gingen steeds sneller het gewenst/bedoeld gedrag uitvoeren
= basis van operante of instrumentele conditionering
Het gedrag dat resulteert in positieve gevolgen wordt versterkt
Het gedrag dat resulteert in negatieve gevolgen wordt verzwakt
! Belangrijk binnen het leerproces: beloning moet METEEN volgen op het gedrag
= wanneer kooi vijf seconden later zou openen, zal het leerproces vele langer duren
Temporele contiguïteit
= snelle opeenvolging in de tijd tussen gedrag en beloning
Klassieke conditionering
Methode van Pavlov
= passief proces
= honden moeten geen handeling doen in hun leerproces
Neutrale prikkel (rinkelen bel) wordt opgevolgd door prikken (toedienen voedsel) die reflexmatige
reactie (speekselafscheiding) uitlokt
Desondanks lokt de neutrale prikkel niets anders uit dan gebruikelijke oriënteringsreactie v/d hond
(het spitsen van de oren, alertheid)
Na herhaaldelijke koppeling van neutrale prikkel aan reflexuitlokkende prikkel zal de neutrale prikkel
een reactie uitlokken
= onvoorwaardelijke stimulus
Voedsel: onvoorwaardelijke stimulus (prikkel)
Speekselproductie: onvoorwaardelijke reactie
Neutrale prikkel (bel): voorwaardelijke stimulus (prikkel)
Reactie (leerproces): voorwaardelijke reactie
Aversieve conditionering
= onvoorwaardelijke reactie op schok verschilt van voorwaardelijke reactie
ZIE SCHEMA PAGINA 42 BOEK
Leerproces kan men snel afbouwen door
-> voorwaardelijke stimulus geven, maar geen onvoorwaardelijke prikkel
(bel luiden zonder voedsel geven)
Uitdoving
= proces v/h verdwijnen v/d voorwaardelijke reactie
! Uitdoven is niet vergeten
= men kan veel sneller terug gedrag aanleren door voorwaardelijke prikkel te voorzien
= spontaan herstel (komt ook soms onverwacht voor)
Wanneer men hond eten geeft na horen van bepaald geluid en men past geluid lichtelijk aan, zal de
hond nog steeds reageren
= verschil tussen voorwaardelijke prikkel uit leerproces en testprikkel
= prikkelgeneralisatie/prikkelveralgemening
! Maar ook vaststelling rond prikkeldiscriminatie
= twee geluiden, gelijken op elkaar, beide lokken prikkel uit, slechts één belonen, hierdoor zal andere
prikkel na verloop van tijd geen reactie meer uitlokken
Hogere-orde conditionering
Voorbeeld: lichtflits en daarna elektrische schok, hierdoor zal bij een lichtflits (niet gevolgd door
schok) eveneens een angstreactie te voorschijn komen
= nieuwe neutrale prikkels werden geconditioneerd
Temporele contiguïteit bleek uiteindelijk niet zo noodzakelijk te zijn voor conditionering
(eens het proces reeds is aangeleerd)
Klassieke conditionering aversie opbouwen na slechts één negatieve impuls
Voorbeeld: iets slecht eten, kan zorgen voor "degoutatie" t.o.v. bepaalde voeding
Voedselaversie is ook erg robuust tegen uitdoving
= gaat niet snel weg
Voorbeeld:
Kankerpatiënten vaak afkeer tegen "gewoon" voedsel doordat ze zich slechts voelen van
chemotherapie
= daarom vaak opteren voor "ongewoon" voedsel voor behandeling
Geconditioneerde voedselaversie kan ook problemen oplossen
Voorbeeld: lamsvlees vergiftigen waardoor dieren niet meer gaan jagen op lammeren
Conditionering kan geen verband brengen tussen arbitrair gekozen voorwaardelijke en
onvoorwaardelijke prikkels
Test:
Uitgedroogde ratten drinken aanbieden wanneer er lichtflits was en geluidsignaal
Vervolgens kregen ze of X-bestraling of schok (onvoorwaardelijke prikkel)
Resultaat:
Ratten met X-bestraling: associëren smaak met misselijkheid, niet met flits of geluid
Ratten met schok: associëren smaak niet met de pijn, wel de flits of geluid
Voorbeeld:
Tandarts pijnvolle ervaring => dooft niet snel uit (geur van praktijk zorgt nog steeds voor angst)
Voorbeeld:
Reclame met mooie vrouwen zorgt dat via conditionering dat men deze likt naar arbitraire producten
Voorbeeld:
Seksuele foto's tonen daarna foto's van doorsnee producten
Enkele weken erna enkel doorsnee producten tonen = nog steeds link met vrouwen
Operante conditionering
Testen van Skinner:
Rat in doolhof zetten op einde van doolhof voedsel
Wet van effect vond plaats: rat kon na verloop van tijd het doolhof vele sneller doorlopen
Skinnerbox: hefboompje in doos, bij indrukken komt er voedsel vrij
= dieren hadden dit na verloop van tijd door
Positieve bekrachtiging: gedrag dat systematisch gevolgd wordt door toedienen van bepaalde
prikkel in frequentie toeneemt, zorgt de prikkel voor positieve bekrachtiging (beloning)
Negatieve bekrachtiging = niet omgekeerde van positieve!
Ook beloning, maar beloning bestaat er nu uit iets negatief weg te nemen of aversieve prikkel
verwijden.
Voorbeeld: paraplu meenemen als het regent om natte kleren te vermijden
Uitdoving of extinctie
= wegnemen van bekrachtiging
Hoe moet je iemand het best opvoeden?
Skinner maakt onderscheidt tussen continue en intermittente bekrachtiging
Continue bekrachtiging: steeds belonen wanneer iemand iets goed doet
Nadeel: snelle uitdoving, vergeten van bekrachtiging kan leiden tot uitdoving
Nadeel: bekrachtiging kan zijn "effect" verliezen (voorbeeld altijd eten geven, op duur zal er geen
honger meer zijn en is het eten dus ook niets positiefs meer)
! Optimale beloningsstrategie wijzigt zodra bepaald gedrag is aangeleerd
= vanaf dan kan je gedrag beter in stand houden met
Partiële of intermittente bekrachtiging
= minder frequent belonen van gedrag
Partieel bekrachtigen kan op twee verschillende manieren
- Vast ratioschema: beloning nadat gedrag zich X-keer heeft voorgedaan
Voorbeeld: rat krijgt om drie keer drukken koekje = ratioschema-3
- Variabel ratioschema: beloning niet na vast aantal keer, wel gemiddeld na bepaald aantal keer
Voorbeeld: iemand die huizen verkoopt en daar elke 10% in slaagt, wordt met dat percentage
beloond
Beloning is bijgevolg op basis van intervalschema's
- Vast intervalschema: tijdsinterval is steeds identiek
- Variabel intervalschema: tijdsinterval verandert van keer op keer
Voorbeeld:
Hond elke dag voor uitvoeren van truckje belonen (vast intervalschema)
Visser die eens vis vangt (variabel intervalschema)
! Variabele schema's zorgen ervoor dat gedrag vaker voorkomt dan bij vaste schema's
Bij vaste schema komt het gedrag minder tot uiting en stijgt de frequentie naargelang de beloning
dichterbij komt
Bij een variabel schema wordt het gedrag met constante frequentie gesteld
Probleem bij gokverslaafden: variabel schema
= variabel schema verhoogt weerstand tegen uitdoving
Primaire bekrachtiger: prikkel die elementaire bekrachtiging bevredigt
Voorbeeld: drank voor dorstig dier, seks voor "geile" duif
Secundaire/geconditioneerde bekrachtigers
= krijgen bekrachtigende waarde omdat ze, door klassieke conditionering, gelinkt worden aan
primaire bekrachtiger
Voorbeeld: geld, glimlach, studieresultaten, etc.
Hoe leer je iemand een bepaald gedrag?
Voorbeeld: hoe leer je een hond om op een knop te drukken?
Response shaping
= criterium voor bekrachtiging stapsgewijs verschuiven in richting van uiteindelijk gewenst gedrag
Voorbeeld:
Belonen wanneer hond in richting knop kijkt
Belonen wanneer hond in richting knop wandelt (enkel dan nog belonen)
Bij het aanleren van reeks handelingen, leert men van achter naar voor
Eerst leren om krant bij baasje te leggen, dan om binnen te wandelen met krant, dan om krant te
nemen, ...
= toevoegen van voorafgaand gedrag aan de hele scène
= volgend gedrag is bekrachtiger van vorige gedrag
= pas op einde (primaire) bekrachtiging (al dan niet continue toegediend)
Test:
Skinnerbox -> duif moet op knopje drukken bij lichtflits
(krijgt dan voedsel)
= discriminatieve controle v/d lamp
lamp = discriminatieve prikkel
Voorbeeld in leven:
Hond doet truckje en krijgt beloning van "mij", maar niet van mijn "partner"
= hond zal truckje niet meer doen bij partner
= discriminatieve prikkel
Training van APOPO-ratten
Ratten kunnen explosieven opzoeken
- Eerst laten wennen aan klik geluid via Pavloviaanse conditionering (via geconditioneerde
bekrachtiger)
- Trainen op detecteren van explosieven
- Trainen op discriminatie: enkel belonen wanneer kop in gat gaat met effectief enkel TNT
- ...
Straf
Positieve straf: het toedienen van iets onaangenaams
Negatieve straf: het afnemen van iets aangenaams
Straf is riskante manier om gedrag te veranderen
= onmiddellijke gedragsverandering, maar geen duurzaam effect
Gedrag kan men minder snel aanleren via straffen
- Ongewenst onderdrukken is moeilijker wanneer dreiging van straf weg is
(degene die straf toekent moet steeds in buurt zijn)
= discriminatieve stimulus: gedrag enkel niet stellen bij bepaalde personen
Het is beter gedrag te bekrachtigen dan te straffen
Bijgeloof experiment
Wanneer men verschillende katten in kooi zetten en op staafje laten drukken voor deur te openen
merken we dat:
Elke kat zal op een bepaalde manier, toevallig, merken dat het deurtje opengaat door het staafje en
zal op deze (eigen) manier blijven op het staafje drukken
Elk dier krijgt bijgevolg een "eigen strategie"
= ander geloof opgebouwd rond gedrag om het deurtje te openen
Supersition in the pigeon
= verschillende duiven in verschillende skinnerboxen, om de 15 sec komt er korrel
--> blijven wachten is beste optie, maar wat doen de duiven tijdens die 15 sec?
Elke duif ander gedrag = soort van bijgeloof
Gedrag toont aan dat dieren causale relatie zelf bedenken tussen gedrag en verkrijgen van voedsel
Distinctief bijgelovig gedrag ook door mensen
Voorbeeld: kleuters tijdens wachten (lees 57)
Toevalligheden die hebben geleid tot een succes willen we herhalen
= zeker wanneer het weinig inspanningen kost
Vaak niets te maken met verband tussen geluksbrenger en resultaat
= wel met vermijden van risico
Te verklaren door algemeen geldend principe van conditionering
Operante conditionering en behavioristische visie op gedrag
Gedrag tussen soortgenoten neemt af wanneer men chimpansee voor spiegel zetten
Gedrag zoals het wegplukken van voedsel tussen tanden of onzichtbare plekken (die nu zichtbaar
waren) schoonmaken nam toe
= evedentie voor zelfherkenning in een spiegel
Men vond dat zelfherkenning een primitieve vorm van zelfbewustzijn enkel voorkwam bij mensen en
hogere apensoorten (andere apen begonnen zich niet te kuisen)
MAAR: lag de reden bij zelfherkenning?
Zelfde proef, maar met duiven, die beloond werden bij afkuisen
Duiven slaagden erin zich af te kuisen
= zelfherkenning moet niet toegeschreven worden aan zelfbewustzijn of zelf-concept
Er is een niet-mentalistische verklaring in termen van gedragscontrole op basis van discriminatieve
prikkels en bekrachtiging
Beperkingen bij conditionering
Biologische beperkingen bij conditionering
= kunnen we effectief alle fysiek uitvoerbare zaken aanleren
Vertrouwheid met soort-specifieke instincten zijn noodzakelijk voor het volledig begrijpen van gedrag
Voorbeeld:
Varkens moeten geld in spaarpot steken, maar instinctief gedrag zorgde dat ze het gingen begraven
(zoals ze doen met eten)
= beperking op aanleren van gedrag door instinctive drift
(vermenging van aangeleerd gedrag en instictief gedrag)
Andere soorten van leergedrag
Leerstrategieën niet beperkt tot
- Pavloviaans gedrag
- Skinneriaans leren
Cognitief leren
= zaken aanleren zonder dat we het te leren gedrag zelf uitvoeren (zonder bekrachtiging en straf)
- Observationeel leren: iets aanleren louter door observatie (of door verwerven van inzicht)
Behaviorisme in de jaren 2000
= eerste labo voor experimentele psychologie
--> veel zaken afgeleid uit "introspectieve waarneming" (innerlijk zelfonderzoek)
= manier werd uiteindelijk "afgeschaft"
Overschakelen naar studie van objectief waarneembaar gedrag
Skinner stelde voorspelling en controle van extern observeerbaar gedrag op als doelstelling van
wetenschappelijke psychologie
(behaviorisme)
Studie van cognitie werd terug opgevat
= veel minder studie rond conditionering
Behaviorisme is wel meer dan voetnoot in geschiedenis of verlossing van introspectie
Hedendaags gebruik van conditionering
- afleren van fobieën (via uitdovingsprincipe)
- autistische kinderen helpen via bekrachtiging
- behandeling van stotteren
- behandeling van afasie
- trainen van dieren
Neurobiologie gebaseerd op klassieke conditionering
Klinische psychologie mag enkel toegepast worden door "evidence-based" therapie
= moet dus wetenschappelijk bewezen zijn dat manier effectief is
= technieken vooral uit leerpsychologie
Wel twijfels rond het feit in welke mate de menselijke gedachten (die ratten/duiven niet hebben)
geen invloed hebben op de correctheid van de technieken
- Ze vragen zich het doel van het onderzoek af
- Ze vragen zich af hoe ze geacht worden te reageren
- ...
Kunnen de resultaten dus veralgemeend worden naar veel rijkere situatie in het dagelijks leven?
Token economy-systeem: gedrag aanleren via geconditioneerde bekrachtigers in vorm van
speelgoed geld
= vaak gebruikt in psychiatrische klinieken
= tokens kan men inruilen voor beloningen/privileges
Download