Waarneming 2.1 Inleiding 2.2 Basisnotities van het oog en het

advertisement
Hoofdstuk 2 : Waarneming
2.1 Inleiding
Vision sciences
Visiovoren
1/3 van hersenen actief
Venster op de geest
Why look things like they do?
Wetenschappen die allemaal samen met psychologie bijdragen aan het concept 'waarneming'
We zijn visuele dieren, we willen informatie opnemen ~ infovoren
bij verwerken van visuele informatie
~ geest-lichaam probleem → overgang fys prikkels, chem reacties naar persoonlijke beleving
Wij zijn wat we zijn ↔ objecten zijn zoals ze zijn
2.2 Basisnotities van het oog en het visueel brein
2.2.1 De 'input' van waaruit visuele waarneming dient te vertrekken
Oog ≠ perfect optisch instrument
artefact
Lichtgevoelige receptoren
Retina
Kegeltjes/Cones
Staafjes/Rods
Netvliesbeeld
Blinde vlek
Saccades
Fixatie
Input
Smearing
Saccadische suppressie
Filling-in
Snapshots
≠ lens, artefact = door evolutie! Visuelee waarneming is geen perfecte registratie van fysische realiteit
gemaakte machine
Receptoren die licht opvangen in retina
Netvlies
In fovea → groot detail maar niet sterk voor periferie
Minder detail, sterk voor in de periferie, werken goed bij weinig licht, snel veranderende prikkels
Hetgeen we binnenkrijgen en dusnog moeten verwerken (=wazig & ondersteboven!)
Geen receptoren in netvlies t.h.v. Optische zenuw → Geen beeld op dat plekje!
Tussen elk netvliesbeeld maken we saccades, oogsprongen dus, om gehele beeld scherper te maken
Tussen die saccades staan we ook even stil, = fixatie dus!
Opeenvolging van saccades en fixaties!
Het uitvagen van het beeld tijdens beweging
Om smearing te voorkomen → Het oog is tussen saccades even "blind" !
Die blinde momenten moeten dus ingevuld worden ( door hersenen )
Arme gewaarwordingen, eigenlijk de hele som van hierboven
2.2.2 "Bouwstenen" waarmee het visueel systeem aan de slag moet volgens de psychofysische benadering
Sensaties
Perceptie
Proximale stimuli
Distale stimuli
Sensoriële Psychofysica
Twee soorten Psychofysica
Outer psychophysics
Inner psychophysics
Intensiteit van fysische prikkels
Intensiteit van sensatie
Neurale excitatie
Drempel
Absolute drempel
Differentiële drempel
Just noticable difference
Interval of Uncertainty
Bovendrempel
Onderdrempel
Wet van Weber
Weberfractie
Increment
Wet van Weber-Fechner
Elementaire gewaarwordingen, geregistreerde prikkels
Uiteindelijke gewaarwording, verwerking/interpretatie prikkels
Prikkels die nabij het lichaam zijn ( gewaarwordingen )
Externe oorzaken van proximale stimuli in de buitenwereld, interpretatie bij waarneming dus
Houdt zich bezig met metingen elementaire gewaarwordingen → samenhang fysische grootheden
intensiteit van gewaarwording en de ontwikkeling van wetenschappelijke methoden hiervoor
Betrekking op relatie tussen intensiteit van fysische prikkels en intensiteit van sensatie (geregistreerde prikkels)
Betrekking op relatie tussen intensiteit van de neurale excitatie en de intensiteit van de sensatie
R → reiz (prikkel)
S
E → Hoeveelheid zenuwimpulsen
"Limen" = Grenswaarde tussen twee stimuli die een ander soort respons uitlokken
"Reiz Limen → RL" = Grenswaarde die markeert of er net wel of net niet een sensatie is
RL overschreden = in waarneembare gebied
"Differenz Limen → DL" = kleinste toegevoegde stimulusintensiteit die nodig is om waargenomen te worden
~ JND
JND → hangt samen met DL
IU = deel van de grafiek waarbij men niet zeker is of de intensiteit van de prikkel toe- of afgenomen is
Drempel waarbij men geen verschil in intensiteit meer kan waarnemen
Minimale stimulusintensiteit die nodig is om waargenomen te worden
DL ≠ vaste waarde, hangt af van stumulusintensiteit van standaardprikkel!
De stimulusintensiteit moet met een constante fractie van zijn waarde verhoogd worden om een
juist merkbaar verschil te bekomen k = ∆I / I
k ( = ∆I / I ) → verschilt voor andere soorten prikkels → hoe kleiner, hoe hoger gevoeligheid
Kleinste toevoeging (∆I)
Schaal met nulpunt en meeteenheid!!!
RL nodig om nulpunt te bepalen en JND om meeteenheid te bepalen
S = k log R → S = intensiteit geregistreerde prikkel, R = intensiteit fysische prikkel
Om de sterkte van de gewaarwording (S) te laten toenemen als een rekenkundige reeks
moet men de stimulusintensiteit laten toenemen volgens een meetkundige reeks
Signaaldetectietheorie
Signaalbeurten
Gissingsbeurten/Catch trials
Gevoeligheid/sensitiviteit
Antwoordentendens/ bias
MAPPING TUSSEN STIMULUSINTENSITEIT (fysisch) EN DE GROOTTE VAN DE
OVEREENKOMSTIGE GEWAARWORDING ERVAN (psychisch) = psychofysica !!!
Het vergelijken van false alarms (F) & hits (H) → zo bepalen of er gevoeligheid is
Beurten waarin weldegelijk prikkels toegediend worden
Beurten waarin geen prikkels toegediend worden
onderscheid kunnen maken tussen signaal- en gissingsbeurten
SENS= v[ u(H) - u(F) ] → als 0 = geen gevoeligheid!
d' = z(H) - z(F) ~ verschil in z-scores → beste manier!
Mate waarin ppn'n geneigd zijn om meer het ene antwoord te geven dan het andere
( BIAS= v[ u(H) + u(F) ] → als 0 = geen bias naar één v. beide antwoorden! )
( c = -0,5 [ z(H) - z(F) ] → criteriumwaarde )
2.2.3 "Bouwstenen" waarmee het visueel systeem aan de slag moet volgens de neurofysiologische benadering
Neuronen
Neuronen die vuren
LGN
V1
Specifiek responsprofiel
Center-surround structuur
On-off cellen
Simple cells
Complex cells
Hyper complex cells
Responsprofielen
Tuning
MT
Feature detectors
Filters voor visuele info verwerking
Hersencellen
Het reageren van hersencellen op kenmerken van de stimulus in hun visueel veld
Lateral geniculate nucleus - tussenstation tussen oog en visuele cortex
Primaire visuele cortex
Cellen zijn zeer specifiek in waarop ze reageren
Cellen die cirkelvormige stimulus verkiezen met pos centrum en neg omgeving OF neg centrum en pos omgeving
On = reageren bij prikkel, off = niet reageren bij prikkel → center-surround cellen!
specifiek gevoelig voor lijnstuk met bepaalde dikte en oriëntatie
variaties van lijnstuk in positie zijn mogelijk wanneer oriëntatie optimaal blijft
reageren enkel wanneer de lijnlengte overeenkomt met grootte receptief veld
Vlek- Lijn- of randdetector
Cellen vertonen specifieke responsprofielen in functie van specifieke stimuluseigenschappen
→ dus bijvoorbeeld : simple cells : oriëntatie en lijndikte
Medio-temporale cortex : complex cells reageren i.f.v. oriëntatie + BEWEGINGSRICHTING ( = tuning! )
Signaleren aan basis liggende kenmerken van een klein stukje van de stimulus in hun receptief veld
→ moeten verder geïnterpreteerd worden
Alle Responsprofielen van verschillende neuronen voorzien het systeem in zekere zin van meerdere
versies van een gefilterd "input" beeld
Spatiale frequentie
# licht-donker overgangen per eenheid oppervlakte → laag = waziger , hoog = scherper
Hoort ook bij Tuning!
2.2.4 Het hiërarchisch en modulair visueel brein
Input
Decoderen
1/3 hersenen actief
( 4 grote lobben )
2 grote stromen van visuele info verwerking
V1 → V2/V4
V1 → Pariëntale cortex
Agnosie
Retinotopie
Sheet
unfolding
Corticale hiërarchie
Hiërarchie
Specialisatie
FFA
PPA
Modules
Information flow
feedforward
feedbackward
anterieur
posterieur
bottom-up
top-down
Model visuele informatieverwerking
≠ een beeld, maar verzameling hersencellen die vuren, reageren op specifieke kenmerken van stimulus
De hersenen die de informatie verder verwerken
bij informatieverwerking (2.1)
frontale cortex, pariëntale cortex, occipitale cortex & temporale cortex
Hogere ordeverwerking voor bewuste herkenning : ventrale/wat-stroom
Ruimtelijke positie & beweging : dorsale/waar-stroom
niets meer bewust herkennen → probleem bij ventrale stroom
(Punten dichtbij in het gezichtsveld worden geprojecteerd op nabijgelegen punten in de visuele cortex )
→ weten waar punten in het visueel veld liggen, dit wordt zo gecodeerd
Hersenschors als 'laken' waar men de dichtbijliggende punten kan bekijken door
→ unfolding, het uitvouwen van dat laken om zo een retionotopische map te zien - links-rechts boven-onder
Receptieve velden worden steeds groter naarmaten je hogerop komt in elk van beide stromen in de hersenschors
trapsgewijze afdaling van meerdere naar mindere
Stukken hersenschors die specifieke objecten coderen
Fusiform face area : het specifiek coderen van gezichten
Parahippocampal place area : het specifiek coderen van plaatsen
Gespecialiseerde verwerkingseenheden, die dus specifiek objecten kunne coderen
De richting waar de informatie naar toe gaat
van posterieure gebieden naar anterieure gebieden
van anterieure gebieden naar posterieure gebieden
vooraan
achteraan
Data-gedreven, informatie gewoon uithetgene wat we zien, interpretaties
Concept-gedreven, hetgene wat we zien wordt bijgestuurd door wat we al weten, verwachtingen
Gebruik van concepten : simple cells, complex cells, tuning, twee stromen, corticale hiërarchie,
groter worden van receptieve velden, maar vooral nadruk op Bottom-up
tekening!!
2.2.5 Voorlopige conclusie
Drie grote niveau's van verwerking
Low-Level
Registratie van de input (stimulatie receptoren netvlies), het decoderen van de eerste neurale responsen
→ enkelvoudige kenmerken binnen receptief veld van 1 cel
Mid Level
Perceptuele groepering van de gefragmenteerde input, figuur-achtergrond organisatie,
diepteperceptie enzowel 2-D als 3-D vormperceptie
High Level
interpretatie van de betekenis van wat er te zien is : identificatie, categorisatie van objecten scènes en
gebeurtenissen, semantische associaties, emotionele connotaties, hypotheses
COMPLEX SAMENSPEL VAN VERSCHILLENDE PROCESSEN!! → Top-Down, Bottom-up, ..
2.3 perceptuele organisatie
2.3.1 Inleiding
Fragmentarisch
Perceptuele Organisatie
perceptuele groepering
textuursegregatie
figuur-achtergrond organisatie
vormperceptie
Perceptueel bewustzijn
Stuksgewijs ( binnenkomende prikkels zijn nog heel erg fragmentarisch → moeten georganiseerd worden
Verzameling processen die instaan voor het organiseren van de fragmentarische proximale stimuli
in grotere, gestructureerde gehelen
Dit bestaat uit georganiseerde gehelen ( gestalten ) niet uit afzonderlijke sensaties!!
2.3.2 Perceptuele groepering
Groeperingsprincipes/ Gestaltwetten
Proximiteit
Similariteit
Proximiteit, Similariteit, good continuation en common fate.
Nabijheid
Overeenkomst, gelijkheid
Good continuation
Common fate
Continuïteit, veranderingen zijn zo geleidelijk mogelijk
Hetzelfde "lot", ondergaan hetzelfde
Experiment groepering obv proxim.
Lattices
Lattices
Stippenrasters : zijden a & b met hoek γ
→ welke oriëntatie
Keuze voor een bepaalde oriëntatie neemt af als een exponentiële functie van de relatieve afstand in die richting
Groeperingsterkte neemt exponentiëel af i.f.v. groter wordende afstand!!
symmetrie
# gelijke afstanen
De indruk die ze wekken, de rasters zien er weldegelijk anders uit
Het geheel is meer en anders dan de som van de delen ( ~ tegen gestaltpsycho)
Attractiefunctie
Globale regelmaat
Ambiguïteit
Perceptuele indruk
Pure Distance Law
Experiment groepering obv proximiteit, continuïteit en similariteit → Gabor lattices
Gabor Lattices
Rasters waarbij het basiselement een gaborpatch is
Gabor Patch
Vlekje met specifiek helderheidsverloop, wordt vaak gebruikt voor modellering receptief veld simple cells
Laterale Maskering
Detecteren van gabor patch wordt moeilijker door de dichte nabijheid
Colliniare facilitatie
Detecteren van gabor patch wordt makkelijker door de langere afstand
Hoe sterk de locale oriëntatie samenvalt met de globale rechte of kromme waarvan het element deel uitmaakt
Alineëring
Laterale Maskering en Collineaire facilitatie hangen af van de alineëring tussen de elementen
Snake Detection
Association Field
Zoeken van een kromme bestaande uit verschillende gabor patches
→ proximiteit, similariteit, alineëring, ambiguïteit, complexiteit kromme
Veld van onderlinge aantrekking tussen buurelementen, een basaal groeperingsmechanisme
2.3.3 Textuursegregatie
Textuursegregatie
Onderscheid tussen verschillende regio's in een niet-homogeen veld
→ elementen verschillen al dan niet van basiskenmerken
→ groepering binnen een regio door SIMILARITEIT
→ segregatie tussen twee regio's door DISSIMILARITEIT
2.3.4 Figuur-achtergrond organisatie
Figuur-achtergrond organisatie
Ook een opdeling tussen verschillende regio's in een niet-homogeen veld
→ 1 regio krijgt status als achtergrond, waarschijnlijk grote, holle, assymetrische regio
→ andere regio krijgt status als voorgrond, waarschijnlijk kleine, bolle, symetrische regio
Convex
Bol
Concaaf
Hol
Wetten die F-A organisatie bepalen
Oppervlakte, Convexiteit & Symmetrie
→ Verticale symmetrie lijkt meer impact te hebben dan horizontale
→Symmetrie niet zo sterk als convexiteit of continuïteit
Familiariteit
Omtrekken die bekend lijken zullen eerder als voorgrond beschouwd worden
Extremal edges ↔ cut edges
Bepaalde figuren lijken nog door te gaan verder dan de rand ( bolle indrukken ) of stoppen gewoon
Extremal edges > cut edges
aan de rand (platte figuren)
V1 Neuronen Temporele Dynamiek
1. onderscheid tussen optimale en niet-optimale oriëntatie in receptief veld
2. onderscheid tussen rand van figuur & achtergrond
3. onderscheid binnenkant figuur en achtergrond
Niet strikt bottom-up! -> ook Top-down! = WISSELWERKING!!! Low Level beïnvloedt door High-Level!
Extra F-A organisatie wet
Geslotenheid, closure, van verschillende obecten, zodat ze een 'figuur' vormen
Als alineëring doorbroken → minder performantie!
Oriëntatieruis
De oriëntatie van de afzonderlijke delen van een kromme, wijken een beetje af van de ideale oriëntatie
2.3.5 Figuur-achtergrond organisatie en perceptuele multistabiliteit
Intrinsiek Ambigu
Cues worden niet perfect gemeten
Perceptuele Multistabiliteit
Vace-Faces
Innerlijk dubbelzinnig (aangezien toekenning van figuur-status gebaseerd is op aanwijzingen
met een waarschijnlijkheid
→ geen enkele aanwijzing is volledig eenduidig ( dubbelzinnig dus ) Het proces is dus :
intrinsiek probabilistisch, niet determnistisch ( voorspelbaar ) LOGISCH
zijn ook blootgesteld aan ruis, de toewijzing van figuur-achtergrond is dus niet eenduidig
Beelden kunnen op verschillende manieren geïnterpreteerd worden
Voorbeeld perceptuele multistabiliteit, je kan vaas zien oftewel een gezicht
achtergrond heeft geen rand, de figuur wel
BOWN
Switching
Bown = Configurationele eigenschap
Border-ownership : strijd om de rand!!
Kunnen wisselen tussen de twee interpretaties van een figuur, kan wel niet wisselen omdat enkel
één de eigenaar van de rand kan zijn
Tot welke reio een stukje van de rand behoort hangt af van de configuratie ( grotere geheel )
waarin dat stukje rand is opgenomen
2.3.6 Visuele illusies als illustratie van een aglemeen Gestaltprincipe
Algemeen gestaltprincipe
Helderheidscontrast
Waarneming van grootte
Klassieke geometrische illusies
Complexe zwart-wit patronen
Dynamische illusies
Visueel systeem codeert zelden of nooit de absolute waarde van locale eigenschappen
Het is relatieve codering, houdt rekening met context, globale configuratie
→ helderheid, kleur, lengte, oriëntatie, grootte, .. T.e.m. meer semantische eigenschappen
Helderheidsovergangen worden door visueel systeem overdreven door naburige elementen
→ Donkere omgeving = kleuren donkerder
→ Lichte omgeving = kleuren lichter
Grootte wordt overdreven met naburige elementen
→ Meestal groter bij kleine elementen, meestal kleiner bij grote elementen
Müller-Lyer illusie - lijnstukken van zelfde grootte maar lijken verschillend
Sandler Parallellogram - linstukken in figuur zijn eigenlijk even lang
Jastrow Illusie - boogjes lijken verschillend door hun onderlinge spatiale relaties
oppel-Kundt illusie - verticale streepjes lijken breder
Square grid illusie - vertekening hoogte en breedte van vierkante lijnconfiguratie
Hering-wundt illusie - Horizontale lijnen krom
Poggendorf illusie - schuine lijnen liggen in elkaars verlengde
Ponzo illusie - object in hoek lijkt groter
Ehrenstein illusie - vierkant is vertekend door divergerende lijnen
Zöllner illusie - schuine diagonalen zijn eigenlijk parralel maar lijken convergerend of divergerend
Café wall illusie - verticale lijnen zijn parallel maar lijken convergerend of divergerend
Fraser illusie - lijkt een spiraal maar zijn cirkels
(Bulge effect - lijnen worden krom gezien)
(Scintillating grid - rondspringende zwarte bolletjes in raster)
2.3.7 Subjectieve contouren, modale en amodale vervollediging
Subjectieve contouren
Kanisza-driehoek
V2 cellen reageren ook op illusoire randen!!
Occlusie
Surface-filling in
Cue
Occlusion cues
Modale completie
Amodale completie
Grote occlusie amodale completie
Kleine occlusie amodale completie
Grote occlusie modale completie
Kleine occlusie modale completie
waarneming van randen die er eigenlijk niet zijn
3 illusies : subjectieve contour, ordening in diepte, helderheidscontrast
Suggestie van bedekking
Object lijkt onder een ander object te vervolledigen waardoor de BOWN naar het bovenliggende object gaat
aanwijzing
Aanwijzingen dat een object zogezegd bedekt is door iets
Het lijkt een figuur met echte randen, ookal zijn die niet getekend → is liever kort
Het is een figuur waarvan je de randen niet ziet omdat er occlusie over dit object is, maar je weet dat er wel randen
maar je weet dat er wel randen zijn → is liever lang
Afronding
Vierkantiger
Vierkantiger
Afronding
2.3.8 Deel-geheel relaties
Verhouding tussen delen en geheel
Embedded figures
Configural Superiority effect
Odd man out (OMO)
Configural superiority
Configural inferiority
Redunant
Neurale basis config. super. Effect
Graz - geheel is meer dan som van de delen
Berlijn - geheel is anders dan som van de delen, geheel heeft eigen ontologische status
Delen van geheel zijn niet langer aanwezig in bewuste perceptuele ervaring
→ worden vervormd
→ zijn niet langer beschikbaar
Toevoegen van een overtollige context → leidt tot nieuwe gehelen
kan soms voordeel opleveren!
Item dat verschilt in de display
→ gaat bij configural superiority effect sneller gevonden worden!
Als toegevoegde context het zoeken vergemakkelijkt
Als toegevoegde context het zoeken bemoeilijkt
overtollig
→ In Parts conditie werd OMO makkelijker gevonden bij lage corticale gebieden
→ In Whole conditie werd OMO makkelijker gevonden bij hoge corticale gebieden
Lage corticale gebieden
Hoge corticale gebieden
Bistable Diamond
Activatie verschillende hersendelen
Explaining away
Predictive coding
Error signals
V1, V2, V3, laaggelegen in de hersenschors
LOC ( lateraal occipitaal complex ) , hooggelegen in hersenschors
→ GEHELEN WORDEN GELEIDELIJKAAN OPGEBOUDWD ≠ in strijd met feedforward
op-en-neer beweging van diagonaal georiënteerde lijnsegmenten
ofwel een over-en-weer gaan van ruit ( door amodale completie)
→ Switching is mogelijk!
Locale percepten → lage corticale gebieden
Globale percepten → hoge corticale gebieden
= complexer dan feedforward! ( + feedback? )
→ In tussenliggende corticale gebieden zag men de trend omkeren!
Predictive coding
O.b.v. binnenkomende signalen een voorspelling doen en terugkoppelen naar
lage corticale gebieden
Lgere corticale gebieden coderen enkel wat afwijkt van de verwachting
2.4 Abiguïteiten door het probleem van onderdeterminatie
2.4.1 Verandering van theoretisch perspectief
Onderdeterminatie
Determinatie
Gestaltpscyhologie
Goodness principe
Cognitieve psychologie
Veridicaliteit
Likelihood principle
Twee dezelfde groottes in het netvliesbeeld kunnen afkomstig zijn van voorwerpen
met verschillende ware grootte , bekeken op een andere afstand
Vaststelling
Goodness principe
Perceptuele organisatie zal steeds zo eenvoudig en goed mogelijk zijn
= simplicity principle/eenvoudigheidsbeginsel van gestaltpsychologie
~ kennis en verwachtingen
Veridicaliteit, Likelihood principle
De realiteit zo waarheidsgetrouw mogelijk vatten
Waarschijnlijkheidsbeginsel ~ waarschijnlijkheid van interpretatie van perceptie
2.4.2 Klassieke ambiguïteiten en contexteffecten
Semantische interpretaties
Contextinvloeden
Hysterese
Gaan een perceptie interpreteren a.d.h.v. de betekenis achter de figuur,
is afhankelijk van interpretatie welke afzonderlijke delen behoren tot een object
Gaan een perceptie interpreteren a.d.h.v. de context rond de figuur
Fenomeen waarbij het omslagpunt van het zien van één figuur naar het andere afhangt, en is hierdoor vertraagd
van de sequentie van de aanbiedingen
2.4.3 Klassieke ambiguïteiten, onbewuste redeneringen en assumpties
Waarneming van helderheid
Intrinsieke objecteigenschappen
Extrinsieke objecteig. Van lichtbron
Scène
Hol masker
~(2.3.6 helderheidscontrast)
eigenschappen die het object zelf bevat ~ reflectantie, pigmentstructuur
hoe de lichtbrond het object beïnvloedt ~sterkte en kleurspectrum van licht
Hoe het object in de voorstelling staat, relatieve positie, lichtbron, kijker,..
lichtinval+vormperceptie
→ Convexiteitsassumptie is heel dwingend bij disambigueren van helderheidsprofiel
Assumptie licht komt van boven neemt overhand
2.4.4 Grootteconstantie, rol van ervaring en New Look Psychologie
Grootteconstantie
Onbewuste redenering
Rol van ervaring
Exp. Grootte laten inschatten
New Look Psychologie
grootte in het netvliesbeeld is afhankelijk van 1. grootte object, en 2. afstand van het object
~ hoe kan men zien, in WKH
Het visueel doet een onbewuste redenering met een vraagstuk :
2 onbekenden : ware grootte en kijkafstand, 1 bekende : retinale grootte
met gebruik van dieptecues kan men dit vraagstuk oplossen
~ Probleem molyneux - George Berkeley
Associaties leren leggen bij onbewuste redenering!
Volwassenen & kinderen
→ volwassenen accurater dan kinderen : meer ervaring
→ arme kinderen schatten geld veel groter in dan rijke kinderen
= rol van ervaring en levenssfeer!
Subjectieve factoren en persoonlijke waarden worden hier sterk benadrukt
2.4.5 Onderdeterminatie van 3D door 2D, vormconstantie, onmogelijke figuren en illusies ~ assumpties!
3D is ondergedetermineerd want verliest bij projectie op de retina haar 3e demensie en wordt dus 2D!
recovery problem - ill-posed problem
Het afleiden van 3D uit 2D
Oplossingsstrategie
Bijkomende assumpties maken!!!
Probleem Vormconstantie
Hoe kan men zien dat iets in werkelijkheid eenzelfde fysische vorm heeft met
steeds wisselende netvliesbeelden? ~ elipsvormige cirkel kunnen ook stukjes zijn
Vormconstantie
een object behoudt dezelfde vorm ookal wordt hij gezien uit een andere hoek
Multistabiliteit
ook in 3D !!! (2.3.5)
3D in 2D zien is een gewoonte!!!
Waarneming van grootte
Kan vertekend zijn
Vormperceptie
Kan vertekend zijn door een verkeerde ruimtelijke interpretatie
Shepard tables
Je kan het niet laten van de parallellogrammen in de diepte te zien, waardoor je
de gelijkenis van de parallellogrammen niet ziet
Probleem met parallellogrammen → hoeken die afwijken van 90° zijn voor visueel systeem
Futura gebouw
een afwijking in 1 richting, maar is eigenlijk afwijking in ander richting
= ambiguïteit en assumpties!!
2.4.6 Onderdeterminatie vn 3D door 2D, transactionalisme en Bayesiaanse inferentie
Transactionalisme
Kamer van Ames!!!
Trapeziumvormig venster van Ames
Onbewuste inferentie
Recovery probleem van 3D hoeken
3D perceptie ( oplossing van onderdeterminatie) door gebruik van assumpties
gebaseerd op jarenlange ervaringen in de omgeving
→ onderdeterminatie is dat twee dezelfde groottes in het nesvliesbeeld toch afkomstig
kunnen zijn van voorwerpen met verschillende ware grootte
Assumptie van rechthoekige kamers is nog steeds groter dan dat mensen eigenlijk
niet kunnen krimpen als ze van ons weglopen
laat ronddraaien rond verticale as, zie je geen volledige rotatie, maar een heen en weer beweging
= verkeerde interpretatie van trapezium als eenr echthoek
= vertekende dieptewaarneming
Hoeken lijken in 3D niet gelijk maar in 2D net wel
Theorema van Bayes
weten niet als we een 2D beeld hebben, onder welke hoek we naar een 3D hoek zitten te kijken
Concreet aan het erk gaan voor het geval men wil achterhalen hoe groot de 3D hoek is,
gegeven een 2D hoek.
Bayesiaanse inferentie
2.5 Semantische interpretatie van objecten en scènes
→ Semantische interpretatie staat centraal
2.5.1 Objectherkenning -- High-level
Objectherkenning
Matching
Groot probleem
2 MOGELIJKHEIDEN
3D voorstelling per object
Gezichtspuntafh. Objectvoorstellingen per object
Recognition by components
Clutter
VOORAL BOTTOM-UP
Na randdetectie: 2 processen parallel
Semantisch herkennen van de identiteit v voorwerp of aangeven tot welke basiscat. Het behoort
= ook voorwerp herkennen maar niet op de naam komen!
overeenkomst tussen on-line berekende objectvoorstelling en een off-line gestockeerde
objectvoorstelling in het visueel geheugen.
→ variatie gezichtspunt en helderheid → moeten extrinsieke en intrinsieke eigenschappen wegwerken
maar 1 representatie stockeren per object → kleine opslag en klein matching probleem
= gezichtspuntonafhankelijk
meerdere representaties stockeren maar makkelijk te berekenen
→ grote opslag, groot matching probleem
= gezichtspuntafhankelijk
→ Is in staat om te verklaren hoe objectherkenning mogelijk is onder clutter met beperkte informatie
over een deel van het voorwerp
→ Nooit eerder gezien vw toch structureel kunnen beschrijven a.d.h.v. de basiscomponenten
en hun spatiale relaties
→ Het combineren van een beperkt aantal componenten in verschillende onderlinge relaties op
goede manier te gebruiken
Deel van beeld bedekken
Detectie van niet-toevallige eigenschappen of non-accidental properties
Segmentatie van het beeld ter hoogte van diepe concaviteiten
→ componenten bepalen, hierna nog globale spatiale relaties bepalen , en gezichtspuntonafhankelijke overeenkomst zoeken
Concaviteit
Onderscheid RBC = segmentatie
NAP
NAP helpt bij Recovery Problem
inkepingen
Het segmenteren bij concaviteiten deelt het basisobject op in nieuwe basisobjecten
non accidental properties = niet toevallige eigenschappen
Bij de veronderstelling van een algemeen standpunt (general viewpoint assumption) mag men
deze regelmaat in het beeld gebruiken om gelijkaardige regelmaat in de scène af te leiden.
Men mag aannemen dat degelijke regelmaat niet het toevallig resultaat is van één welbepaald gezichtspunt.
→ als men een beeld geprojecteert krijgt die in werkelijkheid niet overeenkomt met de af beelding
op de retina, dan kan je dat beeld enkel zien vanuit 1 bepaald gezichtspunt!! = niet goed!
NAP
is een brug tussen perceptuele organisatie en objectherkenning
Theorie over wat de bouwstenen zijn
36 verschillende geons
→ Doorsnede: rechte of kromme randen
geon
bouwsteen
→ Doorsnede: veelvoudig-symmetris, dubbel-symmetrisch of assymetrisch
→ Grootte: toenemen, toenemen+afnemen, constant
→ As: recht of gebogen
Biedermann → beperkt # basisdelen volstaan om object te herkennen!
2.5.2 Scènecontexteffecten op objectherkenning
Palmer
Loftus & Mackworth
Free viewing
Speeded object verification
Scène- consistent/inconsistent/neutraal
→ herkenning beter in consistente conditie dan in andere
→ Visueel gelijkende objecten worden verkeerd geïnterpreteerd
Free viewing
Bekijken van beeld voor 4 sec.
→ fixatie op onwaarschijnlijke objecten duurden langer en kwamen meer voor dan op waarschijnlijke
verschillende beelden
→ Semantisch label
→ Af beelding Scène
→ Mask
→ Probe 'plaatsaanuiding eventuele target'
Top-down!!
post-perceptuele decisieprocessen
Target daar aanwezig??
ook schendingen tegen normale spatiale frequenties!!
d' tussen 1 &2 → 1: meer schendigen tov spatiale frequenties, 2: langere aanbiedingstijd
Is verwachtingsgedreven → je gaat verwachtingen opbouwen in welke scène je wat kan zien
→ passende objecten worden beter herkend dan niet-passende
→ semantiek van een scène wordt meteen opgepikt
Heeft misschien niet met waarneming te maken maar met de beslissingen die achteraf gemaakt worden
2.5.3 Snelle categorisatie van objecten
Categorisatie
Het onderbrengen van concrete visuele prikkel in grote categorie
Basisniveau
Het meest spontane niveau waar je een object in zou categoriseren
Subordinaatniveau
Het 2e meest spontane niveau waar je een object in zou categoriseren
Superordinaatniveau
Het 3e meest spontane niveau waar je een object in zou categoriseren
= high level → bekijken van grotere gehelen, niet meer afzonderlijke stukken
≠ evident om aan te geven wat representatie in geheugen is
Go/No-go
Aanduiden of iets aanwezig was in plaatje
Speed-accuracy tradeoff
Langere reactietijden gaan gepaard met hogere procent correctheid,
sneller antwoorden = meer fouten!
Event-related potentials
Electrische activiteit is gerlateerd aan de cognitieve processen die zich afspelen in de hersenen
na aanbieding van de prikkel
→ na 150/160 ms was het duidelijk of dier of niet, het beslissingsproces voegde extra tijd toe
Feedforward processing
Heel belangrijk, is dus verwachtingsgedreven en kunnen zo snel kenmerken extraheren
!! Het duurt langer om een prikkel te categoriseren in een kleinere homogene categorie ( basisniveau ) dan in een grotere heterogene
categorie (subordinaatniveau)
2.5.4 Snelle categorisatie van scènes
Lage spatiale frequentie
Hoge spatiale frequentie
Clutter
Klein aantal overschakelingen van licht naar donker per oppervlakeenheid = ruwe spatiale schaal
Hoog aantal overschakelingen van licht naar donker per oppervlakeenheid = fijne spatiale schaa
Het 'gevraagde object/scène' is bedekt door iets
Occlusie
Schaduwvorming
Hybride afbeeldingen
Coarse -to fine verwerkingsvolgorde
Expansie/openheid
Natuurlijkhei/ruwheid
Spatial envelope properties
Dens neuraal netwerk
met sterke interconnectiviteit
Analyse door synthese
Reverse Hierarchy Theory
structurele anatomische aspecten
functionele procesmatige aspecten
Reverse Hierarchy Theory
Verwerking HSF & LSF i.f.v. tijd
Ideale Template
Bedekking van object/ scène door iets anders
Er valt een schaduw op het object/scène
HSF van 1 scène gecombineerd met LSF van andere scène
→ korte aanbiedingen = LSF, lange aanbiedingen = HSF
LSFtarget+HSFruis daarna HSFtarget+LSFruis → logisch! Ruis tot fijn, LSF van target naar HSF!
→ opnieuw bevestiging snelle scèneperceptie = LSF
Het verloop van helderheidsprofiel : zacht = open landschappen, hard = steden
Scène is een entiteit op zich met globale karakteristieke kenmerken
→ 7 globale kenmerken!!
openheid, expansie, gemiddelde diepte, temperatuur, transiëntie, beschutting, navigeerb.heid
Mensen doen hier heel veel beroep op, er is continu informatie uitwisseling
Binnenkomende prikkels worden niet passief en doelloos door filters verwerkt, maar zitten
steeds in het licht vor beschouwing van beschikbare 'bottom-up' informatie en 'top-down' kennis
= massief-parallelle informatieverwerking
= nieuwe visie op corticale hiërarchie met onderscheid tussen structurele anatomische aspecten
en functionele procesmatige aspecten
de localisatie in de hersenen
verloop in tijd
Feedforward sweep wordt snel doorgestroomd naar hoge visuele gebieden ~ hypothesen
Feecback sweep gaat trager en vult details in die beroep doen op kleinere receptieve velden
van de lagere receptieve velden ~ wisselwerking top-down en bottom-up
= Onderscheid Low-level en High-level processing en early- en late processing
→ snelle verwerking in Hoge corticale gebieden!!
~ object&sceneperceptie van Biederman Schyns en Oliva
→ LSF wordt snel doorgestuurd naar prefrontale cortex waar hypothesen gegenereerd worden
→ LSF templates worden eruggekoppeld in tragere feedforwardstroom gecombineerd met HSF
van verdere beeldanalyses
Het geheel van ruisbeelden waarin een target gerapporteerd was, delen door 2 en daarna de
ruisbeelden er van aftrekken waarbij geen target gesignaleerd was
→ dingen zien in schimmels, wolken, .. PAREIDOLIA!! (H1!!)
2.6 Alternatieve theoretische denkkaders
2.6.1 Intermezzo: Terugblik en vooruitblik
Mainstream visie
wat vandaag de dag door de meeste waarnemingszoeker als theoretisch denkkader gehateerd w.
Begonnen bij
whedendaagse visie op oog en visueel brein
Geëindigd bij
wisselwerking tussen top-down en bottom-up, het begrijpen van visuele informatieverwerking dus
Belangrijke stromingen in waarneming
Gestaltpsychologie & cognitieve psychologie
Nog 2 nieuwe niet-mainstream benaderingen bestuderen o.l.v. James Gibson
2.6.2 Ecologische benadering van James Gibson
Ecologische validiteit
* Grootteconstantie
Horizon-ratio
Hogere-orde variabelen
Direct pick-up
Ecologische optica
Stralingslicht/radiënt licht
Omgevingslicht/ambiënt licht
Optic array
Ambiënt licht
Visual Cliff
Waarneming staat steeds ten dienste van zinvol gedrag in zinvolle omgeving
→ omgeving is bron van stimulatie en de oppervlakten spelen een grote rol
Het is enkel een probleem als je het object alleen bekijkt. Als je objecten in
omgeving bekijkt is er geen enkel probleem
→ Grootte object bekijken met betrekking tot het aantal bedekte textuurelementen op
het oppervlak, geeft steeds een relatieve meting! Constante verhouding!
→ Vw'n met zelfde FYSISCHE grootte hebben een constante horizon-ratio waar ze ook staan
Verhouding van het dele boven en onder de horizonlijn
Verhoudingen, patronen!!
Hogere-orde variabelen worden meteen opgepikt, worden direct zo geregistreerd door visueel
systeem, moeten niet meer berekend worden!
is heel erg verschillend van klassieke optica - onderscheid 2 soorten licht
Afkomstig van de lichtbron en bevat enkel informatie van de lichtbron
Afkomstig van omgeving en bevat dus ook informatie over voorwerpen uit de omgeving
Het gehele patroon van licht zoals dat invalt op het oog, ≠ 1 lichtstraal!
Heel veel informatie uit omgeving. Als wrnmr van plaats verandert, is er een heel nieuw beeld, maar
de randen staan nog steeds op de zelfde plekk
Visueel systeem maakt gebruik van patronen die randen, diepte en textuurgradiënten specifiëren
Invarianten
Gelijkblijvende factoren ondanks veranderen ( zoals bv randen )
Datgene wat onveranderd blijft onder een bepaalde groep van transformaties
Transformationele invarianten
Bepaald patroon van verandering, onafhankelijk van de structuur waarop de transformatie plaatsv.
bv: structuur van schedel naarmate men ouder wordt.
Optc flow
Stroom van optische elementen die ontstaat in de optic array van een bewegende waarnemer
→ Als waarnemer beweeg je in ene richting, dan is er een optic flow in de ander richting, verderaf
staat een stroom die stilstaat of met je meebeweegt
Bewegingsparallax
richting en snelheid van de optic flow is dus een directe functie van de afstand t.o.v. de bewegende
waarnemer
Optical looming
het snel expanderende flow field ten gevolge van een snel naderend voorwerp
Focus of expansion
Geeft aan waar je als waarnemer naar toe beweegt
Tau
de verhouding van de grootte in het netvliesbeeld tot de sterkte van de verandering van de
~ Time-to-contact
grootte over die tijd - hoelang me nnog heeft vooraleer men het oppervlak zal raken
Affordances
eigenschappen van voorwerpen die in directe relatie staan met gedrag van de waarnemer,
wat je met het voorwerp kan doen, wat het voorwerp toelaat
Direct pick-up van de invarianten uit visuele informatie
Het visueel systeem moet afgestemd zijn op de beschikbare informatie ≠ berekeningen!
Resonance
Smart mechanisms
Hogere-orde variabelen registreren, en niet afleiden uit lage-orde variabelen
Waarneming is DIRECT!! Zonder tussenliggende processen!!
ITP
(klassieke) indirecte theorieën van perceptie
DTP
Directe theorie van perceptie
ITP → zintuigen = passief
DTP → zintuigen = actieve perceptuele systemen
2.6.3 De computationele benadering van David Marr
Computationele theorie
Representaties en algoritmes
Hardware implementatie
Geëxtraheerd
Analyse van de taak (functie) van visuele waarneming als een informatieverwerkingsprobleem
→ Wat moet er berekend worden, wat is er beschikbaar?? → Input & Output ??
Hoe kan je Input en Output voorstellen, hoe kan je deze transformeren??
Fysische realisatie van deze representaties en algoritmes in brein en machine
Info moet uit de inputbeelden gehaald worden om ze expliciet te maken
3 Grote stappen
Primaire schets
Blurring
Thresholding
Zero-crossing
Raw primal sketch
Tokens
feature
Textuursegregatie
Full primal sketch
1. Primaire schets 2. 2,5-D schets 3. 3-D objectmodel
→ Randen extraheren ( want info zit impliciet in netvliesbeelden )
→ Blurring, Thresholding, Zero-crossing, Raw primal sketch
Grijswaarde overgangen waziger maken
Zwart-wit maken door alle grijswaarden boven een bep. Drempel wit te maken, en er onder zwart
"Randen aanmaken tussen zwarte en witte gedeelten"
Uit zero-crossing gaat men primitieve features extraheren in verschillende plaatjes
Symbolen, weergeven de meest belangrijkste en abstracte attributen van features los van identiteit
eigenschap
(2.3.3) Beeld bestaat uit 2 helften
Abstracte representatie van output na hele proces van perceptuele organisatie ↑
2,5-D schets ~ recovery probleem (2.3.5) 3D uit 2D halen
Gezichtspuntafhankelijke
Ruimtelijke oriëntaties van oppervlakken vanuit het standpunt van de waarnemer, kanteling
uit het beeldvlak weg(slant) en oriëntatie rond de kjikas(tilt) → vectoren!!
aspecten van diepte
Onafh. Modules
→ verschillende dieptecues verwerken : depth from stereo, shape from shading, structure from motion
Random-dot-stereogr.
Toont aan dat je diepte kan extraheren uit beelden waarin geen herkenbare voorwerpen aanwezig zijn
~ "ruisbeelden"
= bottom-up!
Correspondentieprobleem
Combinatorische explosie van mogelijk overeenkomstige punten, teveel punten die gecombineerd
kunnen worden!
Constraints
Voorwaarden die het aantal mogelijke oplossingen beperkt ( van het correspondentie probleem )
Compatibiliteit
Een witte stip komt overeen met een witte stip, een zwarte met een zwarte
Uniciteit
Elke stip komt slechts overeen met 1 andere stip
Continuïteit
(2.3.2) 'Good continuation' → veranderingen verlopen zo geleidelijk mogelijk
3-D objectmodel - onafhankelijke representatie van voorwerpen ~ Biederman, gezichtspuntonafhankelijke voorstelling (2.5.1)
Veralgemeence cilinders
~ 'geonen Biedermann (2.5.1)
Hiërarchisch 3D-objectmodel
Hiërarchisch 3D-objectmodel
abstracte eind = 1 cilinder, specifiek eind = veel cilinders
Stabiele representaties
zelfde representatie voor verschillende objecten, niet zo specifiek
Fijnere distincties
Verschillende representatie voor verschillende objecten, zeer specifiek
~ MATCHING (2.5.1)
Competutationele benadering = synthese van ITP & DTP
→ CTP = ITP bij ecologische benadering : er zijn berekeningen nodig om informatie te verwerken
maar wel verschil : CTP = bottom-up terwijl ITP = ook top-down
→ Groot deel geïntegreerd in Mainstream visie op waarneming ( ITP dus )
CTP
2.6.4 Twee toepassingen als illustratie
Vectaranalyse
Point-light walkers/puntlichtfig.
Motion silencing
Objecthood
Confetti walker
Silencing factor
Objecthood-opnieuw
Dieptecues
Monoculaire dieptecues
Oculomotorische dieptecues
Accommodatie
Convergentie
Absolute beweging wordt perceptueel ontbonden in gemeenschappelijke en relatieve
beweging
= Enorm dwingende, spontane, automatische (Gestalt)waarneming die duidelijk gebaseerd
is op de spatiotemporele relaties in de input
Cirkelvormige configuratie van gekleurde stippen roteert → moeilijker om te zien dat de
gekleurde stippen van kleur veranderen tijdens de rotatie dan wanner ze stilstaan
→ Bewegingsperceptie onderdtukt de bewuste toegang van de kenmerken van het bewegende
object
= lowlevel (Hubel&Wiesel + Oliva&Schyns + Biederman) of midlevel?
Als er een goed geheel gevormd wordt, zijn de details minder toegankelijk (=midlevel)
Point-light walker, maar dan met verkleurende puntjes
Iets waardoor de kleurverandering niet echt opvalt, mate van verandering
Hoe sterker de delen geïntegreerd zijn in de perceptie van een heel object, hoe minder
toegankelijk de veranderingen aan de delen zijn ( Embedded figures! 2.3.8 )
Klassieke informatiebronnen die toelaten diepte te zien (dieptewaarneming)
specifieke subset van alle bronnen met diepte-informatie die in normale visuele
waarneming beschikbaar zijn (statische afbeelding)
Het oog beschikt over spieren die zorgen dat vw'n scherp afgebeeld worden op netvlies
Kromming van lens wordt aangepast zodat de beelden scherp afgebeeld worden
→ dichtbij = lens groter, verderweg = lens kleiner
→ door kromming van lens afleiden hoe ver iets staat!
Beide ogen kunnen samen op een voorwerp gericht worden
→ dichtbij = ogen staan 'scheler', verder weg = ogen staan rechter gericht
→ door stand van ogen afleiden hoe ver iets staat!
Visuele dieptecues
Binoculair
- retinale dispariteit
- Gekruiste dispariteiten
- Niet-gekruiste disp.
Met beide ogen bekijken → retinale dispariteit
Het verschil dat bestaat tussen 2 verschillende netvliesbeelden ( van beide ogen dus )
omdat de ogen vanuit een verchillende riumtelijke positie kijken naar een object!
Bepaalde lijn in gezichtsveld, elk object die daar op ligt heeft geen retinale dispariteit
aangezien de netvliesbeelden gelijk zijn
Voorwerpen die voor horopterlijn liggen
Voorwerpen die achter horopterlijn liggen
Monoculair
- Bewegingsparralax ?
Met 1 oog kijken
Twee beelden afkomstig van 1 oog op 2 momenten in de tijd ~ ongeveer zelfde effect van binoculaire dieptecues
- horopterlijn
Statische monoculaire dieptecues
Interpositie/occlusie
Relatieve grootte
Relatieve hoogte
Textuurgradiënten
Lineair perspectief
Atmosferisch perspectief
Informatiebronnen in 1 statisch beeld
Als 1 voorwerp een ander voorwerp bedekt, dan is dat ééne vw dichterbij dan het andere
Dingen op grote afstand beslaan een kleiner stuk op het netvlies
Hoe hoger in het visueel veld, hoe verder af (horizon)
Oppervlakte met textuur in die diepte is uitgstrekt, je ziet de texturen kleiner worden
Parallelle lijnen die in perspectiefgetekend worden convergern in verdwijnpunt
lichtstralen die van ver komen, worden 'vervuild' door stof, en geven een waziger beeld
wel randen
Download