Hoofdstuk 2 : Waarneming 2.1 Inleiding Vision sciences Visiovoren 1/3 van hersenen actief Venster op de geest Why look things like they do? Wetenschappen die allemaal samen met psychologie bijdragen aan het concept 'waarneming' We zijn visuele dieren, we willen informatie opnemen ~ infovoren bij verwerken van visuele informatie ~ geest-lichaam probleem → overgang fys prikkels, chem reacties naar persoonlijke beleving Wij zijn wat we zijn ↔ objecten zijn zoals ze zijn 2.2 Basisnotities van het oog en het visueel brein 2.2.1 De 'input' van waaruit visuele waarneming dient te vertrekken Oog ≠ perfect optisch instrument artefact Lichtgevoelige receptoren Retina Kegeltjes/Cones Staafjes/Rods Netvliesbeeld Blinde vlek Saccades Fixatie Input Smearing Saccadische suppressie Filling-in Snapshots ≠ lens, artefact = door evolutie! Visuelee waarneming is geen perfecte registratie van fysische realiteit gemaakte machine Receptoren die licht opvangen in retina Netvlies In fovea → groot detail maar niet sterk voor periferie Minder detail, sterk voor in de periferie, werken goed bij weinig licht, snel veranderende prikkels Hetgeen we binnenkrijgen en dusnog moeten verwerken (=wazig & ondersteboven!) Geen receptoren in netvlies t.h.v. Optische zenuw → Geen beeld op dat plekje! Tussen elk netvliesbeeld maken we saccades, oogsprongen dus, om gehele beeld scherper te maken Tussen die saccades staan we ook even stil, = fixatie dus! Opeenvolging van saccades en fixaties! Het uitvagen van het beeld tijdens beweging Om smearing te voorkomen → Het oog is tussen saccades even "blind" ! Die blinde momenten moeten dus ingevuld worden ( door hersenen ) Arme gewaarwordingen, eigenlijk de hele som van hierboven 2.2.2 "Bouwstenen" waarmee het visueel systeem aan de slag moet volgens de psychofysische benadering Sensaties Perceptie Proximale stimuli Distale stimuli Sensoriële Psychofysica Twee soorten Psychofysica Outer psychophysics Inner psychophysics Intensiteit van fysische prikkels Intensiteit van sensatie Neurale excitatie Drempel Absolute drempel Differentiële drempel Just noticable difference Interval of Uncertainty Bovendrempel Onderdrempel Wet van Weber Weberfractie Increment Wet van Weber-Fechner Elementaire gewaarwordingen, geregistreerde prikkels Uiteindelijke gewaarwording, verwerking/interpretatie prikkels Prikkels die nabij het lichaam zijn ( gewaarwordingen ) Externe oorzaken van proximale stimuli in de buitenwereld, interpretatie bij waarneming dus Houdt zich bezig met metingen elementaire gewaarwordingen → samenhang fysische grootheden intensiteit van gewaarwording en de ontwikkeling van wetenschappelijke methoden hiervoor Betrekking op relatie tussen intensiteit van fysische prikkels en intensiteit van sensatie (geregistreerde prikkels) Betrekking op relatie tussen intensiteit van de neurale excitatie en de intensiteit van de sensatie R → reiz (prikkel) S E → Hoeveelheid zenuwimpulsen "Limen" = Grenswaarde tussen twee stimuli die een ander soort respons uitlokken "Reiz Limen → RL" = Grenswaarde die markeert of er net wel of net niet een sensatie is RL overschreden = in waarneembare gebied "Differenz Limen → DL" = kleinste toegevoegde stimulusintensiteit die nodig is om waargenomen te worden ~ JND JND → hangt samen met DL IU = deel van de grafiek waarbij men niet zeker is of de intensiteit van de prikkel toe- of afgenomen is Drempel waarbij men geen verschil in intensiteit meer kan waarnemen Minimale stimulusintensiteit die nodig is om waargenomen te worden DL ≠ vaste waarde, hangt af van stumulusintensiteit van standaardprikkel! De stimulusintensiteit moet met een constante fractie van zijn waarde verhoogd worden om een juist merkbaar verschil te bekomen k = ∆I / I k ( = ∆I / I ) → verschilt voor andere soorten prikkels → hoe kleiner, hoe hoger gevoeligheid Kleinste toevoeging (∆I) Schaal met nulpunt en meeteenheid!!! RL nodig om nulpunt te bepalen en JND om meeteenheid te bepalen S = k log R → S = intensiteit geregistreerde prikkel, R = intensiteit fysische prikkel Om de sterkte van de gewaarwording (S) te laten toenemen als een rekenkundige reeks moet men de stimulusintensiteit laten toenemen volgens een meetkundige reeks Signaaldetectietheorie Signaalbeurten Gissingsbeurten/Catch trials Gevoeligheid/sensitiviteit Antwoordentendens/ bias MAPPING TUSSEN STIMULUSINTENSITEIT (fysisch) EN DE GROOTTE VAN DE OVEREENKOMSTIGE GEWAARWORDING ERVAN (psychisch) = psychofysica !!! Het vergelijken van false alarms (F) & hits (H) → zo bepalen of er gevoeligheid is Beurten waarin weldegelijk prikkels toegediend worden Beurten waarin geen prikkels toegediend worden onderscheid kunnen maken tussen signaal- en gissingsbeurten SENS= v[ u(H) - u(F) ] → als 0 = geen gevoeligheid! d' = z(H) - z(F) ~ verschil in z-scores → beste manier! Mate waarin ppn'n geneigd zijn om meer het ene antwoord te geven dan het andere ( BIAS= v[ u(H) + u(F) ] → als 0 = geen bias naar één v. beide antwoorden! ) ( c = -0,5 [ z(H) - z(F) ] → criteriumwaarde ) 2.2.3 "Bouwstenen" waarmee het visueel systeem aan de slag moet volgens de neurofysiologische benadering Neuronen Neuronen die vuren LGN V1 Specifiek responsprofiel Center-surround structuur On-off cellen Simple cells Complex cells Hyper complex cells Responsprofielen Tuning MT Feature detectors Filters voor visuele info verwerking Hersencellen Het reageren van hersencellen op kenmerken van de stimulus in hun visueel veld Lateral geniculate nucleus - tussenstation tussen oog en visuele cortex Primaire visuele cortex Cellen zijn zeer specifiek in waarop ze reageren Cellen die cirkelvormige stimulus verkiezen met pos centrum en neg omgeving OF neg centrum en pos omgeving On = reageren bij prikkel, off = niet reageren bij prikkel → center-surround cellen! specifiek gevoelig voor lijnstuk met bepaalde dikte en oriëntatie variaties van lijnstuk in positie zijn mogelijk wanneer oriëntatie optimaal blijft reageren enkel wanneer de lijnlengte overeenkomt met grootte receptief veld Vlek- Lijn- of randdetector Cellen vertonen specifieke responsprofielen in functie van specifieke stimuluseigenschappen → dus bijvoorbeeld : simple cells : oriëntatie en lijndikte Medio-temporale cortex : complex cells reageren i.f.v. oriëntatie + BEWEGINGSRICHTING ( = tuning! ) Signaleren aan basis liggende kenmerken van een klein stukje van de stimulus in hun receptief veld → moeten verder geïnterpreteerd worden Alle Responsprofielen van verschillende neuronen voorzien het systeem in zekere zin van meerdere versies van een gefilterd "input" beeld Spatiale frequentie # licht-donker overgangen per eenheid oppervlakte → laag = waziger , hoog = scherper Hoort ook bij Tuning! 2.2.4 Het hiërarchisch en modulair visueel brein Input Decoderen 1/3 hersenen actief ( 4 grote lobben ) 2 grote stromen van visuele info verwerking V1 → V2/V4 V1 → Pariëntale cortex Agnosie Retinotopie Sheet unfolding Corticale hiërarchie Hiërarchie Specialisatie FFA PPA Modules Information flow feedforward feedbackward anterieur posterieur bottom-up top-down Model visuele informatieverwerking ≠ een beeld, maar verzameling hersencellen die vuren, reageren op specifieke kenmerken van stimulus De hersenen die de informatie verder verwerken bij informatieverwerking (2.1) frontale cortex, pariëntale cortex, occipitale cortex & temporale cortex Hogere ordeverwerking voor bewuste herkenning : ventrale/wat-stroom Ruimtelijke positie & beweging : dorsale/waar-stroom niets meer bewust herkennen → probleem bij ventrale stroom (Punten dichtbij in het gezichtsveld worden geprojecteerd op nabijgelegen punten in de visuele cortex ) → weten waar punten in het visueel veld liggen, dit wordt zo gecodeerd Hersenschors als 'laken' waar men de dichtbijliggende punten kan bekijken door → unfolding, het uitvouwen van dat laken om zo een retionotopische map te zien - links-rechts boven-onder Receptieve velden worden steeds groter naarmaten je hogerop komt in elk van beide stromen in de hersenschors trapsgewijze afdaling van meerdere naar mindere Stukken hersenschors die specifieke objecten coderen Fusiform face area : het specifiek coderen van gezichten Parahippocampal place area : het specifiek coderen van plaatsen Gespecialiseerde verwerkingseenheden, die dus specifiek objecten kunne coderen De richting waar de informatie naar toe gaat van posterieure gebieden naar anterieure gebieden van anterieure gebieden naar posterieure gebieden vooraan achteraan Data-gedreven, informatie gewoon uithetgene wat we zien, interpretaties Concept-gedreven, hetgene wat we zien wordt bijgestuurd door wat we al weten, verwachtingen Gebruik van concepten : simple cells, complex cells, tuning, twee stromen, corticale hiërarchie, groter worden van receptieve velden, maar vooral nadruk op Bottom-up tekening!! 2.2.5 Voorlopige conclusie Drie grote niveau's van verwerking Low-Level Registratie van de input (stimulatie receptoren netvlies), het decoderen van de eerste neurale responsen → enkelvoudige kenmerken binnen receptief veld van 1 cel Mid Level Perceptuele groepering van de gefragmenteerde input, figuur-achtergrond organisatie, diepteperceptie enzowel 2-D als 3-D vormperceptie High Level interpretatie van de betekenis van wat er te zien is : identificatie, categorisatie van objecten scènes en gebeurtenissen, semantische associaties, emotionele connotaties, hypotheses COMPLEX SAMENSPEL VAN VERSCHILLENDE PROCESSEN!! → Top-Down, Bottom-up, .. 2.3 perceptuele organisatie 2.3.1 Inleiding Fragmentarisch Perceptuele Organisatie perceptuele groepering textuursegregatie figuur-achtergrond organisatie vormperceptie Perceptueel bewustzijn Stuksgewijs ( binnenkomende prikkels zijn nog heel erg fragmentarisch → moeten georganiseerd worden Verzameling processen die instaan voor het organiseren van de fragmentarische proximale stimuli in grotere, gestructureerde gehelen Dit bestaat uit georganiseerde gehelen ( gestalten ) niet uit afzonderlijke sensaties!! 2.3.2 Perceptuele groepering Groeperingsprincipes/ Gestaltwetten Proximiteit Similariteit Proximiteit, Similariteit, good continuation en common fate. Nabijheid Overeenkomst, gelijkheid Good continuation Common fate Continuïteit, veranderingen zijn zo geleidelijk mogelijk Hetzelfde "lot", ondergaan hetzelfde Experiment groepering obv proxim. Lattices Lattices Stippenrasters : zijden a & b met hoek γ → welke oriëntatie Keuze voor een bepaalde oriëntatie neemt af als een exponentiële functie van de relatieve afstand in die richting Groeperingsterkte neemt exponentiëel af i.f.v. groter wordende afstand!! symmetrie # gelijke afstanen De indruk die ze wekken, de rasters zien er weldegelijk anders uit Het geheel is meer en anders dan de som van de delen ( ~ tegen gestaltpsycho) Attractiefunctie Globale regelmaat Ambiguïteit Perceptuele indruk Pure Distance Law Experiment groepering obv proximiteit, continuïteit en similariteit → Gabor lattices Gabor Lattices Rasters waarbij het basiselement een gaborpatch is Gabor Patch Vlekje met specifiek helderheidsverloop, wordt vaak gebruikt voor modellering receptief veld simple cells Laterale Maskering Detecteren van gabor patch wordt moeilijker door de dichte nabijheid Colliniare facilitatie Detecteren van gabor patch wordt makkelijker door de langere afstand Hoe sterk de locale oriëntatie samenvalt met de globale rechte of kromme waarvan het element deel uitmaakt Alineëring Laterale Maskering en Collineaire facilitatie hangen af van de alineëring tussen de elementen Snake Detection Association Field Zoeken van een kromme bestaande uit verschillende gabor patches → proximiteit, similariteit, alineëring, ambiguïteit, complexiteit kromme Veld van onderlinge aantrekking tussen buurelementen, een basaal groeperingsmechanisme 2.3.3 Textuursegregatie Textuursegregatie Onderscheid tussen verschillende regio's in een niet-homogeen veld → elementen verschillen al dan niet van basiskenmerken → groepering binnen een regio door SIMILARITEIT → segregatie tussen twee regio's door DISSIMILARITEIT 2.3.4 Figuur-achtergrond organisatie Figuur-achtergrond organisatie Ook een opdeling tussen verschillende regio's in een niet-homogeen veld → 1 regio krijgt status als achtergrond, waarschijnlijk grote, holle, assymetrische regio → andere regio krijgt status als voorgrond, waarschijnlijk kleine, bolle, symetrische regio Convex Bol Concaaf Hol Wetten die F-A organisatie bepalen Oppervlakte, Convexiteit & Symmetrie → Verticale symmetrie lijkt meer impact te hebben dan horizontale →Symmetrie niet zo sterk als convexiteit of continuïteit Familiariteit Omtrekken die bekend lijken zullen eerder als voorgrond beschouwd worden Extremal edges ↔ cut edges Bepaalde figuren lijken nog door te gaan verder dan de rand ( bolle indrukken ) of stoppen gewoon Extremal edges > cut edges aan de rand (platte figuren) V1 Neuronen Temporele Dynamiek 1. onderscheid tussen optimale en niet-optimale oriëntatie in receptief veld 2. onderscheid tussen rand van figuur & achtergrond 3. onderscheid binnenkant figuur en achtergrond Niet strikt bottom-up! -> ook Top-down! = WISSELWERKING!!! Low Level beïnvloedt door High-Level! Extra F-A organisatie wet Geslotenheid, closure, van verschillende obecten, zodat ze een 'figuur' vormen Als alineëring doorbroken → minder performantie! Oriëntatieruis De oriëntatie van de afzonderlijke delen van een kromme, wijken een beetje af van de ideale oriëntatie 2.3.5 Figuur-achtergrond organisatie en perceptuele multistabiliteit Intrinsiek Ambigu Cues worden niet perfect gemeten Perceptuele Multistabiliteit Vace-Faces Innerlijk dubbelzinnig (aangezien toekenning van figuur-status gebaseerd is op aanwijzingen met een waarschijnlijkheid → geen enkele aanwijzing is volledig eenduidig ( dubbelzinnig dus ) Het proces is dus : intrinsiek probabilistisch, niet determnistisch ( voorspelbaar ) LOGISCH zijn ook blootgesteld aan ruis, de toewijzing van figuur-achtergrond is dus niet eenduidig Beelden kunnen op verschillende manieren geïnterpreteerd worden Voorbeeld perceptuele multistabiliteit, je kan vaas zien oftewel een gezicht achtergrond heeft geen rand, de figuur wel BOWN Switching Bown = Configurationele eigenschap Border-ownership : strijd om de rand!! Kunnen wisselen tussen de twee interpretaties van een figuur, kan wel niet wisselen omdat enkel één de eigenaar van de rand kan zijn Tot welke reio een stukje van de rand behoort hangt af van de configuratie ( grotere geheel ) waarin dat stukje rand is opgenomen 2.3.6 Visuele illusies als illustratie van een aglemeen Gestaltprincipe Algemeen gestaltprincipe Helderheidscontrast Waarneming van grootte Klassieke geometrische illusies Complexe zwart-wit patronen Dynamische illusies Visueel systeem codeert zelden of nooit de absolute waarde van locale eigenschappen Het is relatieve codering, houdt rekening met context, globale configuratie → helderheid, kleur, lengte, oriëntatie, grootte, .. T.e.m. meer semantische eigenschappen Helderheidsovergangen worden door visueel systeem overdreven door naburige elementen → Donkere omgeving = kleuren donkerder → Lichte omgeving = kleuren lichter Grootte wordt overdreven met naburige elementen → Meestal groter bij kleine elementen, meestal kleiner bij grote elementen Müller-Lyer illusie - lijnstukken van zelfde grootte maar lijken verschillend Sandler Parallellogram - linstukken in figuur zijn eigenlijk even lang Jastrow Illusie - boogjes lijken verschillend door hun onderlinge spatiale relaties oppel-Kundt illusie - verticale streepjes lijken breder Square grid illusie - vertekening hoogte en breedte van vierkante lijnconfiguratie Hering-wundt illusie - Horizontale lijnen krom Poggendorf illusie - schuine lijnen liggen in elkaars verlengde Ponzo illusie - object in hoek lijkt groter Ehrenstein illusie - vierkant is vertekend door divergerende lijnen Zöllner illusie - schuine diagonalen zijn eigenlijk parralel maar lijken convergerend of divergerend Café wall illusie - verticale lijnen zijn parallel maar lijken convergerend of divergerend Fraser illusie - lijkt een spiraal maar zijn cirkels (Bulge effect - lijnen worden krom gezien) (Scintillating grid - rondspringende zwarte bolletjes in raster) 2.3.7 Subjectieve contouren, modale en amodale vervollediging Subjectieve contouren Kanisza-driehoek V2 cellen reageren ook op illusoire randen!! Occlusie Surface-filling in Cue Occlusion cues Modale completie Amodale completie Grote occlusie amodale completie Kleine occlusie amodale completie Grote occlusie modale completie Kleine occlusie modale completie waarneming van randen die er eigenlijk niet zijn 3 illusies : subjectieve contour, ordening in diepte, helderheidscontrast Suggestie van bedekking Object lijkt onder een ander object te vervolledigen waardoor de BOWN naar het bovenliggende object gaat aanwijzing Aanwijzingen dat een object zogezegd bedekt is door iets Het lijkt een figuur met echte randen, ookal zijn die niet getekend → is liever kort Het is een figuur waarvan je de randen niet ziet omdat er occlusie over dit object is, maar je weet dat er wel randen maar je weet dat er wel randen zijn → is liever lang Afronding Vierkantiger Vierkantiger Afronding 2.3.8 Deel-geheel relaties Verhouding tussen delen en geheel Embedded figures Configural Superiority effect Odd man out (OMO) Configural superiority Configural inferiority Redunant Neurale basis config. super. Effect Graz - geheel is meer dan som van de delen Berlijn - geheel is anders dan som van de delen, geheel heeft eigen ontologische status Delen van geheel zijn niet langer aanwezig in bewuste perceptuele ervaring → worden vervormd → zijn niet langer beschikbaar Toevoegen van een overtollige context → leidt tot nieuwe gehelen kan soms voordeel opleveren! Item dat verschilt in de display → gaat bij configural superiority effect sneller gevonden worden! Als toegevoegde context het zoeken vergemakkelijkt Als toegevoegde context het zoeken bemoeilijkt overtollig → In Parts conditie werd OMO makkelijker gevonden bij lage corticale gebieden → In Whole conditie werd OMO makkelijker gevonden bij hoge corticale gebieden Lage corticale gebieden Hoge corticale gebieden Bistable Diamond Activatie verschillende hersendelen Explaining away Predictive coding Error signals V1, V2, V3, laaggelegen in de hersenschors LOC ( lateraal occipitaal complex ) , hooggelegen in hersenschors → GEHELEN WORDEN GELEIDELIJKAAN OPGEBOUDWD ≠ in strijd met feedforward op-en-neer beweging van diagonaal georiënteerde lijnsegmenten ofwel een over-en-weer gaan van ruit ( door amodale completie) → Switching is mogelijk! Locale percepten → lage corticale gebieden Globale percepten → hoge corticale gebieden = complexer dan feedforward! ( + feedback? ) → In tussenliggende corticale gebieden zag men de trend omkeren! Predictive coding O.b.v. binnenkomende signalen een voorspelling doen en terugkoppelen naar lage corticale gebieden Lgere corticale gebieden coderen enkel wat afwijkt van de verwachting 2.4 Abiguïteiten door het probleem van onderdeterminatie 2.4.1 Verandering van theoretisch perspectief Onderdeterminatie Determinatie Gestaltpscyhologie Goodness principe Cognitieve psychologie Veridicaliteit Likelihood principle Twee dezelfde groottes in het netvliesbeeld kunnen afkomstig zijn van voorwerpen met verschillende ware grootte , bekeken op een andere afstand Vaststelling Goodness principe Perceptuele organisatie zal steeds zo eenvoudig en goed mogelijk zijn = simplicity principle/eenvoudigheidsbeginsel van gestaltpsychologie ~ kennis en verwachtingen Veridicaliteit, Likelihood principle De realiteit zo waarheidsgetrouw mogelijk vatten Waarschijnlijkheidsbeginsel ~ waarschijnlijkheid van interpretatie van perceptie 2.4.2 Klassieke ambiguïteiten en contexteffecten Semantische interpretaties Contextinvloeden Hysterese Gaan een perceptie interpreteren a.d.h.v. de betekenis achter de figuur, is afhankelijk van interpretatie welke afzonderlijke delen behoren tot een object Gaan een perceptie interpreteren a.d.h.v. de context rond de figuur Fenomeen waarbij het omslagpunt van het zien van één figuur naar het andere afhangt, en is hierdoor vertraagd van de sequentie van de aanbiedingen 2.4.3 Klassieke ambiguïteiten, onbewuste redeneringen en assumpties Waarneming van helderheid Intrinsieke objecteigenschappen Extrinsieke objecteig. Van lichtbron Scène Hol masker ~(2.3.6 helderheidscontrast) eigenschappen die het object zelf bevat ~ reflectantie, pigmentstructuur hoe de lichtbrond het object beïnvloedt ~sterkte en kleurspectrum van licht Hoe het object in de voorstelling staat, relatieve positie, lichtbron, kijker,.. lichtinval+vormperceptie → Convexiteitsassumptie is heel dwingend bij disambigueren van helderheidsprofiel Assumptie licht komt van boven neemt overhand 2.4.4 Grootteconstantie, rol van ervaring en New Look Psychologie Grootteconstantie Onbewuste redenering Rol van ervaring Exp. Grootte laten inschatten New Look Psychologie grootte in het netvliesbeeld is afhankelijk van 1. grootte object, en 2. afstand van het object ~ hoe kan men zien, in WKH Het visueel doet een onbewuste redenering met een vraagstuk : 2 onbekenden : ware grootte en kijkafstand, 1 bekende : retinale grootte met gebruik van dieptecues kan men dit vraagstuk oplossen ~ Probleem molyneux - George Berkeley Associaties leren leggen bij onbewuste redenering! Volwassenen & kinderen → volwassenen accurater dan kinderen : meer ervaring → arme kinderen schatten geld veel groter in dan rijke kinderen = rol van ervaring en levenssfeer! Subjectieve factoren en persoonlijke waarden worden hier sterk benadrukt 2.4.5 Onderdeterminatie van 3D door 2D, vormconstantie, onmogelijke figuren en illusies ~ assumpties! 3D is ondergedetermineerd want verliest bij projectie op de retina haar 3e demensie en wordt dus 2D! recovery problem - ill-posed problem Het afleiden van 3D uit 2D Oplossingsstrategie Bijkomende assumpties maken!!! Probleem Vormconstantie Hoe kan men zien dat iets in werkelijkheid eenzelfde fysische vorm heeft met steeds wisselende netvliesbeelden? ~ elipsvormige cirkel kunnen ook stukjes zijn Vormconstantie een object behoudt dezelfde vorm ookal wordt hij gezien uit een andere hoek Multistabiliteit ook in 3D !!! (2.3.5) 3D in 2D zien is een gewoonte!!! Waarneming van grootte Kan vertekend zijn Vormperceptie Kan vertekend zijn door een verkeerde ruimtelijke interpretatie Shepard tables Je kan het niet laten van de parallellogrammen in de diepte te zien, waardoor je de gelijkenis van de parallellogrammen niet ziet Probleem met parallellogrammen → hoeken die afwijken van 90° zijn voor visueel systeem Futura gebouw een afwijking in 1 richting, maar is eigenlijk afwijking in ander richting = ambiguïteit en assumpties!! 2.4.6 Onderdeterminatie vn 3D door 2D, transactionalisme en Bayesiaanse inferentie Transactionalisme Kamer van Ames!!! Trapeziumvormig venster van Ames Onbewuste inferentie Recovery probleem van 3D hoeken 3D perceptie ( oplossing van onderdeterminatie) door gebruik van assumpties gebaseerd op jarenlange ervaringen in de omgeving → onderdeterminatie is dat twee dezelfde groottes in het nesvliesbeeld toch afkomstig kunnen zijn van voorwerpen met verschillende ware grootte Assumptie van rechthoekige kamers is nog steeds groter dan dat mensen eigenlijk niet kunnen krimpen als ze van ons weglopen laat ronddraaien rond verticale as, zie je geen volledige rotatie, maar een heen en weer beweging = verkeerde interpretatie van trapezium als eenr echthoek = vertekende dieptewaarneming Hoeken lijken in 3D niet gelijk maar in 2D net wel Theorema van Bayes weten niet als we een 2D beeld hebben, onder welke hoek we naar een 3D hoek zitten te kijken Concreet aan het erk gaan voor het geval men wil achterhalen hoe groot de 3D hoek is, gegeven een 2D hoek. Bayesiaanse inferentie 2.5 Semantische interpretatie van objecten en scènes → Semantische interpretatie staat centraal 2.5.1 Objectherkenning -- High-level Objectherkenning Matching Groot probleem 2 MOGELIJKHEIDEN 3D voorstelling per object Gezichtspuntafh. Objectvoorstellingen per object Recognition by components Clutter VOORAL BOTTOM-UP Na randdetectie: 2 processen parallel Semantisch herkennen van de identiteit v voorwerp of aangeven tot welke basiscat. Het behoort = ook voorwerp herkennen maar niet op de naam komen! overeenkomst tussen on-line berekende objectvoorstelling en een off-line gestockeerde objectvoorstelling in het visueel geheugen. → variatie gezichtspunt en helderheid → moeten extrinsieke en intrinsieke eigenschappen wegwerken maar 1 representatie stockeren per object → kleine opslag en klein matching probleem = gezichtspuntonafhankelijk meerdere representaties stockeren maar makkelijk te berekenen → grote opslag, groot matching probleem = gezichtspuntafhankelijk → Is in staat om te verklaren hoe objectherkenning mogelijk is onder clutter met beperkte informatie over een deel van het voorwerp → Nooit eerder gezien vw toch structureel kunnen beschrijven a.d.h.v. de basiscomponenten en hun spatiale relaties → Het combineren van een beperkt aantal componenten in verschillende onderlinge relaties op goede manier te gebruiken Deel van beeld bedekken Detectie van niet-toevallige eigenschappen of non-accidental properties Segmentatie van het beeld ter hoogte van diepe concaviteiten → componenten bepalen, hierna nog globale spatiale relaties bepalen , en gezichtspuntonafhankelijke overeenkomst zoeken Concaviteit Onderscheid RBC = segmentatie NAP NAP helpt bij Recovery Problem inkepingen Het segmenteren bij concaviteiten deelt het basisobject op in nieuwe basisobjecten non accidental properties = niet toevallige eigenschappen Bij de veronderstelling van een algemeen standpunt (general viewpoint assumption) mag men deze regelmaat in het beeld gebruiken om gelijkaardige regelmaat in de scène af te leiden. Men mag aannemen dat degelijke regelmaat niet het toevallig resultaat is van één welbepaald gezichtspunt. → als men een beeld geprojecteert krijgt die in werkelijkheid niet overeenkomt met de af beelding op de retina, dan kan je dat beeld enkel zien vanuit 1 bepaald gezichtspunt!! = niet goed! NAP is een brug tussen perceptuele organisatie en objectherkenning Theorie over wat de bouwstenen zijn 36 verschillende geons → Doorsnede: rechte of kromme randen geon bouwsteen → Doorsnede: veelvoudig-symmetris, dubbel-symmetrisch of assymetrisch → Grootte: toenemen, toenemen+afnemen, constant → As: recht of gebogen Biedermann → beperkt # basisdelen volstaan om object te herkennen! 2.5.2 Scènecontexteffecten op objectherkenning Palmer Loftus & Mackworth Free viewing Speeded object verification Scène- consistent/inconsistent/neutraal → herkenning beter in consistente conditie dan in andere → Visueel gelijkende objecten worden verkeerd geïnterpreteerd Free viewing Bekijken van beeld voor 4 sec. → fixatie op onwaarschijnlijke objecten duurden langer en kwamen meer voor dan op waarschijnlijke verschillende beelden → Semantisch label → Af beelding Scène → Mask → Probe 'plaatsaanuiding eventuele target' Top-down!! post-perceptuele decisieprocessen Target daar aanwezig?? ook schendingen tegen normale spatiale frequenties!! d' tussen 1 &2 → 1: meer schendigen tov spatiale frequenties, 2: langere aanbiedingstijd Is verwachtingsgedreven → je gaat verwachtingen opbouwen in welke scène je wat kan zien → passende objecten worden beter herkend dan niet-passende → semantiek van een scène wordt meteen opgepikt Heeft misschien niet met waarneming te maken maar met de beslissingen die achteraf gemaakt worden 2.5.3 Snelle categorisatie van objecten Categorisatie Het onderbrengen van concrete visuele prikkel in grote categorie Basisniveau Het meest spontane niveau waar je een object in zou categoriseren Subordinaatniveau Het 2e meest spontane niveau waar je een object in zou categoriseren Superordinaatniveau Het 3e meest spontane niveau waar je een object in zou categoriseren = high level → bekijken van grotere gehelen, niet meer afzonderlijke stukken ≠ evident om aan te geven wat representatie in geheugen is Go/No-go Aanduiden of iets aanwezig was in plaatje Speed-accuracy tradeoff Langere reactietijden gaan gepaard met hogere procent correctheid, sneller antwoorden = meer fouten! Event-related potentials Electrische activiteit is gerlateerd aan de cognitieve processen die zich afspelen in de hersenen na aanbieding van de prikkel → na 150/160 ms was het duidelijk of dier of niet, het beslissingsproces voegde extra tijd toe Feedforward processing Heel belangrijk, is dus verwachtingsgedreven en kunnen zo snel kenmerken extraheren !! Het duurt langer om een prikkel te categoriseren in een kleinere homogene categorie ( basisniveau ) dan in een grotere heterogene categorie (subordinaatniveau) 2.5.4 Snelle categorisatie van scènes Lage spatiale frequentie Hoge spatiale frequentie Clutter Klein aantal overschakelingen van licht naar donker per oppervlakeenheid = ruwe spatiale schaal Hoog aantal overschakelingen van licht naar donker per oppervlakeenheid = fijne spatiale schaa Het 'gevraagde object/scène' is bedekt door iets Occlusie Schaduwvorming Hybride afbeeldingen Coarse -to fine verwerkingsvolgorde Expansie/openheid Natuurlijkhei/ruwheid Spatial envelope properties Dens neuraal netwerk met sterke interconnectiviteit Analyse door synthese Reverse Hierarchy Theory structurele anatomische aspecten functionele procesmatige aspecten Reverse Hierarchy Theory Verwerking HSF & LSF i.f.v. tijd Ideale Template Bedekking van object/ scène door iets anders Er valt een schaduw op het object/scène HSF van 1 scène gecombineerd met LSF van andere scène → korte aanbiedingen = LSF, lange aanbiedingen = HSF LSFtarget+HSFruis daarna HSFtarget+LSFruis → logisch! Ruis tot fijn, LSF van target naar HSF! → opnieuw bevestiging snelle scèneperceptie = LSF Het verloop van helderheidsprofiel : zacht = open landschappen, hard = steden Scène is een entiteit op zich met globale karakteristieke kenmerken → 7 globale kenmerken!! openheid, expansie, gemiddelde diepte, temperatuur, transiëntie, beschutting, navigeerb.heid Mensen doen hier heel veel beroep op, er is continu informatie uitwisseling Binnenkomende prikkels worden niet passief en doelloos door filters verwerkt, maar zitten steeds in het licht vor beschouwing van beschikbare 'bottom-up' informatie en 'top-down' kennis = massief-parallelle informatieverwerking = nieuwe visie op corticale hiërarchie met onderscheid tussen structurele anatomische aspecten en functionele procesmatige aspecten de localisatie in de hersenen verloop in tijd Feedforward sweep wordt snel doorgestroomd naar hoge visuele gebieden ~ hypothesen Feecback sweep gaat trager en vult details in die beroep doen op kleinere receptieve velden van de lagere receptieve velden ~ wisselwerking top-down en bottom-up = Onderscheid Low-level en High-level processing en early- en late processing → snelle verwerking in Hoge corticale gebieden!! ~ object&sceneperceptie van Biederman Schyns en Oliva → LSF wordt snel doorgestuurd naar prefrontale cortex waar hypothesen gegenereerd worden → LSF templates worden eruggekoppeld in tragere feedforwardstroom gecombineerd met HSF van verdere beeldanalyses Het geheel van ruisbeelden waarin een target gerapporteerd was, delen door 2 en daarna de ruisbeelden er van aftrekken waarbij geen target gesignaleerd was → dingen zien in schimmels, wolken, .. PAREIDOLIA!! (H1!!) 2.6 Alternatieve theoretische denkkaders 2.6.1 Intermezzo: Terugblik en vooruitblik Mainstream visie wat vandaag de dag door de meeste waarnemingszoeker als theoretisch denkkader gehateerd w. Begonnen bij whedendaagse visie op oog en visueel brein Geëindigd bij wisselwerking tussen top-down en bottom-up, het begrijpen van visuele informatieverwerking dus Belangrijke stromingen in waarneming Gestaltpsychologie & cognitieve psychologie Nog 2 nieuwe niet-mainstream benaderingen bestuderen o.l.v. James Gibson 2.6.2 Ecologische benadering van James Gibson Ecologische validiteit * Grootteconstantie Horizon-ratio Hogere-orde variabelen Direct pick-up Ecologische optica Stralingslicht/radiënt licht Omgevingslicht/ambiënt licht Optic array Ambiënt licht Visual Cliff Waarneming staat steeds ten dienste van zinvol gedrag in zinvolle omgeving → omgeving is bron van stimulatie en de oppervlakten spelen een grote rol Het is enkel een probleem als je het object alleen bekijkt. Als je objecten in omgeving bekijkt is er geen enkel probleem → Grootte object bekijken met betrekking tot het aantal bedekte textuurelementen op het oppervlak, geeft steeds een relatieve meting! Constante verhouding! → Vw'n met zelfde FYSISCHE grootte hebben een constante horizon-ratio waar ze ook staan Verhouding van het dele boven en onder de horizonlijn Verhoudingen, patronen!! Hogere-orde variabelen worden meteen opgepikt, worden direct zo geregistreerd door visueel systeem, moeten niet meer berekend worden! is heel erg verschillend van klassieke optica - onderscheid 2 soorten licht Afkomstig van de lichtbron en bevat enkel informatie van de lichtbron Afkomstig van omgeving en bevat dus ook informatie over voorwerpen uit de omgeving Het gehele patroon van licht zoals dat invalt op het oog, ≠ 1 lichtstraal! Heel veel informatie uit omgeving. Als wrnmr van plaats verandert, is er een heel nieuw beeld, maar de randen staan nog steeds op de zelfde plekk Visueel systeem maakt gebruik van patronen die randen, diepte en textuurgradiënten specifiëren Invarianten Gelijkblijvende factoren ondanks veranderen ( zoals bv randen ) Datgene wat onveranderd blijft onder een bepaalde groep van transformaties Transformationele invarianten Bepaald patroon van verandering, onafhankelijk van de structuur waarop de transformatie plaatsv. bv: structuur van schedel naarmate men ouder wordt. Optc flow Stroom van optische elementen die ontstaat in de optic array van een bewegende waarnemer → Als waarnemer beweeg je in ene richting, dan is er een optic flow in de ander richting, verderaf staat een stroom die stilstaat of met je meebeweegt Bewegingsparallax richting en snelheid van de optic flow is dus een directe functie van de afstand t.o.v. de bewegende waarnemer Optical looming het snel expanderende flow field ten gevolge van een snel naderend voorwerp Focus of expansion Geeft aan waar je als waarnemer naar toe beweegt Tau de verhouding van de grootte in het netvliesbeeld tot de sterkte van de verandering van de ~ Time-to-contact grootte over die tijd - hoelang me nnog heeft vooraleer men het oppervlak zal raken Affordances eigenschappen van voorwerpen die in directe relatie staan met gedrag van de waarnemer, wat je met het voorwerp kan doen, wat het voorwerp toelaat Direct pick-up van de invarianten uit visuele informatie Het visueel systeem moet afgestemd zijn op de beschikbare informatie ≠ berekeningen! Resonance Smart mechanisms Hogere-orde variabelen registreren, en niet afleiden uit lage-orde variabelen Waarneming is DIRECT!! Zonder tussenliggende processen!! ITP (klassieke) indirecte theorieën van perceptie DTP Directe theorie van perceptie ITP → zintuigen = passief DTP → zintuigen = actieve perceptuele systemen 2.6.3 De computationele benadering van David Marr Computationele theorie Representaties en algoritmes Hardware implementatie Geëxtraheerd Analyse van de taak (functie) van visuele waarneming als een informatieverwerkingsprobleem → Wat moet er berekend worden, wat is er beschikbaar?? → Input & Output ?? Hoe kan je Input en Output voorstellen, hoe kan je deze transformeren?? Fysische realisatie van deze representaties en algoritmes in brein en machine Info moet uit de inputbeelden gehaald worden om ze expliciet te maken 3 Grote stappen Primaire schets Blurring Thresholding Zero-crossing Raw primal sketch Tokens feature Textuursegregatie Full primal sketch 1. Primaire schets 2. 2,5-D schets 3. 3-D objectmodel → Randen extraheren ( want info zit impliciet in netvliesbeelden ) → Blurring, Thresholding, Zero-crossing, Raw primal sketch Grijswaarde overgangen waziger maken Zwart-wit maken door alle grijswaarden boven een bep. Drempel wit te maken, en er onder zwart "Randen aanmaken tussen zwarte en witte gedeelten" Uit zero-crossing gaat men primitieve features extraheren in verschillende plaatjes Symbolen, weergeven de meest belangrijkste en abstracte attributen van features los van identiteit eigenschap (2.3.3) Beeld bestaat uit 2 helften Abstracte representatie van output na hele proces van perceptuele organisatie ↑ 2,5-D schets ~ recovery probleem (2.3.5) 3D uit 2D halen Gezichtspuntafhankelijke Ruimtelijke oriëntaties van oppervlakken vanuit het standpunt van de waarnemer, kanteling uit het beeldvlak weg(slant) en oriëntatie rond de kjikas(tilt) → vectoren!! aspecten van diepte Onafh. Modules → verschillende dieptecues verwerken : depth from stereo, shape from shading, structure from motion Random-dot-stereogr. Toont aan dat je diepte kan extraheren uit beelden waarin geen herkenbare voorwerpen aanwezig zijn ~ "ruisbeelden" = bottom-up! Correspondentieprobleem Combinatorische explosie van mogelijk overeenkomstige punten, teveel punten die gecombineerd kunnen worden! Constraints Voorwaarden die het aantal mogelijke oplossingen beperkt ( van het correspondentie probleem ) Compatibiliteit Een witte stip komt overeen met een witte stip, een zwarte met een zwarte Uniciteit Elke stip komt slechts overeen met 1 andere stip Continuïteit (2.3.2) 'Good continuation' → veranderingen verlopen zo geleidelijk mogelijk 3-D objectmodel - onafhankelijke representatie van voorwerpen ~ Biederman, gezichtspuntonafhankelijke voorstelling (2.5.1) Veralgemeence cilinders ~ 'geonen Biedermann (2.5.1) Hiërarchisch 3D-objectmodel Hiërarchisch 3D-objectmodel abstracte eind = 1 cilinder, specifiek eind = veel cilinders Stabiele representaties zelfde representatie voor verschillende objecten, niet zo specifiek Fijnere distincties Verschillende representatie voor verschillende objecten, zeer specifiek ~ MATCHING (2.5.1) Competutationele benadering = synthese van ITP & DTP → CTP = ITP bij ecologische benadering : er zijn berekeningen nodig om informatie te verwerken maar wel verschil : CTP = bottom-up terwijl ITP = ook top-down → Groot deel geïntegreerd in Mainstream visie op waarneming ( ITP dus ) CTP 2.6.4 Twee toepassingen als illustratie Vectaranalyse Point-light walkers/puntlichtfig. Motion silencing Objecthood Confetti walker Silencing factor Objecthood-opnieuw Dieptecues Monoculaire dieptecues Oculomotorische dieptecues Accommodatie Convergentie Absolute beweging wordt perceptueel ontbonden in gemeenschappelijke en relatieve beweging = Enorm dwingende, spontane, automatische (Gestalt)waarneming die duidelijk gebaseerd is op de spatiotemporele relaties in de input Cirkelvormige configuratie van gekleurde stippen roteert → moeilijker om te zien dat de gekleurde stippen van kleur veranderen tijdens de rotatie dan wanner ze stilstaan → Bewegingsperceptie onderdtukt de bewuste toegang van de kenmerken van het bewegende object = lowlevel (Hubel&Wiesel + Oliva&Schyns + Biederman) of midlevel? Als er een goed geheel gevormd wordt, zijn de details minder toegankelijk (=midlevel) Point-light walker, maar dan met verkleurende puntjes Iets waardoor de kleurverandering niet echt opvalt, mate van verandering Hoe sterker de delen geïntegreerd zijn in de perceptie van een heel object, hoe minder toegankelijk de veranderingen aan de delen zijn ( Embedded figures! 2.3.8 ) Klassieke informatiebronnen die toelaten diepte te zien (dieptewaarneming) specifieke subset van alle bronnen met diepte-informatie die in normale visuele waarneming beschikbaar zijn (statische afbeelding) Het oog beschikt over spieren die zorgen dat vw'n scherp afgebeeld worden op netvlies Kromming van lens wordt aangepast zodat de beelden scherp afgebeeld worden → dichtbij = lens groter, verderweg = lens kleiner → door kromming van lens afleiden hoe ver iets staat! Beide ogen kunnen samen op een voorwerp gericht worden → dichtbij = ogen staan 'scheler', verder weg = ogen staan rechter gericht → door stand van ogen afleiden hoe ver iets staat! Visuele dieptecues Binoculair - retinale dispariteit - Gekruiste dispariteiten - Niet-gekruiste disp. Met beide ogen bekijken → retinale dispariteit Het verschil dat bestaat tussen 2 verschillende netvliesbeelden ( van beide ogen dus ) omdat de ogen vanuit een verchillende riumtelijke positie kijken naar een object! Bepaalde lijn in gezichtsveld, elk object die daar op ligt heeft geen retinale dispariteit aangezien de netvliesbeelden gelijk zijn Voorwerpen die voor horopterlijn liggen Voorwerpen die achter horopterlijn liggen Monoculair - Bewegingsparralax ? Met 1 oog kijken Twee beelden afkomstig van 1 oog op 2 momenten in de tijd ~ ongeveer zelfde effect van binoculaire dieptecues - horopterlijn Statische monoculaire dieptecues Interpositie/occlusie Relatieve grootte Relatieve hoogte Textuurgradiënten Lineair perspectief Atmosferisch perspectief Informatiebronnen in 1 statisch beeld Als 1 voorwerp een ander voorwerp bedekt, dan is dat ééne vw dichterbij dan het andere Dingen op grote afstand beslaan een kleiner stuk op het netvlies Hoe hoger in het visueel veld, hoe verder af (horizon) Oppervlakte met textuur in die diepte is uitgstrekt, je ziet de texturen kleiner worden Parallelle lijnen die in perspectiefgetekend worden convergern in verdwijnpunt lichtstralen die van ver komen, worden 'vervuild' door stof, en geven een waziger beeld wel randen