Stem-, Spraak- en Taalpathologie Vol. 12, 2004, No. 2, pp. 83-104 32.8310/01/1202-83 © Nijmegen University Press De ontwikkeling van spraakmotorische controle II: Vroege spraakproductie in relatie tot spraakperceptie Cathelijne M. J. Y. Tesink1, 2 en Ben Maassen3 Afdeling Psychiatrie, Universitair Medisch Centrum St. Radboud, Nijmegen F.C. Donders Centre for Cognitive Neuroimaging, Katholieke Universiteit Nijmegen 3 Interdisciplinair Kinderneurologisch Centrum/Afdeling Keel, Neus, Oorheelkunde/ Medische psychologie, Universitair Medisch Centrum St. Radboud, Nijmegen 1 2 In het eerste artikel van dit literatuuroverzicht is bij het bespreken van spraakmotorische controle uitgebreid aandacht besteed aan het DIVA model voor spraakproductie (Guenther, 1994; 1995). Aangezien auditieve feedback in het DIVA model zeer belangrijk wordt geacht voor het vestigen van een intern model voor spraakproductie tijdens de brabbelfase, wordt hier de rol van auditieve feedback in de ontwikkeling van brabbelen bij kinderen bekeken. De beschikbaarheid van auditieve feedback blijkt zeer belangrijk voor canonisch brabbelen, een cruciale eerste ontwikkelingsfase richting volwassen spraakproductie. Na een bespreking van vroege spraakproductie, wordt overgegaan naar de invloed van spraakperceptie bij de ontwikkeling van motorische controle van spraak. Bij spraakperceptie kan fonetische informatie niet alleen auditief, maar ook visueel verkregen worden. Aan de hand van de (revised) motor theory of speech perception (Liberman & Mattingly, 1985) wordt de link gelegd tussen spraakproductie en -perceptie zoals die ook tot uiting komt in imitatie. Imitatie wordt vaak genoemd als de link tussen perceptie en productie waarbij auditieve, visuele en motorische informatie aan elkaar gekoppeld worden. Van imitatie van, door anderen geproduceerde, spraakpatronen wordt verondersteld dat het voor een kind een belangrijk leermechanisme is tijdens taalverwerving en zelfs een vereiste is om uiteindelijk tot de volwassen spraakproductie te komen. Inleiding In dit tweede artikel van het literatuuroverzicht wordt verder ingegaan op de ontwikkeling van spraakmotorische controle. In het vorige artikel werd een theoretische uiteenzetting gegeven waarin aan de hand van het DIVA model voor spraakmotorische controle (Guenther, 1994; 1995) belangrijke componenten van motorische controle Correspondentieadres: Cathelijne Tesink, F.C. Donders Centre for Cognitive Neuroimaging, Adelbertusplein 1, 6525 EK Nijmegen. E-mail: [email protected] 84 TESINK & MAASSEN en de rol van auditieve feedback aan bod kwamen. In dit vervolgartikel wordt besproken op welke wijze de spraakontwikkeling van kinderen verloopt. Hierbij wordt uitgebreid de ontwikkeling van brabbelen bekeken, aangezien dit voor kinderen een cruciaal stadium in de ontwikkeling van spraakmotorische controle vormt. Na een overzicht van de vroege spraakontwikkeling van kinderen en de invloed van auditieve feedback hierop, wordt de overstap gemaakt naar de spraakperceptie waarbij onderscheid wordt gemaakt naar auditieve perceptie (zowel van zelfgeproduceerde spraak als van spraak geproduceerd door anderen) en visuele perceptie. Dit onderscheid geeft een indruk van factoren die naast auditieve feedback een invloed hebben op spraakproductie en de ontwikkeling hiervan. Na de bespreking van productie en perceptie afzonderlijk, wordt de link tussen spraakproductie en perceptie, zoals die tot uiting komt in imitatie, bekeken. Hierbij zal met name ingegaan worden op de manier waarop imitatie een voor spraakmotorische controle zeer belangrijke link vormt tussen spraakperceptie en -productie. Vroege spraakproductie Brabbelen en auditieve feedback Omdat het DIVA model er van uitgaat dat de parameters voor de akoestisch-articulatorische mapping geleerd worden tijdens brabbelen, zal in dit artikel uitgebreid aandacht worden besteed aan brabbelen als onderdeel van de normale spraakontwikkeling. Aangezien in een voorgaand artikel aan de orde is geweest hoe belangrijk auditieve feedback in het DIVA model is voor het vestigen van een intern model tijdens de brabbelfase, zal nu besproken worden welke rol auditieve feedback speelt in de ontwikkeling van brabbelen bij kinderen. Over het algemeen neemt men aan dat de beschikbaarheid van auditieve feedback met betrekking tot spraakproductie bijzonder belangrijk is voor de ontwikkeling van normale spraak bij kinderen (ondere andere Oller & Eilers, 1988). Een manier om de rol van auditieve feedback in de ontwikkeling van de spraakproductie van kinderen te onderzoeken is door de vocale ontwikkeling van dove en horende kinderen met elkaar te vergelijken. Als dove kinderen op dezelfde manier en op dezelfde leeftijd brabbelen als hun horende leeftijdgenoten, dan suggereert dit dat mensen worden geboren met een fonetische aanleg die zich zonder uitgebreide ervaring ontplooit. Aan de andere kant, als vocalisaties van dove kinderen verschillen van die van horende kinderen, dan zou dit suggereren dat auditieve ervaring een belangrijke rol speelt in het tijdig ontstaan van spraakachtige klanken (Oller & Eilers, 1988). Voordat verschillen tussen de spraakproductie van dove en horende kinderen in het eerste jaar belicht worden, is het goed om te kijken naar hoe de “normale” ontwikkeling van spraakachtige klanken die tijdens het eerste levensjaar geproduceerd worden er uitziet. Oller en Eilers (1988) stelden een model op van de typen spraakachtige klanken die tijdens het eerste levensjaar (en met name tijdens de eerste zes maanden) geproduceerd worden. De fasen die in dit model worden beschreven geven een richt- DE ONTWIKKELING VAN SPRAAKMOTORISCHE CONTROLE II 85 lijn waartegen de mogelijke afwijkingen die tijdens de spraak-taalontwikkeling van een kind kunnen optreden kunnen worden afgezet (Oller et al., 1999). Ontwikkeling van brabbelen tijdens het eerste levensjaar Om het model van Oller en Eilers te begrijpen is het belangrijk om te vermelden dat vegetatieve klanken (hoesten, niezen, boeren, etcetera.) en huilgeluiden (waaronder huilen, lachen, zeuren, etcetera.) apart behandeld worden van de kritische klanken die specifieke voorlopers van spraak zijn, de zogenaamde protofonen. De fasen in de spraakontwikkeling zoals hier geformuleerd, verwijzen alleen naar de protofonen (Oller et al., 1999). De klanken die een kind produceert ontwikkelen zich systematisch en weerspiegelen, reeds voordat een kind een enkel woord kan zeggen, een groeiende spraakcapaciteit. De systematische aard van patronen in de vocale ontwikkeling van kinderen is vastgelegd in het model en hierin worden vier fasen erkend, te weten: 1. Fonatiefase 2. Primitieve articulatiefase (cooing) 3. Expansiefase 4. Canonische fase Tijdens de fonatiefase, (0-2 maanden), produceren kinderen zogenaamde “comfortgeluiden” met normale spraakachtige fonatie en deze voorbeelden van de eerste protofonen worden zeer frequent geproduceerd. Deze klanken worden ‘quasivowels’ genoemd omdat zij geproduceerd worden met normale fonatie, dat wil zeggen met de soort fonatie die voorkomt in spraakklanken en dan met name in klinkers (Oller & Eilers, 1988; Oller et al., 1999). Deze soort fonatie verschilt opmerkelijk van de soort fonatie die optreedt bij bijvoorbeeld huilen of lachen. De klanken die tijdens de fonatiefase gemaakt worden lijken voorlopers van klinkerproductie. Meer ingewikkelde spraakachtige klanken (bijvoorbeeld lettergrepen met zowel medeklinkers als klinkers) zijn tijdens deze fase zeldzaam (Oller & Eilers, 1988; Oller et al., 1999). Tijdens de primitieve articulatiefase, voorheen ook wel ‘cooing stage’ genoemd (Oller & Eilers, 1988), produceren kinderen (meestal op de leeftijd van 2-3 maanden) normale fonatie en bewegen tegelijkertijd het supraglottale deel van het aanzetstuk bij het produceren van protofonen (Oller et al., 1999). Met andere woorden, tijdens cooing beginnen kinderen tijdens het vocaliseren te articuleren. Articulatie is een vereist kenmerk van spraakklanken en deze articulaties zouden voorlopers van medeklinkers kunnen zijn maar zijn meestal geen goedgevormde, volwassen lettergrepige producties (Oller & Eilers, 1988). In de expansiefase (4-6 maanden) produceren zich normaal ontwikkelende kinderen een variëteit aan nieuwe klanktypen, waaronder volledig klinkerachtige klanken. Tijdens deze fase produceren kinderen allerlei variaties op het gebied van de fonatie om contrasten binnen klinkers te creëeren. Verder articuleren kinderen tijdens de expansiefase vanuit een gesloten aanzetstuk (een medeklinkeractige klank) naar een volle klinker terwijl zij normale fonatie produceren (Oller et al., 1999). Deze reeks van handelingen leidt tot de productie van een primitieve protofone lettergreep die 86 TESINK & MAASSEN ‘marginal babbling’ genoemd wordt. Er is slechts één belangrijk kenmerk van goedgevormde lettergrepen dat ontbreekt in ‘marginal’ brabbelen en dat is de snelle overgang van een medeklinkerachtig element naar een klinkerachtig element. Volwassen lettergrepen blijven in de expansiefase echter (nog) ongewoon (Oller & Eilers, 1988). De laatste fase vóór het betekenisvol spreken wordt gevormd door canonisch brabbelen (7-10 maanden). Tijdens de canonische fase begint de productie van goedgevormde lettergrepen, vaak in steeds herhaalde reeksen zoals [didi], [baba], [mamama], [dadada], of [bababa] (Oller & Eilers, 1988; Oller et al., 1999). Belangrijke voorwaarden die aanwezig moeten zijn om te kunnen spreken van canonisch brabbelen betreffen: (1) Er moeten goedgevormde lettergrepen geproduceerd worden; (2) Iedere canonische lettergreep moet tenminste een volledig klinkerachtig element hebben; (3) Iedere canonische lettergreep moet tenminste een medeklinkerachtig element bevatten; (4) Iedere canonische lettergreep moet tenminste één snelle formanttransitie tussen medeklinker en klinker bevatten (Oller et al., 1999). Het begin van canonisch brabbelen is kritiek omdat dit het punt aangeeft waarop kinderen fonetische reeksen van goedgevormde lettergrepen produceren die kunnen optreden als de fonetische bouwstenen van woorden (Oller & Eilers, 1988). Vanwege de overeenkomsten tussen canonisch brabbelen en vroege spraak is gesuggereerd dat een verlaat begin van canonisch brabbelen een voorspeller zou kunnen zijn van een vertraagde spraakproductie en tevens gebruikt zou kunnen worden als screening factor bij het identificeren van kinderen die een hoog risico lopen op spraak- en taalstoornissen (Kent, 2000; Oller & Eilers, 1988; Oller et al., 1999). Er is een aantal kenmerken van canonisch brabbelen dat, gegeven een verlaat begin ervan, zeer geschikt is als voorspeller van latere spraak-taalstoornissen. Zo heeft canonisch brabbelen net als andere motorische ontwikkelingen, zoals kruipen en lopen, een relatief scherp afgebakend begin voor normaal ontwikkelende kinderen. De gebruikelijke leeftijd waarop kinderen beginnen met canonisch brabbelen is gelijk aan die van kruipen en zitten, met een gemiddeld begin van rond de 6 maanden, waarbij bijna alle normaal horende kinderen op een leeftijd van 10 maanden de canonisch fase bereikt hebben (bijv. Eilers et al., 1993; Oller et al., 1999). Tevens is het begin van canonisch brabbelen zeer makkelijk te herkennen, ook door ouders (Oller et al., 1999). Voor een normaal verlopende ontwikkeling van spraakproductie is het extreem belangrijk gebleken dat normaal ontwikkelende kinderen niet later dan op de leeftijd van 10 maanden beginnen met canonisch brabbelen (Eilers et al., 1993). Tevens heeft onderzoek door Oller en collega’s bevestigd dat een verlaat begin van canonisch brabbelen een voorspeller kan zijn voor vertraging in het begin van de spraakproductie en risico op latere spraak-taalstoornissen in het algemeen (Oller et al., 1999). Hieronder zal door middel van vergelijken van brabbelen van horende en dove kinderen aan de orde komen of en op welke manier auditieve feedback een rol speelt bij het tot stand komen van canonisch brabbelen en hoe gehoorverlies dus mogelijk een risicofactor vormt voor een afwijkende ontwikkeling van de spraakproductie. DE ONTWIKKELING VAN SPRAAKMOTORISCHE CONTROLE II 87 Canonisch brabbelen van dove en horende kinderen In de literatuur waarin uitingen van dove en horende kinderen vergeleken worden, wordt de term “brabbelen” in minder stricte zin gebruikt om alle non-vegetatieve vocale categorieën tijdens vroege kindertijd te beschrijven, of het nu canonisch of precanonisch is. Wanneer de term brabbelen op deze manier gebruikt wordt dan betekent de verklaring dat dove kinderen hetzelfde brabbelen als horende kinderen niets anders dan dat de twee groepen enkele klanktypen gemeenschappelijk hebben (Oller & Eilers, 1988). Indien men specifiekere uitspraken wil doen over verschillen in spraakontwikkeling van dove en horende kinderen dan is het noodzakelijk dat bij het evalueren van verschillen in vocale ontwikkeling tussen dove en horende kinderen rekening gehouden wordt met het brede spectrum aan uitingen die kinderen tijden de vroege kinderjaren produceren. Van bijzonder belang zijn de soorten vocalisaties tijdens de vroege kindertijd die verschillende belangrijke kenmerken delen met volwassen spraak. In deze context, zijn “vegetatieve” klanken zoals huilen, hoesten, niezen en grommen dus relatief onbelangrijk (Oller & Eilers, 1988). Bovengenoemd onderscheid werd in acht genomen in het onderzoek van Oller & Eilers (1988) die in hun onderzoek vaststelden dat dove kinderen een aanzienlijke vertraging vertonen in het begin van canonisch brabbelen. Goedgevormde lettergreepproductie komt bij horende kinderen tot stand tijdens de eerste 10 maanden van het leven maar bij dove kinderen is dit niet het geval. Deze observatie wijst erop dat gehoor een belangrijke rol speelt bij de vocale ontwikkeling (Oller & Eilers, 1988). Dat de dove kinderen uit de onderzoekspopulatie überhaupt canonisch brabbelen produceerden is volgens Oller en Eilers (1988) mogelijk omdat zij door middel van restgehoor en visuele waarneming toch een manier hadden om de spraakklanken waar te nemen. Auditieve perceptie lijkt dus een belangrijke rol te spelen voor het op tijd beginnen van canonisch brabbelen alsook voor de manier waarop kinderen brabbelen. Koopmans-Van Beinum en collega’s (Koopmans-Van Beinum, Clement & Van den Dikkenberg-Pot, 2001) richtten zich op de vraag of en waar het gebrek aan auditieve perceptie (of spraakinput) kan worden opgespoord in de vroege klankproductie van dove kinderen. Meer in het bijzonder wilden zij weten waarom dove kinderen niet beginnen te brabbelen tijdens hun eerste levensjaar net zoals normaal horende kinderen dat doen. In hun analyse van uitingen die dove en horende kinderen tijdens de eerste 18 maanden van hun leven produceerden, besteedden zij afzonderlijk aandacht aan bewegingen van twee in spraak betrokken klankproductiesystemen, namelijk het systeem voor fonatie en het systeem voor articulatie. De resultaten lieten zien dat zowel het fonatie- als het articulatiesysteem zich bij dove kinderen op dezelfde manier ontwikkelden als bij horende kinderen en de ontwikkeling van de afzonderlijke systemen lijkt fysiologisch en neurologisch gestuurd. De belangrijkste verschillen tussen dove en horende kinderen kwamen echter naar voren wanneer de twee systemen gekoppeld moesten worden: dove en horende kinderen waren in staat om onderbroken en ononderbroken fonatie te produceren, maar alleen de groep horende kinderen was in staat om fonatie te combineren met articulatorische bewegingen 88 TESINK & MAASSEN (Koopmans-Van Beinum et al, 2001). Deze resultaten lijken uit te wijzen dat het combineren van fonatie met articulatie, dus eigenlijk de coördinatie van bewegingen van de twee verschillende klankproductiesystemen, een vaardigheid is die problemen veroorzaakt voor de dove kinderen (Koopmans-Van Beinum et al., 2001). Met andere woorden, de analyse van vroege uitingen van dove en horende kinderen onthulde dat auditieve perceptie en feedback nodig zijn voor de coördinatie van bewegingen van de fonatie- en articulatiesystemen, en dat dit vermogen tot coördinatie (en daarmee dus auditieve perceptie en feedback) een eerste vereiste is voor de ontwikkeling van canonisch brabbelen en daarmee voor normale spraakproductie (Koopmans-Van Beinum et al., 2001). Samengevat mogen we stellen dat de resultaten uit laatstgenoemde studie aanwijzingen vormen dat het produceren van canonisch brabbelen twee factoren vereist: (1) Een biologisch gestuurde ontwikkelingsvaardigheid om, aan articulatie gerelateerde, repetitieve, ritmische bewegingen te produceren; (2) De vaardigheid om correct de bewegingen van de twee bronnen van klankproductie (het fonatiesysteem en het articulatiesysteem) te coördineren. Dit laatste is een vaardigheid die een goed functionerend auditief perceptiesysteem of tenminste enige vorm van auditieve feedback vereist (Koopmans-Van Beinum et al., 2001). Canonisch brabbelen en vroege spraak Zoals hierboven besproken, ontwikkelt spraakproductie zich bij normaal horende kinderen op een sterk georganiseerde manier en moet canonisch brabbelen, aangezien het alle basiselementen van (volwassen) spraak bevat, beschouwd worden als een cruciale eerste ontwikkelingsfase richting volwassen spraakproductie (onder andere Davis & MacNeilage, 1995; Oller & Eilers, 1988; Koopmans-Van Beinum et al., 2001). Er is een sterke consensus dat de klanken en klankpatronen van brabbelen (712 maanden) en vroege spraak (12-18 maanden) in essentie hetzelfde zijn (zie Davis & MacNeilage, 1995; MacNeilage, Davis & Matyear, 1997). Ook klinkt prelinguaal brabbelen vaak opmerkelijk spraakachtig, niet alleen omdat er herkenbare woorden in zitten, maar omdat het een prosodie heeft die op die van volwassenen lijkt. Kinderen blijken tijdens de brabbelfase inderdaad in staat om de drie akoestische correlaten van klemtoon (frequentie van de grondtoon, intensiteit, duur) in individuele lettergrepen te gebruiken op een manier die sterk lijkt op die van volwassen sprekers (Davis et al., 2000). Ondanks dat brabbelende kinderen de drie prosodische variabelen voor beklemtoning van lettergrepen kunnen manipuleren, is de controle hierover nog niet helemaal gevestigd en komt variatie in de beklemtoning van lettergrepen tijdens deze periode nog veel voor (Davis et al., 2000). Er zijn derhalve aanwijzingen voor overeenkomsten in klankrepertoire en –patronen in eerste spraak en babbelen, maar het is voorbarig om te concluderen dat fonetische aspecten van eerste woorden in alle belangrijke opzichten gelijk zijn aan die van brabbelen (MacNeilage et al., 1997). MacNeilage en collega’s (1997) gingen een stap verder in het onderzoek naar deze overeenkomsten. Resultaten uit hun studie toonden drie uitzonderingen op de algemene conclusie dat de klanken en klankpatronen van eerste woorden hoofdzakelijk dezelfde zijn als bij brabbelen: (1) Bij drie van de vier DE ONTWIKKELING VAN SPRAAKMOTORISCHE CONTROLE II 89 kinderen was er een groter percentage labiale klanken in de eerste woorden dan in brabbelen; (2) Alle kinderen hadden de neiging om in eerste woorden relatief minder lettergreepparen te produceren waarin herhalingen voorkwamen dan in brabbelen. Dit lijkt volgens de auteurs een organisationele verandering in eerste woorden te weerspiegelen ten opzichten van de patronen tijdens brabbelen (MacNeilage et al., 1997); (3) Alle kinderen produceerden in de eerste woorden meer variatie in klinkers dan in brabbelen. Dit kan geïnterpreteerd worden als bewijs voor een belangrijke verandering in het fonetische repertoire tijdens vroege spraak (MacNeilage et al., 1997). Ondanks dat de drie uitzonderingen in klank en klankpatronen voor vroege spraak ten opzichte van brabbelen beschouwd moeten worden als belangrijke ontwikkelingen, kunnen deze veranderingen op een bepaalde manier beschouwd worden als relatief onbelangrijk omdat zij slechts de relatieve frequentie van klanken en klankpatronen betreffen en niet een geheel nieuwe fonetische ontwikkeling (MacNeilage et al., 1997). Er is dus geen reden om er aan te twijfelen dat de klanken en klankpatronen van vroege spraak in de meeste opzichten inderdaad nauw gerelateerd zijn aan die van brabbelen en volgens MacNeilage en collega’s (1997) kunnen de uitzonderingen gezien worden als bewijs voor de sterkte van het ‘Frame Dominance’ patroon (zie hieronder) en de problemen om daaraan te ontsnappen (MacNeilage et al., 1997). Aangezien aan de hand van het begrip ‘frame dominance’ uitspraken worden gedaan over (het ontstaan van) de motorische controle van spraak zal nu kort ingegaan worden op de ‘Frame/Content theory’ van MacNeilage (1998) waarin de seriële organisatie van spraak aan de orde komt. Brabbelen, vroege spraak en de Frame/Content theorie In de artikelen van MacNeilage, Davis en collega’s wordt bij het definiëren van brabbelen de nadruk gelegd op brabbelen als een ritmische afwisseling tussen een open en gesloten mond die gepaard gaat met fonatie (Davis & MacNeilage, 1995; MacNeilage, 1998; MacNeilage & Davis, 2001; MacNeilage et al., 2000). De prototypische brabbelepisode bestaat dan uit een herhaalde ritmische afwisseling van dezelfde open en gesloten mond configuraties, zoals in “bababa” (MacNeilage, 1998; MacNeilage & Davis, 2001; MacNeilage et al., 2000). De tijdens brabbelen en vroege spraak geproduceerde uitingen bestaan voornamelijk uit herhalingen van lettergrepen samengesteld uit afwisselingen tussen klinkers en medeklinkers. In termen van afwisseling van gesloten en open mond vereisen medeklinkers en klinkers tegengestelde bewegingen: de mond opent zich bij klinkers en sluit zich in variërende mate voor de omringende medeklinkers (MacNeilage, 1998; MacNeilage & Davis, 2001). De ’Frame/Content theory’ van de ontwikkeling van spraakproductie geeft een centrale rol aan deze ritmische afwisseling tussen medeklinker en klinker die zowel tijdens brabbelen als vroege spraak terug te vinden is (MacNeilage, 1998). De basale regelmatige op en neer beweging van de kaak die vanaf het begin van brabbelen aanwezig is, wordt in de F/C theorie het ‘frame’ voor spraak genoemd. De open-dicht afwisseling van de mond leidt tot klinker-medeklinker afwisseling die lettergrepen doet ontstaan (een enkele klinker vormt de kern van de lettergreep en medeklinkers 90 TESINK & MAASSEN vormen de grenzen van de lettergreep). De cyclus van kaakbeweging vormt dus de lettergreep en de open en gesloten fasen van de cyclus zijn de spraaksegmenten, respectievelijk klinkers en medeklinkers (MacNeilage, 1998; MacNeilage et al., 2000). De lettergrepige ‘frames’ en segmentele ‘content’ elementen worden in het spraakproductieproces afzonderlijk gecontroleerd (MacNeilage, 1998). Terwijl het frame, de regelmatige op en neer beweging van de kaak, aanwezig is vanaf het begin van brabbelen, ontwikkelen (segment-specifieke) content-elementen zich pas naarmate het kind tijdens spraakbewegingen onafhankelijke controle over de articulatoren verkrijgt. Frames domineren dus aanvankelijk over content elementen (Davis & MacNeilage, 1995). Onderzoek van Davis, MacNeilage en collega’s (onder andere Davis & MacNeilage, 1995) heeft laten zien dat het grootste deel van variatie in de articulatorische component van brabbelen (7-12 maanden) en daaropvolgende vroege spraak (12-18 maanden) toe te schrijven is aan de regelmatige op en neer beweging van de kaak, dat wil zeggen frame-gerelateerd is (MacNeilage, 1998). Het vermogen van de andere articulatoren (lippen, tong, zachte verhemelte) om hun positie van segment tot segment, of zelfs van lettergreep tot lettergreep, actief te variëren is hierbij extreem beperkt (wat een indicatie is voor beperkte content elementen). Davis en MacNeilage verwijzen naar deze observatie als ‘frame dominance’: veel van de patronen van brabbelen zijn een direct resultaat van de productie van lettergrepige frames (ritmische kaakbewegingen) die domineren en waarbij andere articulatoren, inclusief de tong, over beperkte vaardigheden beschikken om actieve intra- en interlettergrepige content-veranderingen te produceren (Davis & MacNeilage, 1995; MacNeilage, 1998; MacNeilage et al., 1997). Ondersteuning voor het idee van frame dominance voor de motorische controle van brabbelen en eerste woorden werd geleverd door tamelijk recent onderzoek naar brabbelen (Davis & MacNeilage, 1995) en vroege spraak (Davis et al., 1997; MacNeilage & Davis, 2000; MacNeilage & Davis, 2001; MacNeilage et al., 2000). Uit dit onderzoek kwamen namelijk drie bepaalde soorten medeklinker/klinker (consonant-vowel; CV) patronen naar voren die de voorkeur hebben tijdens brabbelen en vroege spraak en die allen een gebrek aan actieve tongbeweging bij de overgang van medeklinker naar klinker gemeenschappelijk hebben. Dit betreffen: (1) Coronale of ‘tong-voor’medeklinkers (bijvoorbeeld [t], [d], [n]) gaan samen met voorklinkers (bijvoorbeeld in het Engels ‘day’); (2) Dorsale of ‘tong-achter’-medeklinkers (bijvoorbeeld [k], [g]) met achterklinkers (bijvoorbeeld in het Engels ‘go’); (3) Labiale of ‘lip’-medeklinkers (bijvoorbeeld [p], [b], [m]) met centrale klinkers (bijvoorbeeld “ba”). Het laatste patroon van een labiale medeklinker en met een centrale klinker is mogelijk de eenvoudigste vorm van lettergreepproductie en wordt ook wel een ‘pure frame’ genoemd aangezien het geproduceerd kan worden door alleen een kaakbeweging zonder enige actieve beweging van tong of lippen (MacNeilage, 1998; MacNeilage & Davis, 2000; MacNeilage et al., 2000; MacNeilage et al., 1997). Het frame dominance concept verschaft een elementaire basis om precies te bepalen hoe een kind vooruitgaat in spraakverwerving na de brabbelfase (Davis & DE ONTWIKKELING VAN SPRAAKMOTORISCHE CONTROLE II 91 MacNeilage, 1995). Vooruitgang kan gedefinieerd worden in termen van de mate waarin het kind aan het ontsnappen is aan frame dominance (Davis & MacNeilage, 1995) en deze vooruitgang in de ontwikkeling van medeklinkerproductie verloopt van eenvoudige klanken tot klanken die meer vaardigheid vereisen (MacNeilage, 1998). Hierbij waarschuwen de auteurs dat de bewering dat frame dominance beperkingen motorisch van aard zijn niet impliceert dat perceptuele factoren geen rol spelen in de initiële vorm van brabbelen (Davis & MacNeilage, 1995). Zoals we in dit artikel bij onderzoek bij dove kinderen gezien hebben (Oller & Eilers, 1988) is auditieve ervaring noodzakelijk voor een normaal ontwikkelend brabbelpatroon. Echter, indien brabbelpatronen, tenminste in vroege fasen, in termen van klankvoorkeur uniform lijken te zijn over taalomgevingen, dan kan auditieve ervaring, die over talen verschilt, niet verantwoordelijk zijn voor de gelijkvormigheid van dergelijke patronen (Davis & MacNeilage, 1995). Hieruit volgt dat motorische beperkingen een sterkere invloed uitoefenen op klankpatronen geproduceerd tijdens vroege fasen van brabbelen dan perceptuele factoren (Davis & MacNeilage, 1995). Fonologische organisatie van vroege spraakproductie Hierboven is uitgebreid aan de orde gekomen dat de productie van eerste woorden niet radicaal verschilt van brabbelen, maar juist gebaseerd is op het brabbelrepertoire. Het brabbelrepertoire blijkt extreem beperkt en bestaat, volgens MacNeilage en Davis (2001), voornamelijk uit een kleine verzameling van CV voorkeuren (MacNeilage & Davis, 2001). MacNeilage en Davis beschrijven in hun artikelen de bijzondere status van de CV lettergreep. Zij noemen de CV lettergreep het enige universele type lettergreep in talen en hebben deze als het favoriete lettergreeptype bij brabbelen en vroege spraak geïdentificeerd (Davis & MacNeilage, 1995; MacNeilage, 1998; MacNeilage & Davis, 2001). Ondanks dat over het algemeen aangenomen wordt dat de CV lettergreep tijdens het begin van spraak veel vaker geproduceerd wordt dan enig ander type lettergreep en er vrij veel evidentie is dat de lettergreep, en in het bijzonder de CV lettergreep, een erg belangrijke rol speelt in vroege spraakproductie, lijkt het niet de eenheid te zijn op grond waarvan kinderen aanvankelijk hun spraak organiseren (Piske, 1997). Resultaten uit de studie van Piske (1997) suggereerden dat de organisatie van vroege spraakproductie (dat wil zeggen wanneer kinderen tussen de 7 en 13 maanden oud zijn) duidelijk niet gebaseerd is op een specifiek type lettergreep (zoals de CV lettergreep), maar eerder op verworven klankpatronen die verschillende typen lettergreepstructuur kunnen betreffen. Deze klankpatronen worden waarschijnlijk geconstrueerd op grond van de favoriete articulaties van een kind, dat wil zeggen die articulaties die het kind reeds vanaf een zeer vroege fase al op een tamelijk consistente manier kan controleren en coördineren, alsook op basis van de auditief meest opvallende kenmerken van volwassen woorden (Piske, 1997). Ondanks uiteenlopende bevindingen met betrekking tot de rol van de CV lettergreep, stellen zowel MacNeilage en Davis als Piske dat het brabbelrepertoire extreem beperkt is. De data uit de longitudinale studie van Piske (1997), waarin de vroege 92 TESINK & MAASSEN lexicale ontwikkeling van kinderen gevolgd werd, leveren bijvoorbeeld bewijs dat bij het begin van spraak de inventaris van articulatorische patronen die functioneren als de onderliggende organisationele eenheden beperkt is. Deze beperkte inventaris van articulatorische patronen bepaalt echter mogelijk wel de fonetische structuur van de grote meerderheid van de eerste woorden van een kind. Daarnaast viel bij het bestuderen van de fonologische organisatie van vroege spraak op dat kinderen bij voorkeur woorden verwerven die gemakkelijk geïntegreerd kunnen worden in een reeds bestaand gevestigd articulatorisch patroon. Het verwerven van nieuwe woorden betreft op deze manier de combinatie van vroege patronen met componenten van andere patronen of de combinatie van patronen met totaal nieuwe elementen. Verder zullen naarmate de neuromotorische vaardigheden van een kind rijpen nieuwe patronen gecreëerd worden en tegelijkertijd zullen de vroege of oorspronkelijke patronen veranderd of uitgebreid worden zodat de verwerving van nieuwe en meer complexe woorden continu vergemakkelijkt wordt (Piske, 1997). Het voortbouwen op eerdere spraakproductievaardigheden zoals naar voren komt uit de frame/content theorie van MacNeilage (1998) en het onderzoek naar de organisatie van vroege spraak door Piske (1997) onderstreept het belang van consistentie van medeklinkervocalisaties in brabbelen en vroege spraak als een voorspeller voor latere fonologische ontwikkeling. McCune en Vihman (2001) volgden kinderen van de leeftijd van 9 tot 16 maanden en onderzochten hun niveau van consistentie in het produceren van klankpatronen in verhouding tot hun lexicale productie. Zij bepaalden hiertoe de samenhang tussen verwerving en groei van woordenschat (als maat voor lexicale productie) en de consistentie in geproduceerde klankpatronen (als indicatie voor fonetische ontwikkeling). Bevindingen uit de studie van McCune en Vihman (2001) laten een nauwe samenhang zien tussen vooruitgang in fonetische ontwikkeling en verwerving van het lexicon, waarbij productieve vaardigheden essentieel blijken voor het vestigen van een lexicon. Naarmate zij hun lexicon beginnen uit te breiden, bouwen kinderen hierbij waarschijnlijk voort op meer geautomatiseerde productievaardigheden, zowel voor medeklinkers als klinkers, wat resulteert in meer complexe patronen in woordproductie (McCune & Vihman, 2001). Vroege spraakperceptie Kinderen beginnen al tijdens de eerste maanden van hun leven met verwerven van hun moedertaal. Hierbij loopt perceptie voor op productie, vanwege beperkingen in neuromotorische rijpheid die kinderen tijdens de ontwikkeling van spraakproductie ondervinden. De vroege ontwikkeling van perceptie wordt weerspiegeld in het patroon van hersenactiviteit (zoals bepaald aan de hand van fMRI) wanneer kinderen van 3 maanden oud naar normale en achterwaarts afgespeelde spraak luisteren. Net zoals bij volwassenen, activeert luisteren naar spraak bij deze kinderen een groot deel van de DE ONTWIKKELING VAN SPRAAKMOTORISCHE CONTROLE II 93 temporaalkwab en zijn de hersengebieden die taalverwerking op deze jonge leeftijd ondersteunen links gelateraliseerd. Het lijkt dus zo te zijn dat voorlopers van volwassen corticale taalgebieden bij kinderen reeds actief zijn op de leeftijd van 3 maanden, dus ruim voor het begin van spraakproductie (Dehaene-Lambertz, Dehaene & HertzPannier, 2000). Het gegeven dat spraakperceptie eerder toegankelijk is dan spraakproductie doet vermoeden dat perceptie het tot stand komen van motorische controle van spraakproductie ondersteunt. In het DIVA model dat in het voorgaande artikel besproken werd, werd een belangrijke rol toegekend aan auditieve perceptie en feedback bij de motorische controle van spraak. Data over brabbelen voegden hieraan toe dat auditieve perceptie een cruciale rol lijkt te spelen voor een normale ontwikkeling van brabbelen. Zoals data van postlinguaal doof geworden sprekers ons dingen leren over het handhaven van adequate spraak zonder auditieve perceptie en feedback, zo kunnen data van jonge prelinguaal dove kinderen ons informatie geven over de rol van auditieve feedback en perceptie bij het ontwikkelen van motorische controle van spraakproductie. Het is belangrijk om te beseffen dat niet alleen gehoorverlies, maar ook de mate van gehoorverlies een belangrijke invloed uitoefent op de mate waarin spraak- en taalstoornissen optreden, eveneens in een populatie kinderen die gediagnosticeerd zijn als vertraagd in spraak- en taalontwikkeling (Schönweiler, Ptok & Radü, 1998). Hieronder wordt ingegaan op verschillende onderzoeken die dit gegeven nader hebben onderzocht. In het onderzoek van Schönweiler e.a. (1998) werd gevonden dat binnen een groep spraak- taalvertraagde kinderen (1528 kinderen met een gemiddelde leeftijd van 4 jaar en 9 maanden) degenen met bijkomend gehoorverlies significant slechtere spraaktaalfuncties vertonen dan spraak-taalvertraagde kinderen met normaal gehoor. Indien onderscheid werd gemaakt tussen kinderen met ernstig gehoorverlies en kinderen met een mild gehoorverlies dan leek de eerste groep meer aangedaan dan de laatste, maar het verschil tussen de groepen was niet significant. Deze resultaten impliceren dat gehoorverlies beschouwd kan worden als een belangrijke risicofactor voor spraaktaalstoornissen (Schönweiler et al., 1998). Kinderen die een cochleaire implant hebben gekregen bieden extra mogelijkheden voor het onderzoeken van de invloed van auditieve perceptie op de spraakontwikkeling aangezien het bij deze populatie mogelijk is om de spraak voor en na de aanwezigheid van auditieve feedback te evalueren. De studie van Richter en collega’s (Richter, Eissele, Laszig & Löhle, 2002), die de spraakontwikkeling onderzochten van kinderen die tenminste twee jaar gehoorervaring met cochleaire implant hadden (gemiddelde leeftijd op het tijdstip van implantatie was 61.3 maanden), toonde bij het vergelijken van pre- en postoperatieve data statistisch significante verschillen. Twee jaar na het verkrijgen van een cochleaire implant werden er duidelijke verbeteringen in functioneel gehoor, alsook in zowel spraakperceptie als –productie vastgesteld. Sommige kinderen bereikten (postoperatief) een voor hun leeftijd normaal niveau van spraakontwikkeling, hoewel de meeste kinderen in vergelijking met de norm een spraakontwikkelingsstoornis hadden. Het niveau van spraakproductie dat met het 94 TESINK & MAASSEN cochleaire implant bereikt werd was afhankelijk van spraakproductie voor implantatie en bijkomende handicaps, maar de leeftijd op het tijdstip van implantatie bleek de belangrijkste voorspeller voor het verloop van de spraakproductie (Richter et al., 2002). De invloed van leeftijd van implantatie op productieve vaardigheden kwam ook naar voren uit het onderzoek van O’Halphin (2001) dat uitwijst dat veel jong geïmplanteerde kinderen verbeterde auditieve vaardigheden en een betere controle van de grondtoon (F0) ontwikkelen, terwijl sommige op een latere leeftijd geïmplanteerde kinderen bij de controle van de intonatie en F0 van zelfgeproduceerde spraak visuele cues nodig hebben die feedback verschaffen over deze productieparameters (O’Halpin, 2001). Voor de controle van akoestische parameters van spraak, zoals de F0 en de eerste drie boventonen hiervan (formanten), is het belangrijk gebleken dat kinderen voor hun vierde jaar een cochleaire implant krijgen (Seifert, Oswald, Bruns, Vischer, Kompis & Haeusler, 2002). Prelinguaal dove kinderen die voor hun vierde jaar een cochleaire implant krijgen, verkrijgen in vergelijking met leeftijdgenootjes een normale akoestische controle over hun spraak (onder andere over de grondtoonfrequentie) en betere articulatorische vaardigheden dan kinderen die op het tijdstip van implantatie ouder zijn (Seifert et al., 2002). Bovenstaande data suggereren dat de auditieve perceptie en feedback, die door het gebruik van een cochleaire implant mogelijk worden gemaakt, de spraakmotorische controle verbetert. De bevindingen dat implantatie op jonge leeftijd samenhangt met een hoger niveau van spraakproductie geeft aan dat met name vroege spraakwaarneming belangrijk is voor het tot stand komen van een goede spraakmotorische controle. Daarom zal nu aandacht worden besteed aan de vroege spraakwaarneming van kinderen en de manier waarop zij uit spraak de kenmerken halen die zij nodig hebben om uiteindelijk tot spraakproductie te komen. Leerstrategieën bij taalverwerving Kuhl (2000) beschrijft in haar artikel het taalverwervingsproces als een perceptueel leerproces waarbij taalinput tijdens het eerste levensjaar (nog voordat het kind kan spreken) gedetailleerd door het brein in kaart wordt gebracht. Deze manier om naar taalverwerving te kijken brengt volgens Kuhl nieuwe leerstrategieën met zich mee waarvan eerdere theorieën niet verwacht hadden dat kinderen in staat zouden zijn om ze te gebruiken. Drie belangrijke voorbeelden van leerstrategieën tijdens taalverwerving: 1. Het tijdens blootstelling aan taal detecteren van patronen in taalinput, met andere woorden, patroonherkenning. 2. Het tijdens blootstelling aan taal oppikken van statistische eigenschappen van de taalinput. 3. Als gevolg van ervaring met luisteren naar de moedertaal verandert de spraakperceptie van het kind ten dienste van vooruitgang in de taalverwerving. Hieronder worden deze vormen van leren kort toegelicht. DE ONTWIKKELING VAN SPRAAKMOTORISCHE CONTROLE II 95 Herkenning van abstracte patronen Een belangrijke vereiste van taalverwerking is de detectie van overeenkomsten, ofwel patronen in taalinput. Kinderen vertonen uitstekende vaardigheden als het gaat om patroonherkenning in spraak. Op de leeftijd van 9 maanden detecteren kinderen bijvoorbeeld patronen gerelateerd aan de volgorde van fonemen die in hun moedertaal toegestaan zijn. Op deze leeftijd herkennen de kinderen niet de woorden zelf, maar herkennen ze de perceptuele patronen die kenmerkend zijn voor woorden in hun taal (Kuhl, 2000). De detectie van patronen door kinderen is niet beperkt tot fonetische eenheden, maar omvat ook meer globale prosodische patronen die taal bevat. Het soort leren dat Kuhl hier beschrijft wordt vermoedelijk ook gebruikt bij het segmenteren van spraak zoals eerder besproken. Gebruik van statistische eigenschappen in taalinput Wanneer kinderen hun moedertaal leren dan doen ze dit door te luisteren naar spraak voordat zij de woorden of het grammaticale systeem van die taal kennen en zonder expliciete instructies te hebben ontvangen. Zoals bij het segmenteren van woorden is genoemd, zijn kinderen van 8 maanden oud in staat om woordgrenzen te identificeren door te bepalen op welke plaats twee lettergrepen aan elkaar grenzen die zelden na elkaar voorkomen (Saffran et al., 1996a; Saffran, Newport & Aslin, 1996b). Dus kinderen kunnen de statistische eigenschappen van taal detecteren en tevens uitbuiten om zo, nog voordat zij de betekenis van woorden kennen, woorden in spraak te vinden (Jusczyk, 1999; Kuhl, 2000; Saffran et al., 1996a). Hoewel dit onderzoek bevestigt dat statistische informatie gebruikt wordt in taalverwerving, moet nog nader bekeken worden op welke manier dit gebeurt. Onderzoek van Peña en collega’s (2002) suggereert dat er wellicht onderscheid gemaakt moet worden tussen statistische processen (gebaseerd op frequentie en verdeling van elementen in taal) en grammaticale processen (bijvoorbeeld leren en gebruiken van regels). Hierbij lijkt het vermogen om statistische informatie te gebruiken voor taalverwerving beperkt tot de segmentatie van spraak in componenten, wat met zich meebrengt dat statistisch leren beperkt blijft tot eenvoudigere problemen zoals het leren van de klanken van een taal en bouwen van een lexicon. De ontdekking van het grammaticale systeem van een taal vereist daarentegen meer ingewikkelde niet-statistische procedures (Peña et al., 2002; Seidenberg, MacDonald & Saffran, 2002). Taalervaring beïnvloedt perceptie Ervaring met een taal produceert niet alleen een verandering in vaardigheden van kinderen om klanken van elkaar te onderscheiden, maar resulteert ook in een mapping die perceptie verandert (Kuhl, 2000). Een onderzoeksbevinding die dit laat zien is het zogenaamde ‘perceptual magnet effect’, het verschijnsel dat spraakklanken worden waargenomen in fonetische categorieën (zie Kuhl, 2000). Hoewel het niet wordt genoemd in de beschrijving van leerstrategieën in het artikel van Kuhl, is er nog een andere hypothese die uitspraken doet over hoe perceptuele 96 TESINK & MAASSEN strategieën kunnen veranderen naarmate kinderen meer ervaring krijgen met de moedertaal en deze wordt de ‘developmental weighting shift’ (DWS) hypothese genoemd (Nittrouer, 2002). Om de fonetische structuur te begrijpen van de taal die ze aan het verwerven zijn moeten kinderen leren welke informatie in het signaal toegang verschaft tot de fonetische structuur van hun moedertaal. De DWS hypothese suggereert dat de aspecten van het spraaksignaal die voor het kind relevante informatie verschaffen, ofwel aspecten die “zwaar gewogen” worden of veel aandacht krijgen, veranderen naarmate kinderen meer ervaring krijgen met luisteren en spreken van hun moedertaal (Nittrouer, 2002; Nittrouer et al., 2000). De DWS hypothese stelt dat jonge kinderen aanvankelijk hun perceptuele aandacht richten op algemene beweging van het aanzetstuk, zoals overgebracht door frequenties van formanten. Deze perceptuele strategie zou tegemoetkomen aan behoeften van onervaren taalgebruikers die net de grondbeginselen aan het leren zijn van hoe ze hun eigen aanzetstuk moeten bewegen om tot communicatie te komen. Naarmate kinderen meer ervaring krijgen met hun moedertaal verschuift hun perceptuele aandacht (ofwel ‘weight’) geleidelijk naar eigenschappen van het akoestische signaal die het meest informatief zijn met betrekking tot de fonetische structuur. Met toenemende ervaring met de moedertaal leren kinderen dus welke eigenschappen van het spraaksignaal voor hen relevante informatie verschaffen en zullen vervolgens hierop tijdens spraakperceptie hun aandacht richten. Tenminste één aspect van deze verschuiving van aandacht tijdens de ontwikkeling houdt in dat in toenemende mate gewicht wordt toegekend aan akoestische eigenschappen van het spraaksignaal die informatie verschaffen over details van spraakproductie, zoals de precieze vorm van constricties bij de productie van medeklinkers. Deze perceptuele strategie helpt het kind dus niet alleen om de fonetische structuur van de taal te leren, maar ook om zijn/haar eigen productie te verfijnen (Nittrouer, 2002). Perceptie van zelfgeproduceerde spraak Bij het verwerven van een taal is niet alleen het horen van spraak van anderen belangrijk, maar ook het waarnemen van zelfgeproduceerde spraak (Kuhl, 2000). Als kinderen de auditieve kenmerken leren die het meest belangrijk zijn voor het systeem van spraakklanken in hun moedertaal, dan zouden zij deze kennis ook kunnen ontwikkelen voor het waarnemen van hun eigen spraakmotorische output. Tijdens de ontwikkeling kan het ontstaan van een systeem om de auditieve representatie van zelfgeproduceerde spraak waar te nemen achterlopen op de ontwikkeling om de spraak van anderen waar te nemen (Ludlow, 1998). Dit kan tijdens de spraak-taalontwikkeling resulteren in enige verschillen tussen het perceptueel onderscheiden van andermans spraakcontrast en de interne representatie voor het monitoren van de eigen spraakproductie. Bij een vloeiend sprekende volwassene mag verwacht worden dat de interne representatie van zijn/haar eigen spraak sterk overeenkomt met de perceptie van de spraak van een andere spreker van zijn/haar moedertaal (Kuhl & Meltzoff, 1996). Het spreekt voor zich dat auditieve feedback een belangrijke rol speelt in de ontwikkeling van een perceptuele representatie van zelfgeproduceerde spraak die gebruikt kan worden voor het monitoren van de spraakoutput (Ludlow, 1998). DE ONTWIKKELING VAN SPRAAKMOTORISCHE CONTROLE II 97 Visuele perceptie van spraak en audiovisuele integratie Aangezien kinderen tijdens hun interactie met sprekers (bijvoorbeeld verzorgers, broertjes en zusjes) de spreker vaak niet alleen horen, maar ook zien spreken, kan bij spraakperceptie fonetische informatie zowel visueel als auditief verkregen worden. Dit gegeven roept de vraag op hoe de auditieve en visuele componenten van een sprekende mond afzonderlijk danwel gezamenlijk bijdragen aan vroege spraakperceptie (Lewkowicz, 2000). Omdat visuele perceptie van spraak een belangrijke rol lijkt te spelen bij imitatie van spraak, een aspect van spraakontwikkeling dat later aan de orde komt, zal hier nu kort ingegaan worden op de visuele perceptie van spraak en de audiovisuele integratie die hierbij optreedt. Studies bij volwassenen laten zien dat luisteraars tijdens spraakperceptie in hun oordeel over wat zij horen meer aspecten van spraak meenemen dan alleen auditieve informatie (Kuhl, Williams & Meltzoff, 1991). Zo kan visuele informatie verschaft door de mondbewegingen van de spreker de spraakperceptie van volwassenen sterk beïnvloeden (Green & Kuhl, 1989; MacDonald & McGurk, 1978; McGurk & MacDonald, 1976). Dit wijst erop dat tijdens fonetische perceptie de visuele informatie van het gezicht van een spreker geïntegreerd wordt met auditieve informatie (Green & Kuhl, 1991), een fenomeen dat bekend staat als het McGurk effect. In een klassieke studie lieten McGurk en MacDonald (1976) zien dat auditieve waarneming van een lettergreep veranderd kan worden door een incongruente visuele lettergreep. Om het McGurk effect te verkrijgen worden auditieve lettergrepen synchroon aangeboden met discrepante visuele lettergrepen. De nagesynchroniseerde lettergrepen worden aangeboden aan proefpersonen die gevraagd worden om te rapporteren wat zij horen. De meeste proefpersonen rapporteren dat zij een lettergreep horen die op een bepaalde manier beïnvloed is door de visueel aangeboden lettergreep, zodat er of visuele dominantie is (bijvoorbeeld audio /ba/-visueel /va/ wordt gehoord als “va” of een vermenging van de auditieve en visuele lettergrepen (bijvoorbeeld audio /ba/visueel /ga/ wordt gehoord als “da” of “tha”). Proefpersonen die aan deze experimenten deelnemen zijn zich meestal niet bewust van de audiovisuele discrepantie in de stimuli en dit suggereert een automatische integratie van audiovisuele informatie (zie onder andere Lewkowicz, 2000). Het McGurk effect is erg robuust en is gevonden bij proefpersonen van verschillende leeftijden (MacDonald & McGurk, 1978). Ook bij kinderen van 5 maanden oud werd bewijs gevonden voor een McGurk-achtig effect (Rosenblum, Schmuckler & Johnson, 1997). Dit suggereert dat reeds in de prelinguale periode het vermogen aanwezig is om audiovisuele spraak te integreren en spraakperceptie al vanaf een zeer vroeg ontwikkelingsstadium beïnvloed wordt door zowel auditieve als visuele informatie (Rosenblum et al., 1997). Het is aangetoond dat dit vermogen om auditief-visuele overeenkomsten in spraak te detecteren al op jonge leeftijd aanwezig is, hoewel het bij kinderen zwakker is ontwikkeld dan bij volwassenen (Kuhl et al., 1991). Er lijkt sprake van een geleidelijke ontwikkeling van audiovisuele integratie. Kinderen lijken bij de perceptie van lettergrepen eerst (dat wil zeggen op een leeftijd van 4 maanden) alleen aandacht te hebben voor auditieve kenmerken van spraak, vervolgens (rond de leeftijd van 6 maanden) 98 TESINK & MAASSEN zijn zij in staat zijn om aandacht te schenken aan de visuele kenmerken van spraak en in een latere fase (rond de leeftijd van 8 maanden) zijn zij in staat om auditieve en visuele kenmerken van spraak tegelijkertijd waar te nemen (Lewkowicz, 2000). Visuele spraakperceptie en de (revised) motor theory Na de korte uiteenzetting in de vorige paragraaf over automatische integratie van auditieve en visuele perceptie zal nu kort worden ingaan op de manier waarop visuele informatie afzonderlijk de perceptie van spraak beïnvloedt. Een invloedrijke motorische verklaring van visuele spraakverwerking betreft de ‘(revised) motor theory of speech perception’ (Liberman & Mattingly, 1985). De motorische theorie van spraakperceptie gebruikt motorische controlestructuren om spraakperceptie te verklaren en beweert dat de objecten van spraakperceptie de geplande fonetische gestures van de spreker zijn. Spraakgestures zijn in het brein gerepresenteerd als motorische controle structuren en de motorische controle structuur voor een gesture vormt de articulatoren voor de productie van fonetische gestures. Volgens de theorie kunnen zowel visuele als auditieve informatiebronnen informatie verschaffen over een speech gesture. De perceptie van zichtbare of visuele spraak volgt het algemene principe van de motorische theorie dat stelt dat spraakperceptie de extractie van informatie over geplande activiteit van het aanzetstuk betreft. Hieruit kan afgeleid worden dat indien zichtbare spraak inderdaad geanalyseerd wordt door perceptueel-motorische structuren, zoals de motorische theorie beweert, visuele informatie over activiteit van het aanzetstuk (verkregen door het kijken naar de mond van de spreker) zou moeten leiden tot activatie van de motorische controlestructuren die worden gebruikt in spraakproductie (Kerzel & Bekkering, 2000). Uit deze redenering komt naar voren dat de eenheden die gebruikt worden in spraakperceptie de bewegingen van de articulatoren in spraakproductie sturen. Spraakproductie en –perceptie zijn de motorische theorie nauw aan elkaar gerelateerd (Kerzel & Bekkering, 2000; zie Liberman & Whalen, 2000 voor een overzicht). In het onderzoek van Kerzel en Bekkering (2000) werd bevestiging gevonden voor het idee dat gestures belangrijke eenheden in spraakperceptie vormen. Verder verschaften de resultaten sterke ondersteuning voor een link tussen perceptie en actie bij de verwerking van visuele spraak zoals in de motorische theorie van spraakperceptie is voorgesteld (Liberman & Mattingly, 1985). Hoewel in de vorige alinea alleen gesproken wordt over visuele spraakinput, suggereren bevindingen uit onderzoek dat auditieve en visuele input niet afzonderlijk verwerkt worden, maar in een vroeg stadium geïntegreerd worden, waarschijnlijk nog voordat fonetische classificatie plaatsvindt (Möttönen et al., 2002). Als visuele spraak niet fonetisch geanalyseerd wordt voordat integratie met akoestische spraak plaatsvindt, dan komt de vraag naar voren hoe het op het niveau van integratie gerepresenteerd wordt (Möttönen et al., 2002). Er is gesuggereerd dat, nog voordat integratie met akoestische spraak plaatsvindt, visuele input omgezet wordt in motorische representaties (gestures) (Möttönen et al, 2002). De ideeën van een speech gesture als belangrijke eenheid voor perceptie en een DE ONTWIKKELING VAN SPRAAKMOTORISCHE CONTROLE II 99 nauwe link tussen perceptie en productie komen ook terug in theorieën over imitatie. Aangezien imitatie vaak genoemd wordt als de link tussen perceptie en productie waarbij auditieve, visuele en motorische informatie aan elkaar gekoppeld worden (Kuhl, 2000; Wilson, 2001) en verondersteld wordt dat imitatie een belangrijk leermechanisme is tijdens taalverwerving (o.a. Wilson, 2001), zal tenslotte nog kort een gangbare theorie over de rol van imitatie in spraakontwikkeling besproken worden. Imitatie Van imitatie van spraakpatronen die door anderen geproduceerd worden, wordt verondersteld dat het voor een kind een vereiste is om uiteindelijk tot de volwassen spraakproductie te komen (Kuhl, 2000). Voor het optreden van imitatie is het noodzakelijk dat luisteraar en spreker “in dezelfde code communiceren”, dat wil zeggen dat de fonetische representaties in het brein van de ene partij gerepliceerd wordt in het brein van de ander zodat de een (het kind, ofwel de luisteraar) de handeling van de spreker herkent (Liberman & Whalen, 2000). Indien uitgegaan wordt van de in de vorige paragraaf besproken motorische theorie van spraakperceptie dan kan gesteld worden dat de elementen van spraak fonetisch betekenisvolle articulatorische gestures zijn, wat betekent dat dezelfde eenheden die worden gebruikt in spraakperceptie ook de bewegingen van de articulatoren in spraakproductie sturen (Liberman & Mattingly, 1985; Liberman & Whalen, 2000; Kerzel & Bekkering, 2000). Ofwel, de articulatorische gesture die de eenheid van productie is voor de spreker, is de eenheid van perceptie voor de luisteraar, waardoor de representaties voor spreker en luisteraar precies dezelfde zijn (Liberman & Whalen, 2000). Toegepast op imiteerbare stimuli, in dit geval lettergrepen, houdt dit in dat imiteerbare stimuli worden waargenomen in termen van articulatorische gestures, dat wil zeggen door het onttrekken van hun motorische representaties (Kerzel & Bekkering, 2000; Wilson, 2001). Rizzolatti en Arbib (1998) postuleren op grond van hun onderzoek bij apen het bestaan van een ‘observation/execution matching systeem’ (OEMS), ook wel ‘mirror system’ genoemd, dat een algemene theorie verschaft die imitatieverschijnselen verklaart (Miklósi, 1999) en eveneens van toepassing is op de evolutie van een neuraal substraat dat taalvermogen in mensen bevordert. In de betreffende studies bij apen werd gevonden dat het rostrale deel van de ventrale premotore cortex (area F5) in de aap neuronen bevat die ontladen wanneer de aap objecten grijpt of manipuleert en ook wanneer hij de proefleider soortgelijke handelingen ziet uitvoeren (Rizzolatti & Arbib, 1998). Dit systeem in het premotore gebied van het apenbrein (ofwel de mirror neuronen in dat gebied) is in staat om de motorische handelingen van een ander individu te herkennen en gebruikt de informatie die hieruit resulteert om overeenkomstige handelingen uit te voeren (Miklósi, 1999; Rizzolatti & Arbib, 1998). De functie van mirror neuronen is dat hun activatie een representatie van een handeling weergeeft. Deze representatie kan gebruikt worden om (motorische) handelingen te imiteren en om ze te begrijpen. Anders verwoord, de functie van mirror 100 TESINK & MAASSEN neuronen betreft het mentaal simuleren van geobserveerde beweging en het doel van deze simulatie zou kunnen zijn het encoderen en begrijpen van het gedrag van soortgenoten (Rizzolatti & Arbib, 1998, 1999). Met begrijpen wordt bedoeld het herkennen dat een ander individu een handeling uitvoert, het onderscheiden van de geobserveerde handeling van andere handelingen, en het gebruiken van deze informatie om zelf gepast te handelen. Mirror neuronen representeren volgens dit standpunt de link tussen zender en ontvanger ofwel tussen spreker en luisteraar (Rizzolatti & Arbib, 1998, 1999). Het maakt voor de activatie van mirror neuronen geen verschil of een individu een handeling uitvoert of dat hij/zij een ander individu een handeling ziet uitvoeren, premotorische gebieden worden in beide gevallen geactiveerd (Rizzolatti & Arbib, 1998). Dit wijst uit dat mentale representaties van het waarnemen van handelingen sterk verbonden zijn met mentale representaties voor het uitvoeren van die betreffende handelingen (Wilson, 2001) en dat perceptie van een handeling een motorische of kinesthetische representatie van het zelf uitvoeren van die handeling activeert (Rizzolatti & Arbib, 1998, 1999). Onderzoek suggereert dat een mirror systeem voor herkenning van gestures ook bestaat in mensen en het premotore deel van de cortex dat bij apen het systeem bevat dat ‘action recognition’ en ‘action production’ linkt, is het homologe gebied van Broca bij de mens (Rizzolatti & Arbib, 1998). Het voorstel van Rizzolatti & Arbib (1998, 1999) is dat de ontwikkeling van het menselijke laterale spraakcircuit een gevolg is van het feit dat de voorloper van het gebied van Broca, vóór het ontstaan van spraak, uitgerust was met een mechanisme om handelingen uitgevoerd door anderen te herkennen (met andere woorden een mechanisme voor action recognition). Dit mechanisme was de onderliggende neurale voorwaarde voor de ontwikkeling van interindividuele communicatie en uiteindelijk van spraak. Bovenstaande geeft inzicht in de neurale basis van imitatie van spraak en verschaft tegelijkertijd een idee over hoe de link tussen spraakperceptie en -productie gelegen zou kunnen zijn in het waarnemen van dezelfde gestures of motorische representaties van handelingen. Deze link tussen spraakperceptie en -productie wordt zeer belangrijk geacht aangezien bij problemen in de ontwikkeling van een van beide de voortgang van de spraak-taalontwikkeling in het algemeen in het gedrang komt. Conclusie In dit literatuuroverzicht, bestaande uit twee artikelen, zijn de ontwikkeling van motorische controle van spraak en vele daaraan gerelateerde aspecten in beschouwing genomen. Aangezien spraakperceptie en -productie hand in hand gaan, is aan beide aandacht besteed, alsook aan de link tussen perceptie en productie. We zijn deze literatuurbespreking in het eerste artikel begonnen met de presentatie van een neuraal netwerk model van spraakmotorische controle: het DIVA model. Aan de hand van dit model is een aantal componenten van spraakmotorische controle alsmede de rol van DE ONTWIKKELING VAN SPRAAKMOTORISCHE CONTROLE II 101 auditieve feedback uitgewerkt. Empirische data van postlinguaal dove volwassenen leerden dat auditieve feedback van cruciaal belang is voor het verwerven en handhaven van een goede spraakkwaliteit. In de daaropvolgende sectie van het tweede artikel werd eerst het fenomeen brabbelen uitgebreid besproken, daar brabbelen voorgesteld is als een van de belangrijkste voorspellers voor een normale spraakontwikkeling (Oller & Eilers, 1988). Tijdens brabbelen krijgen kinderen als het ware steeds meer een idee van wat bewegingen van hun articulatoren akoestisch teweegbrengen. Kinderen breiden vervolgens hun repertoire aan uitingen uit door varianten te produceren van fonetische structuren die zij reeds beheersen. Verdere ondersteuning voor de belangrijke rol van auditieve feedback in het verwerven van spraak werd gevonden bij de analyse van vroege spraakproductie. Data van prelinguaal dove kinderen lieten zien dat auditieve feedback zeer belangrijk is voor het op tijd beginnen en normaal verlopen van de brabbelfase en daarmee voor de latere spraakproductie. Gezien de belangrijke rol van auditieve perceptie tijdens de vroege spraakontwikkeling (tijdens brabbelen) en de ontwikkeling en het handhaven van motorische controle, werd aandacht besteed aan hoe kinderen door middel van spraakperceptie zich fonetische structuren van hun taal eigen maken. Dit proces lijkt tamelijk passief te verlopen, in die zin dat een kind kennis over fonetische patronen uit zijn/haar moedertaal vooral afleidt door te luisteren naar spraak van volwassenen. Ondanks dat auditieve perceptie en feedback de belangrijkste rol lijken te spelen bij het tot stand komen van spraakmotorische controle, moet de invloed van visuele spraakperceptie niet onderschat worden, aangezien deze de auditieve waarneming kan veranderen. Bij de bespreking van visuele spraakperceptie kwam de articulatorische gesture als eenheid voor spraakperceptie naar voren. Deze fonetische gesture voor spraak bleek tevens een bruikbaar concept om uit te leggen hoe perceptie en productie (bijvoorbeeld door luisteraar en spreker tijdens imitatie) aan elkaar gelinkt zijn. De bruikbaarheid van het concept van articulatorische gesture bij het verklaren van zowel verschijnselen van visuele perceptie als van imitatie staat in contrast met de manier waarop het begrip in staat was om in het DIVA model de verwerving van spraakmotorische controle te verklaren. Hoewel auditieve representaties bij de controle van spraakbewegingen zoals beschreven in het DIVA model een beter alternatief leken dan articulatorische gestures, bleek het concept van articulatorische gestures voor spraak wel zeer bruikbaar bij het verklaren van verschijnselen van visuele perceptie van spraak alsook bij imitatie. Momenteel bestaat er voor zover wij weten geen conceptueel kader dat zowel auditieve als visuele feedback kan integreren bij de ontwikkeling van spraakmotorische controle. Zoals eerder werd opgemerkt, is de ontwikkeling van spraakmotorische controle een ingewikkeld proces waar veel factoren op inwerken en dat kinderen gezien deze complexiteit verbazingwekkend makkelijk verwerven. Hopelijk leiden ontwikkelingen zoals het DIVA model tot een beter inzicht in de vereiste kennis (cognitieve en perceptuele ervaringen) die een kind moet opdoen om te komen tot spraakmotorische controle. 102 TESINK & MAASSEN Summary In the first paper of this review the DIVA model of speech production (Guenther, 1994; 1995) played a key role in the discussion of speech motor control. Since the DIVA model presupposes that auditory feedback is extremely important for establishing an internal model of speech production during babbling, this paper addresses the role of auditory feedback in the development of babbling in infants. The availability of auditory feedback seems to be very important for canonical babbling, a crucial developmental phase towards adult speech. After an overview of early speech production, the influence of speech perception in the development of speech motor control is described. Furthermore, it is discussed how the (revised) motor theory of speech perception (Liberman & Mattingly, 1985) links speech perception and production as visible in imitation. Imitation is often mentioned as the link between perception and production and can therefore be seen as connecting auditory, visual and motor information. Imitation of speech patterns produced by others is assumed to be an important learning mechanism during language acquisition by infants and is regarded as a prerequisite for adult speech production. Referenties Davis, B. L., & MacNeilage, P. F. (1995). The articulatory basis of babbling. Journal of Speech and Hearing Research, 38, 1199-1211. Davis, B. L., MacNeilage, P. F., Matyear, C. L., & Powell, J. K. (2000). Prosodic correlates of stress in babbling: An acoustical study. Child Development, 71, 1258-1270. Dehaene-Lambertz, G., Dehaene, S., & Hertz-Pannier, L. (2002). Functional neuroimaging of speech perception in infants. Science, 298, 2013-2015. Eilers, R. E., Oller, D. K., Levine, S., Basinger, D., Lynch, M. P., & Urbano, R. (1993). The role of prematurity and socioeconomic status in the onset of canonical babbling in infants. Infant Behavior and Development, 16, 297-315. Green, P. K., & Kuhl, P. K. (1989). The role of visual information in the processing of place and manner features in speech perception. Perception & Psychophysics, 45, 34-42. Green, P. K., & Kuhl, P. K. (1991). Integral processing of visual place and auditory voicing information during phonetic perception. Journal of Experimental Psychology: Human Perception and Performance, 17, 278-288. Jusczyk, P. W. (1999). Narrowing the distance to language: One step at a time. Journal of Communication Disorders, 32, 207-222. Kent, R. D. (2000). Research on speech motor control and its disorders: A review and perspective. Journal of Communication Disorders, 33, 391-428. Kerzel, D., & Bekkering, H. (2000). Motor activation from visible speech: Evidence from stimulus response compatibility. Journal of Experimental Psychology: Human Perception and Performance, 26, 634-647. Koopmans-Van Beinum, F. J., Clement, C. J., Dikkenberg-Pot, I. van den. (2001). Babbling and the lack of auditory speech perception: A matter of coordination? Developmental Science, 4, 61-70. DE ONTWIKKELING VAN SPRAAKMOTORISCHE CONTROLE II 103 Kuhl, P. K. (2000). A new view of language acquisition. PNAS, 97, 11850-11857. Kuhl, P. K., & Meltzoff, A. N. (1996). Infant vocalizations in response to speech: Vocal imitation and developmental change. Journal of the Acoustical Society of America, 100, 24252438. Kuhl, P. K., Williams, K. A., & Meltzoff, A. N. (1991). Cross-modal speech perception in adults and infants using nonspeech auditory stimuli. Journal of Experimental Psychology: Human Perception and Performance, 17, 829-840. Lewkowicz, L. (2000). Infants’ perception of the audible, visible, and bimodal attributes of multimodal syllables. Child Development, 71, 1241-1257. Liberman, A. M., & Mattingly, I. G. (1985). The motor theory of speech perception revised. Cognition, 21, 1–36. Liberman, A. M., & Whalen, D. H. (2000). On the relation of speech to language. Trends in Cognitive Sciences, 4, 187-196. Ludlow, C. L., & Barac Cikoja, D. (1998). Is there a self-monitoring speech perception system? Journal of Communication Disorders,31, 5050-510. MacDonald, J., & McGurk, H. (1978). Visual influences on speech perception processes. Perception & Psychophysics, 24, 253-257. MacNeilage, P. F. (1998). The frame/content theory of evolution of speech production. Behavioral and Brain Sciences, 21, 499-546. MacNeilage, P. F., & Davis, B. L. (2000). On the origin of internal structure of word forms. Science, 288, 527-531. MacNeilage, P. F., & Davis, B. L. (2001). Motor mechanisms in speech ontogeny: phylogenetic, neurobiological and linguistic implications. Current Opinion in Neurobiology, 11, 696-700. MacNeilage, P. F., Davis, B. L., Kinney, A., & Matyear, C. L. (2000). The motor core of speech: A comparison of serial organization patterns in infants and languages. Child Development, 71, 153-163. MacNeilage, P. F., Davis, B. L., & Matyear, C. L. (1997). Babbling and first words: Phonetic similarities and differences. Speech Communication, 22, 269-277. McCune, L., & Vihman, M. M. (2001). Early phonetic and lexical development: A productivity approach. Journal of Speech and Hearing Research, 44, 670-684. McGurk, H., & MacDonald, J. (1976). Hearing lips and seeing voices. Nature, 264, 746-748. Miklósi, Á. (1999). From grasping to speech: imitation might provide a missing link. Trends in Neuroscience, 22, 151-152. Möttönen, R., Krause, C. M., Tiippana, K., & Sams, M. (2002). Processing of changes in visual speech in the human auditory cortex. Cognitive Brain Research, 13, 417-425. Nittrouer, S. (2002). Learning to perceive speech: How fircative perception changes, and how it stays the same. Journal of the Acoustical Society of America, 112, 711-719. Nittrouer, S., Miller, M. E., Crowther, C. S., & Manhart, M. J. (2000). The effect of segmental order on fricative labeling by children and adults. Perception and Psychophysics, 62, 266284. O’Halpin, R. (2001). Intonation issues in the speech of hearing impaired children: Analysis, transcription and remediation. Clinical Linguistics & Phonetics, 15, 529-550. Oller, D. K., & Eilers, R. E. (1988). The role of audition in infant babbling. Child Development, 59, 441-449. Oller, D. K., Eilers, R. E., Neal, A. R., & Schwartz, H. K. (1999). Precursors to speech in infancy: The prediction of speech and language disorders. Journal of Communication Disorders, 32, 223-245. 104 TESINK & MAASSEN Peña, M., Bonatti, L. L., Nespor, M., & Mehler, J. (2002). Signal-driven computations in speech processing. Science, 298, 604-607. Piske, T. (1997). Phonological organization in early speech production: Evidence for the importance of articulatory patterns. Speech Communication, 22, 279-295. Richter, B., Eissele, S., Laszig, R., & Löhle, E. (2002). Receptive and expressive language skills of 106 children with a minimum of 2 years’ experience in hearing with a cochlear implant. International Journal of Pediatric Otorhinolaryngology, 64, 111-125. Rizzolatti, G., & Arbib, M. A. (1998). Language within our grasp. Trends in Neuroscience, 21, 188-194. Rizzolatti, G., & Arbib, M. A. (1999). Reply. Trends in Neurosciences, 22, 152. Rosenblum, L. D., Schmuckler, M. A., & Johnson, J. A. (1997). The McGurk effect in infants. Perception and Psychophysics, 59, 347-357. Saffran, J. R., Aslin, R. N., & Newport, E. L. (1996a). Statistical learning by 8-month old infants. Science, 274, 1926-1928. Saffran, J. R., Newport, E. L., & Aslin, R. N. (1996b). Word segmentation: The role of distributional cues. Journal of Memory and Language, 35, 606-621. Schönweiler, R., Ptok, M., & Radü, H.-J. (1998). A cross-sectional study of speech- and language-abilities of children with normal hearing, mild fluctuating conductive hearing loss, or moderate to profound sensoneurinal hearing loss. International Journal of Pediatric Otorhinolaryngology, 44, 251-258. Seidenberg, M. S., MacDonald, M. C., & Saffran, J. R. (2002). Does grammar start where statistics stop? Science, 298, 553-554. Seifert, E., Oswald, M., Bruns, U., Vischer, M., Kompis, M., & Haeusler, R. (2002). Changes of voice and articulation in children with cochlear implants. International Journal of Pediatric Otorhinolaryngology, 66, 115-123. Wilson, M. (2001). Perceiving imitatible stimuli: Consequences of Isomorphism between input and output. Psychological Bulletin, 127, 543-553.