Woordenschatontwikkeling van jonge Marokkaanse kinderen in Nederland Inouk Boerma Doctoraalscriptie Taalwetenschap Universiteit van Amsterdam Taal-en spraakontwikkeling en –pathologie Juni 2005 1 Indeling 1. Inleiding 3 2. Woordenschatontwikkeling bij kinderen 7 2.1 Inleiding 7 2.2 Kwantitatieve gegevens 8 2.3 Fases 10 2.4 Eerste woorden 13 2.4.1 Referentieel versus expressief 20 2.5 Woordenschatspurt 23 2.6 Theorieën over woordenschatverwerving 26 2.7 Noun bias 31 2.8 Tweetalige taalverwerving 36 3. Tweetalige Lexilijst 40 3.1 Rescorla’s Language Development Survey 40 3.2 Validiteit en betrouwbaarheid van ouderrapportage 41 3.3 Lexilijst Nederlands 45 3.4 Tweetalige Lexilijst 48 3.4.1 Constructie Lexilijst Marokkaans-Arabisch/Nederlands 3.4.2 Problemen met de constructie van de Lexilijst Marokkaans- 3.4.3 48 Arabisch/Nederlands 50 Normering Lexilijst Marokkaans-Arabisch/Nederlands 50 3.5 Conclusie 4. Marokkaans-Arabisch 51 53 4.1 Ontstaan van het Marokkaans-Arabisch 53 4.2 De taalsituatie in Marokko 54 4.3 Marokkanen in Nederland 58 4.4 Karakteristieken van de taal 62 4.5 Vergelijking met het Nederlands 68 5. Methode 5.1 Proefpersonen 71 71 2 5.2 Verzamelen van gegevens 72 5.3 Materiaal 73 5.4 Procedure 77 6. Resultaten 6.1 Algemene resultaten 79 79 6.2 Woordenschatontwikkeling van Marokkaans-Arabisch-sprekende kinderen in Nederland 80 6.2.1 80 Samenhang tussen leeftijd, geslacht en scores op de Lexilijst 6.2.1.1 Leeftijd 80 6.2.1.2 Geslacht 86 6.2.2 Vergelijking met de eentalige Nederlandse groep 88 6.2.3 Conceptscore en totaalscore 90 6.3 De invloed van externe factoren op de scores op de Lexilijst 94 6.3.1 Lessen Nederlands 94 6.3.2 Moedertaal ouders 94 6.3.3 Thuistaal 95 6.3.4 Broers en zussen 97 6.4 Samenstelling van het vocabulaire 98 6.4.1 Rubrieken 98 6.4.2 Woordsoorten 100 7. Conclusie en discussie 119 7.1 Conclusie 119 7.2 Discussie 132 8. Referenties 134 Appendices Appendix 1 De eerste 50 geproduceerde woorden 145 Appendix 2 Woordenschatontwikkeling van Marokkaans-Arabisch-sprekende kinderen in Nederland 146 Appendix 3 De invloed van externe factoren op de scores op de Lexilijst 153 Appendix 4 Samenstelling van het vocabulaire 156 Appendix 5 Tweetalige Lexilijst Marokkaans-Arabisch/Nederlands 158 3 1. Inleiding Het onderwerp van deze scriptie is de tweetalige Lexilijst MarokkaansArabisch/Nederlands. Deze tweetalige Lexilijst is gebaseerd op de Lexilijst Nederlands. De Lexilijst Nederlands is in 1995 voor het eerst ontwikkeld door Liesbeth Schlichting en anderen. In 2002 is deze versie aangepast door Liesbeth Schlichting en Henk lutje Spelberg. De Lexilijst is een instrument voor het meten van de vroege taalontwikkeling, voor kinderen van 15 maanden tot 27 maanden. De lijst meet de productieve woordenschat van kinderen en werkt met behulp van ouderrapportage. De ouders kruisen op de Lexilijst aan welke woorden hun kind zegt. De woordenschatproductie blijkt een goede indicator te zijn voor de taalontwikkeling als geheel (Schlichting & lutje Spelberg, 2002). De lijst is ontwikkeld naar model van de Language Development Survey van Rescorla (1989). De Lexilijst Nederlands wordt bijvoorbeeld op consultatiebureaus gebruikt om te kijken of de taalontwikkeling van een kind normaal verloopt. Er zijn echter ook kinderen die niet de Nederlandse taal als moedertaal leren, maar een andere taal. De Lexilijst Nederlands is dan niet geschikt om als screeningsinstrument te gebruiken, aangezien deze alleen de Nederlandse woordenschat meet. De mogelijkheden die men heeft om de taalontwikkeling van jonge anderstalige kinderen te screenen zijn beperkt. Er blijkt grote behoefte te zijn aan een taalinstrument voor kinderen die niet het Nederlands als eerste taal hebben (Hoogsteder et al., 1999). Daarom heeft Stichting Studio Taalwetenschap, een stichting die zich bezig houdt met allerlei projecten op het gebied van de taalwetenschap, in samenwerking met Liesbeth Schlichting een project opgezet om de Lexilijst Nederlands te bewerken voor een aantal in Nederland veel gesproken talen. Het gaat dan om tweetalige lijsten, waarop de ouders ofwel het Nederlandse woord kunnen aankruisen, ofwel het woord in de andere taal, ofwel het woord in beide talen. Het gaat dus om de totale productieve woordenschat van het kind, in beide talen. De talen waarvoor men heeft gekozen zijn het Tarifit (Berbers), Turks, Fries, Papiaments en Marokkaans-Arabisch. Het normeringsonderzoek naar Tarifit en Turks wordt uitgevoerd door het Instituut Maatschappelijke Gezondheidszorg aan de Erasmus Universiteit, in Rotterdam en Den Haag. Het normeringsonderzoek naar het Fries wordt 4 geleid door Henk lutje Spelberg van de Rijksuniversiteit Groningen en het Papiaments en Marokkaans-Arabisch worden onderzocht in Amsterdam. De constructiefase van de Lexilijsten is afgerond, maar de lijsten zijn nog niet genormeerd. Daarvoor zijn er per taal 320 proefpersonen nodig, verdeeld over vier leeftijdsgroepen: 80 kinderen van 21 maanden, 80 van 23 maanden, 80 van 25 maanden en 80 van 27 maanden. Tijdens mijn stage bij Stichting Studio Taalwetenschap heb ik mij bezig gehouden met dit normeringsonderzoek naar de tweetalige Lexilijsten Papiaments/Nederlands en Marokkaans/Nederlands. Het vinden van jonge Antilliaanse kinderen over wie de Lexilijst ingevuld zou moeten worden verliep echter zeer moeizaam. Daarom is besloten met dit onderzoek te stoppen. In deze scriptie zal dus gebruikt worden gemaakt van de gegevens van het normeringsonderzoek naar de tweetalige Lexilijst Marokkaans-Arabisch/Nederlands. In deze scriptie staat de woordenschatontwikkeling van kinderen centraal. Woorden zijn zeer belangrijk in een taal. Kinderen hebben woorden nodig om syntactische categorieën te kunnen vormen en grammaticale relaties te kunnen realiseren. De ontwikkeling van het lexicon is daarom een goede manier om te kijken naar de taalontwikkeling als geheel van een kind (Clark, 1993). Het gaat echter niet om normale woordenschatontwikkeling, maar om woordenschatontwikkeling in twee talen. Van de wereldbevolking is ongeveer 50% twee- of meertalig (Appel & Vermeer, 2000). Dat is dus een grote groep mensen. In Nederland zijn er, onder andere door migratie, steeds meer mensen die twee talen spreken. In deze scriptie gaat het om jonge Marokkaanse kinderen in Nederland, die zowel het Marokkaans-Arabisch als het Nederlands leren spreken. Uit onderzoek blijkt dat de ontwikkeling van tweetalige kinderen grotendeels hetzelfde verloopt als de ontwikkeling van eentalige kinderen in beide talen afzonderlijk. Wel blijkt meestal dat de kinderen in beide talen iets achter liggen op eentalige kinderen. Bijvoorbeeld wat betreft de woordenschat hebben ze in elk van beide talen afzonderlijk een minder groot vocabulaire dan eentalige kinderen, maar bij elkaar opgeteld is het vocabulaire vaak groter (Appel & Vermeer, 2000). Het huidige onderzoek kan ingedeeld worden in twee delen. Het eerste deel gaat over de resultaten die naar voren komen uit het normeringsonderzoek naar de tweetalige Lexilijsten. Dit zijn gegevens die van belang zijn voor de normering en de verdere ontwikkeling van de tweetalige Lexilijsten. 5 Het tweede deel gaat over de verschijningsvolgorde van woorden. Vaak wordt aangenomen dat kinderen meer nomina gebruiken dan verba en dat het gebruik van functiewoorden langer achterwege blijft. Onderzocht zal worden hoe de verschijningsvolgorde van de woordsoorten is bij deze groep jonge Marokkaanse kinderen in Nederland. Ook zal een vergelijking worden gemaakt met eentalige Nederlandse kinderen. Dit leidt tot de volgende onderzoeksvragen: 1. Hoe verloopt de woordenschatontwikkeling van Marokkaans-Arabisch-sprekende kinderen in Nederland? • Hoe hangt de leeftijd van een kind samen met de woordenschatscore op de tweetalige Lexilijst Marokkaans-Arabisch/Nederlands en is er een verschil tussen jongens en meisjes? • Hoe verhouden de resultaten zich tot die van de eentalige Nederlandse groep? • Wat is het verband tussen de conceptscore van een kind en de totaalscore op de tweetalige Lexilijst Marokkaans-Arabisch/Nederlands en is er een verschil tussen jongens en meisjes? 2. Welke externe factoren zijn van invloed op de woordenschatscore van een kind op de tweetalige Lexilijst Marokkaans-Arabisch/Nederlands? • Wat is de relatie tussen de woordenschatscore op de Lexilijst en het gevolgd hebben van Nederlandse lessen door de ouders? • Wat is de relatie tussen woordenschatscore op de Lexilijst en moedertaal van de ouders? • Wat is de relatie tussen woordenschatscore op de Lexilijst en de taal die thuis hoofdzakelijk met het kind gesproken wordt? • Wat is de relatie tussen woordenschatscore op de Lexilijst en het hebben van oudere broers of zussen? 3. Hoe is het vocabulaire van de Marokkaans/Nederlandse kinderen in het onderzoek samengesteld? • Hoe verloopt de ontwikkeling van het produceren van woorden uit de verschillende rubrieken op de tweetalige Lexilijst MarokkaansArabisch/Nederlands 6 o voor het Marokkaans-Arabische deel van de Lexilijst? o voor het Nederlandse deel van de Lexilijst? • Hoe verloopt de ontwikkeling van het produceren van verschillende woordsoorten o voor het Marokkaans-Arabische deel van de Lexilijst? o voor het Nederlandse deel van de Lexilijst? • Welke verschillen en overeenkomsten zijn er tussen de eentalige Nederlandse groep en de Marokkaans-Arabisch/Nederlandse groep in de samenstelling van het vocabulaire en hoe kunnen deze verschillen verklaard worden? In hoofdstuk 2 komt de theorie aan de orde over woordenschatverwerving bij kinderen in het algemeen. Hoofdstuk 3 gaat wat dieper in op de tweetalige Lexilijst, aangezien dit instrument centraal staat in het onderzoek. In hoofdstuk 4 wordt achtergrondinformatie gegeven over het Marokkaans-Arabisch. De grammatica van talen kan invloed hebben op de woordsoorten die verworven worden. In datzelfde hoofdstuk zullen ook enkele relevante aspecten van het Nederlands worden besproken, omdat een vergelijking met de eentalige Nederlandse groep zal worden gemaakt. De methode van onderzoek wordt beschreven in hoofdstuk 5. De resultaten van het onderzoek worden weergegeven in hoofdstuk 6. Hoofdstuk 7 ten slotte bevat de conclusie van het onderzoek en de resultaten zullen worden geïnterpreteerd. 7 2. Woordenschatontwikkeling bij kinderen 2.1 Inleiding In dit hoofdstuk zal de woordenschatverwerving van kinderen centraal staan. Het produceren van woorden vormt de eerste stap voor kinderen naar het volwassen taalgebruik. Er is een bepaalde hoeveelheid woorden nodig voordat kinderen zinnen kunnen gaan maken en dus syntaxis kunnen gaan toepassen. Woordenschatontwikkeling is daarom een belangrijk onderwerp. De woorden die mensen gebruiken om te spreken, of om te begrijpen wat andere mensen zeggen, liggen opgeslagen in het mentale lexicon. Een woord is de kleinste semantische eenheid die verschillende plaatsen kan innemen in een zin (Clark, 1993). Morfemen daarentegen zijn de kleinste betekenisdragende elementen in een zin. Deze kunnen ook binnen woorden bestaan, bijvoorbeeld ‘-en’ is een morfeem dat meervoud aangeeft. Een morfeem kan echter niet op zichzelf staan in de zin zoals woorden dat kunnen. Behalve woorden bevinden zich in het mentale lexicon ook idiomatische frasen. Dit zijn bijvoorbeeld spreekwoorden en gezegden. De items in het mentale lexicon worden lexicale items genoemd. Elk lexicale item heeft een eigen ‘ingang’, een lexical entry. Deze entries bevatten in ieder geval vier soorten informatie: (a) betekenis: conceptuele informatie (b) syntactische vorm: bijvoorbeeld nomen of werkwoord (c) morfologische structuur: specificatie van de opbouw van het woord, bijvoorbeeld word root + -er (d) fonologische vorm: de segmenten van het woord, de syllaben en klemtoon. (a) en (b) vormen samen het lemma en (c) en (d) de woordvorm (Clark, 1993). Allereerst komen kort enkele kwantitatieve gegevens over woordenschatverwerving aan de orde. Vervolgens wordt de indeling in fases behandeld die vaak gebruikt wordt als het gaat om woordenschatverwerving. Ook is er een paragraaf gewijd aan de eerste woorden die kinderen uiten. De woordenschatspurt komt aan de orde in paragraaf 2.5 Vervolgens worden enkele theorieën behandeld over hoe kinderen woorden leren. In paragraaf 2.7 wordt de discussie over de noun bias besproken en in paragraaf 2.8 ten slotte wordt in het kort iets verteld over tweetalige taalverwerving, aangezien de proefpersonen in dit onderzoek over het algemeen tweetalig opgroeien. 8 2.2 Kwantitatieve gegevens Als kinderen een woord leren, dan moeten ze zowel de woordvorm die gebruikt wordt opslaan, als de betekenis die deze vorm heeft. In het geheugen moet vastgelegd worden wat elk woord betekent, de woordklasse (werkwoord, nomen, adjectief), de interne structuur van het woord (of het verdeeld kan worden in kleinere delen) en hoe het uitgesproken wordt (Clark, 1993). Een redelijk opgeleide volwassene heeft naar schatting een vocabulaire van minimaal 50 000 woorden (Elbers & Van Loon-Vervoorn, 2000). Kinderen zeggen hun eerste woord als ze ongeveer één jaar oud zijn. Uit onderzoek van Schlichting (1996) blijkt dat 92% van de kinderen met veertien maanden ten minste één woord produceert. Met 21 maanden blijken Nederlandse kinderen gemiddeld hun 50e woord te produceren. Onderzoek van Nelson (1973) wijst uit dat kinderen gemiddeld tien woorden zeggen als ze ongeveer 15 maanden oud zijn. De gemiddelde leeftijd waarop kinderen 50 woorden produceerden was in Nelsons onderzoek 19,6 maanden. Op gemiddeld ongeveer dezelfde leeftijd (19,8 maanden) konden de kinderen tien frases produceren. Dromi (1987) echter haalt enkele andere onderzoekers aan die veel grotere zogenaamde single-word lexicons hebben gevonden. Hiermee bedoelt ze het aantal woorden dat kinderen produceren, voordat ze deze gaan combineren, dus het aantal woorden in de eenwoordsfase. Dromi schat dat kinderen meer dan 250 woorden kennen, voordat ze gaan combineren. De cijfers die gerapporteerd worden met betrekking tot het begin van de woordproductie verschillen per onderzoeker. Volgens Nelson (1973) heeft dat vooral te maken met twee problemen, namelijk het definiëren van een woord en het bepalen van de methode om gegevens te verzamelen. Zo kan iets als een woord beschouwd worden als het geproduceerd wordt door het kind, of als het begrepen wordt als anderen het gebruiken. Ook is er een verschil tussen woorden die alleen geproduceerd worden als imitatie en woorden die spontaan gebruikt worden. Bovendien is het altijd moeilijk om na te gaan in hoeverre het gebruik van het woord door het kind overeenkomt met het volwassen gebruik. De manier van data verzamelen heeft ook invloed op de resultaten. Er zijn veel linguïsten die hun eigen kinderen hebben onderzocht. Dat leidt tot andere gegevens dan wanneer onderzoekers een kind testen, of wanneer niet-taalkundige moeders de woorden moeten rapporteren. 9 Vanwege deze twee problemen worden volgens Nelson (1973) verschillende cijfers gemeld met betrekking tot de leeftijd waarop de eerste woorden verschijnen en het aantal woorden dat kinderen produceren op een bepaalde leeftijd. Bates et al. (1995) hebben gegevens gebruikt van Fenson et al. (1993) uit het onderzoek naar de MacArthur Communicative Development Inventory (CDI). Dit is een woordenlijst die werkt met ouderrapportage: ouders strepen op de lijst de woorden aan die hun kind produceert. Zie over de CDI paragraaf 3.2. Met 8 maanden was het gemiddelde productieve vocabulaire dat Bates et al. hebben gevonden 1,8 woorden (mediaan is 0). Met 12 maanden waren dit tien woorden (mediaan 6), met 16 maanden gemiddeld 64 woorden (mediaan 40) en met 30 maanden 534 woorden (mediaan 573). Voor dit onderzoek is een zeer groot sample gebruikt: 1803 kinderen. Deze cijfers hebben betrekking op de actieve woordenschat, de productie. Over het algemeen wordt aangenomen dat kinderen meer woorden begrijpen dan dat ze produceren. Zo gaat men er bij de MacArthur CDI (Fenson et al., 1994) vanuit dat kinderen een woord altijd begrijpen als zij het produceren. Benedict (1979, in Ingram, 1989) heeft het verschil in leeftijd onderzocht tussen het begrijpen en het produceren van woorden. Het blijkt dat het begrip ongeveer vier maanden voorloopt op productie. Zo hadden de kinderen uit haar onderzoek met 0;11 gemiddeld twintig woorden verworven wat betreft begrip. Pas met 1;3 konden ze twintig woorden produceren. Ook was de verwervingssnelheid van de eerste 50 woorden voor het begrip twee keer zo hoog als voor de productie. De kinderen hadden ongeveer twee weken nodig om tien woorden receptief te verwerven en vier weken om deze tien woorden productief te verwerven. Volgens Fenson et al. (1993) begrijpt 31% van de kinderen van acht maanden oud al 100 woorden. Op deze leeftijd is het eerste woord meestal nog niet geproduceerd. Met 14 maanden, als volgens Schlichting 92% van de kinderen minstens één woord produceert, dan heeft 87% van de kinderen uit het onderzoek van Fenson et al. receptief al 100 woorden verworven. Bovenstaande gegevens wijzen dus op grote verschillen tussen receptie en productie. Er zijn echter ook onderzoekers die beweren dat kinderen soms wel woorden produceren die ze nog niet begrijpen (Leonard et al., 1980, in Reznick & Goldfield, 1992). Voor alle genoemde cijfers geldt dat het slechts gemiddelden zijn. De individuele verschillen tussen kinderen blijken in onderzoeken naar de woordenschatontwikkeling zeer groot te zijn. 10 2.3 Fases De woordenschatontwikkeling van kinderen wordt vaak in verschillende fases ingedeeld. De indeling in fases kan echter per onderzoeker verschillen. Hieronder is de indeling van Schaerlaekens (2000) weergegeven. Deze indeling is niet specifiek toegespitst op de ontwikkeling van het lexicon, maar gaat over de taalontwikkeling in het algemeen. In deze paragraaf is er echter voor gekozen om alleen de fases weer te geven vanaf het gebruik van het eerste woord. De prelinguale periode is dus buiten beschouwing gelaten, aangezien deze van minder belang is voor het onderwerp van deze scriptie. • De éénwoordsfase (ongeveer 1;0-1;6) De woorden die in deze periode geproduceerd worden, zijn vaak gebonden aan vaste handelingsschema’s. Het is routineus taalgebruik. De woorden lijken vaak erg op klanken die tijdens de brabbelperiode al geproduceerd werden (‘dada’, ‘mama’). De leeftijd waarop het eerste woordje geproduceerd wordt kan sterk verschillen. Geleidelijk aan gaat het kind steeds meer dingen in de omgeving benoemen. Ook kan het kind aan het eind van deze periode verwijzen naar mensen of dingen die op dat moment afwezig zijn door slechts één woord te uiten. Dit worden holofrasen genoemd. Bijvoorbeeld het woord ‘hond’ kan betekenen: ‘Dat is een hond’, ‘Waar is de hond?’, ‘Geef me de hond’ (Nelson, 1973). • De twee- en meerwoordsfase (ongeveer 1;6-2;6) 95% van de Nederlandse kinderen gaat woordcombinaties produceren tussen de 1;6 en 2;0 jaar. Routineuze uitdrukkingen, zoals ‘mag niet’ worden hierbij niet meegeteld, omdat kinderen deze als één woord in hun lexicon kunnen hebben opgeslagen. In deze fase kunnen kinderen veel uitingen maken door gebruik te maken van woordvolgorde en accent. Het taalgebruik van de kinderen wordt ook wel omschreven als telegramstijl: de geproduceerde zinnen zijn kort, bevatten weinig tot geen functiewoorden en weinig tot geen morfologie. • Differentiatiefase (gemiddeld 2;6-5;0) Kinderen leren in deze fase de nog ontbrekende fonemen en het fonologisch bewustzijn groeit. De woordenschat neemt toe, evenals het metalinguïstisch bewustzijn. Hierdoor raakt het kind zich bewust van de relatie tussen vorm en betekenis en gaat het ‘etymologiseren’, dat wil zeggen dat het kind redenen gaat geven waarom een woord een bepaalde vorm heeft: 11 (1) De fee dat is omdat die altijd naar het feest gaat hè? (Schaerlaekens, 2000) Verder verzinnen kinderen in deze periode vaak zelf woorden (neologismen), zoals ‘spiegelpapier’ in plaats van ‘zilverpapier’. Functiewoorden verschijnen in deze fase in het lexicon. Het lidwoord bijvoorbeeld, verschijnt vrij vroeg. Ook gaan kinderen morfologie toepassen. Zo worden werkwoorden nu vervoegd en komt de meervoudsvorm van het zelfstandig naamwoord. Taal wordt gedecontextualiseerd. Kinderen kunnen ook over zaken praten die niet het hier en nu betreffen. • Voltooiingsfase (gemiddeld 5;0-9;0) Het is de vraag of dit wel een aparte fase genoemd kan worden, aangezien er geen compleet nieuwe aspecten meer worden verworven. Alle aspecten van de taalverwerving komen verder tot ontwikkeling. Aan de morfosyntaxis moet meestal nog wel wat geschaafd worden. Veel kinderen van een jaar of negen gebruiken nog steeds overgeneralisaties, zoals ‘ik valde’. Het kind leert zich inleven in het standpunt van zijn gesprekspartner. Het kind houdt er nu rekening mee welke informatie bekend is voor de luisteraar en welke informatie hij nog moet geven, opdat zijn verhaal te volgen is. Elbers & Van Loon-Vervoorn (2000) houden als fase-indeling van de woordenschatverwerving de periodes van Nelson (1985, 1991) aan. Volgens Nelson hebben heel jonge kinderen geen begrippen van concepten in hun hoofd, maar van complete gebeurtenissen, gebeurtenisschema’s. Dit zijn mentale representaties van regelmatig terugkerende gebeurtenissen. Als een kind iets zegt, dan wordt dat meestal bepaald door de hele gebeurtenis en niet door een bepaald object. Geleidelijk kan het kind individuele begrippen uit het gebeurtenisschema losmaken, decontextualiseren. Dit gebeurt in de referentiële periode. In deze periode leren kinderen dat woorden verwijzen naar dingen in de wereld. Vaak zijn de eerste woordjes zo zeer verbonden met een bepaald gebeurtenisschema dat ze geen referentiële functie hebben, maar een interactieve functie, bijvoorbeeld een verzoek om hulp of het richten van iemands aandacht op een voorwerp. 12 De tweede periode volgens Nelson is de denotationele periode. Kinderen moeten leren welke zaken een benoembare klasse vormen. Volgens Tomasello et al. (1988, in Elbers & Van Loon-Vervoorn, 2000) leren kinderen gemakkelijker nieuwe woorden als deze al enigszins overeenkomen met al bekende woorden. Dus als het kind het concept of de categorie al kent, dan is het eenvoudiger om andere leden van dezelfde categorie te leren. De hiërarchie binnen de categorie hoeft echter nog niet bekend te zijn. In deze periode komen vaak onderextensies en overextensies voor (zie paragraaf 2.4). Bij onderextensies nemen kinderen de betekenis van een woord te beperkt. Een kind zegt bijvoorbeeld alleen ‘hond’ tegen zijn eigen hond. Bij overextensies nemen kinderen de betekenisgrenzen juist te ruim. Ze noemen bijvoorbeeld alle mannen ‘papa’. De laatste periode is de sense periode. Hierin ontstaan er taxonomische betekenisrelaties tussen woorden. Kinderen weten al dat bepaalde woorden vanwege gebeurtenissen of routines met elkaar verbonden zijn. Zo weten ze dat ‘melk’ en ‘slab’ met elkaar verbonden zijn. Ze moeten nu de relatie tussen concepten gaan leren. Het gaat nu dus om zaken die je niet kunt zien in de wereld, zoals de relatie tussen ‘melk’ en ‘drank’. Het is echter de vraag of woordenschatverwerving wel ingedeeld kan worden in stadia of fases. Het gebruik van de term ‘stadia’ is verbonden met Piaget. Piaget heeft de cognitieve ontwikkeling van kinderen beschreven in zes stadia. Het gaat dan om kinderen tot ongeveer twee jaar. Hij noemt dit de zes stadia van sensorimotorische ontwikkeling. Zo verschijnen in het eerste stadium bijvoorbeeld de reflexen. Volgens Piaget verschijnen in het vijfde stadium de eerste ‘woorden’. Hij ziet dit echter niet als woorden, maar als symbolen (Ingram, 1989). Kinderen gaan naar het volgende stadium als ze nieuwe cognitieve structuren hebben verworven. Tegenstanders beweren echter dat er geen sprake is van kwalitatieve veranderingen, maar dat er alleen meer toegang komt tot dezelfde structuur. De kinderen gaan nieuwe strategieën gebruiken voor het verwerken van de informatie. (Dromi, 1987). Er bestaat dus veel onduidelijkheid over het gebruik van stadia. Dromi is van mening dat het gebruik van een fasemodel nuttig kan zijn voor het beschrijven van de taalontwikkeling. Het is echter noodzakelijk dat duidelijk aangegeven wordt wanneer het stadium begint en eindigt en wat het stadium onderscheidt van andere stadia. Bovendien moet een stadium voldoende tijd bestrijken. Een andere voorwaarde van Dromi is dat voorafgaand gedrag een noodzakelijke, maar niet een voldoende voorwaarde vormt voor de ontwikkeling die erop volgt. 13 De kinderen in het huidige onderzoek zijn tussen de 18 en 34 maanden oud. Volgens de fase-indeling van Schaerlaekens (2000) bevinden deze kinderen zich dus voor het grootste deel in de twee-en meerwoordsfase. Ze produceren dus al enkele woordcombinaties. Op de Lexilijst wordt inderdaad ook gevraagd of de kinderen bepaalde korte zinnetjes al produceren. De oudste kinderen in dit onderzoek zouden zich al in de differentiatiefase moeten bevinden. Dit is echter maar een klein aantal. 2.4 Eerste woorden De eerste woorden die kinderen zeggen hebben betrekking op de dingen in de wereld om hen heen. Ze praten over mensen, dieren, eten, lichaamsdelen en kleding. De eerste tien tot twintig woorden die een kind produceert zijn vaak situatiegebonden. De kinderen produceren deze woorden alleen in bepaalde contexten, bijvoorbeeld een kind zegt alleen ‘dag’ als iemand de kamer verlaat. Sommige auteurs noemen dit woordgebruik indexical signs, omdat de woorden communicatief gebruikt worden en op gebeurtenissen als geheel slaan. De woorden hebben echter weinig lexicale inhoud, dus het zijn geen categorielabels (Clark, 1993). Vroeg geleerde woorden zijn woorden die kinderen verwerven voordat ze naar school gaan. Deze woorden hebben een aantal overeenkomsten met elkaar. Het zijn meestal woorden van het basisniveau. Dat is het middenniveau wat betreft abstractie in de hiërarchie van woorden. Bijvoorbeeld het woord ‘hond’ behoort tot het basisniveau, maar ‘zoogdier’ of ‘labrador’ niet. Het basisniveau wordt wel gedefinieerd als het meest abstracte niveau dat nog perceptueel voorstelbaar is (Maratsos & Deák, 1995, in Elbers & Van Loon-Vervoorn, 2000). Verder bestaan vroeg geleerde woorden meestal uit maar één morfeem. Het zijn zogenaamde enkelvoudige woorden. Bovendien is de betekenis gebaseerd op ervaringscontexten. Kinderen leiden de betekenis van woorden af uit de situatie waarin deze zijn gebruikt. Schlichting (1996) heeft onderzoek gedaan naar de meest voorkomende vroege woorden in het Nederlands. In tabel 1 zijn die woorden opgenomen die bij ten minste een derde van haar groep proefpersonen (dat wil zeggen dertien van de 37 kinderen) tot de eerste 50 woorden in het vocabulaire behoorden. Het getal voor het woord geeft aan 14 hoeveel kinderen het woord gebruikten. De getallen tussen haakjes geven aan hoeveel woorden in die categorie waren opgenomen in het onderzoek. Tabel 1: De eerste 50 geproduceerde woorden van Nederlandse kinderen (Elbers & Van LoonVervoorn, 2000) Substantieven (213) Werkwoorden (49) Sociale uitdrukkingen (45) 35 auto 20 eten 26 bah 32 mama 17 zitten 25 dag 32 papa 15 slapen 24 nee 30 poes 14 poepen 22 au 27 opa 13 drinken 21 ja 23 koekje 15 hap 23 oma Bijwoorden (29) 13 boem 22 pop 21 uit 13 kiekeboe 21 bal 20 op 21 paard 13 buiten Overige (29) 18 hond 13 open 21 die 17 jas 17 klok 16 eend 14 appel 14 boek 13 aap 13 kaas Hieruit blijkt dus dat de substantieven (nomina) het belangrijkste deel van de woordenschat vormen. De referenten van nomina zijn vaak direct waarneembaar en zouden daarom gemakkelijker te verwerven zijn voor kinderen. Werkwoorden daarentegen geven meestal handelingen aan die al plaats hebben gevonden, of die nog plaats moeten vinden. Dat is moeilijker voor kinderen. Paragraaf 2.7 gaat over dit verschil tussen nomina en verba. De bijwoorden die in de tabel staan, blijken in het begin vaak als werkwoorden te functioneren. Kinderen gebruiken bijvoorbeeld het woordje ‘uit’ als ze uit de kinderstoel willen. Engelse kinderen gebruiken gone om de verdwijning van een object aan te geven en more om over het terugkeren van de actie te praten (Clark, 1993). 15 Volgens Clark (1993) zijn de eerste werkwoorden die kinderen gebruiken algemene werkwoorden, zoals do, make, get en go. Pas later gaan kinderen specifiekere werkwoorden gebruiken voor hun acties. Uit tabel 1 over de Nederlandse woordenschatverwerving blijkt dit overigens niet. De werkwoorden die hierin zijn opgenomen, zijn geen algemene werkwoorden, maar hebben een echte vaste betekenis. Het eerste algemene werkwoord dat in het onderzoek van Schlichting (1996) voorkomt, is ‘hebben’ dat door zes van de 37 kinderen wordt geproduceerd bij de eerste 50 woorden. Dit is het enige hulpwerkwoord dat voorkomt in de tabel van Schlichting. Om in de tabel te worden opgenomen moesten werkwoorden door meer dan één kind gebruikt worden bij de eerste 50 woorden. Ook staan er geen modale werkwoorden in de tabel. De werkwoorden die genoemd worden zijn allemaal lexicale werkwoorden. Clark (1993) heeft nog naar andere kenmerken gekeken van het gebruik van verba. Kinderen blijken in het begin meer over hun eigen acties te praten dan over acties van anderen. Ook produceren ze eerder werkwoorden die beweging uitdrukken (zoals walk) dan werkwoorden die verandering uitdrukken (bijvoorbeeld break) (Clark, 1993). Ook andere onderzoekers zijn van mening dat beweging voor kinderen een opvallend verschijnsel is. Caselli et al. (1995) hebben onderzoek gedaan naar de productieve en receptieve woordenschat van Amerikaanse (Engelstalige) en Italiaanse kinderen. Voor beide groepen hebben zij de eerste 50 geproduceerde woorden weergegeven. In tabel 2 staan de eerste 25 woorden weergegeven om op die manier een vergelijking te maken met de Nederlandse woorden in tabel 1. Achter de woorden staat het percentage kinderen weergegeven dat het woord heeft geproduceerd. Als dezelfde criteria als bij Schlichting zouden worden gebruikt (dat wil zeggen, een woord geproduceerd door minstens een derde van de kinderen), dan zouden slechts equivalenten van vijf Engelse en vier Italiaanse woorden in de tabel staan. Dit heeft waarschijnlijk te maken met de leeftijd van de proefpersonen. Bij Caselli et al. waren deze tussen de acht en zestien maanden oud. De kinderen uit het onderzoek van Schlichting waren gemiddeld 21,3 maanden oud. Achter de woorden staat aangegeven welke woordsoort het betreft. Hierbij zijn dezelfde categorieën aangehouden als in tabel 1, met één verschil: er is een aparte categorie Onomatopeeën gevormd, aangezien die veel voorkwamen in het sample van Caselli et al. 16 Tabel 2: De eerste 25 geproduceerde woorden van Amerikaanse en Italiaanse kinderen (Caselli et al., 1995) Engels Woordsoort Italiaans Vertaling Woordsoort daddy (54,9%) Substantieven mamma mama Substantieven (49,7%) mommy Substantieven papa (49,7%) papa Substantieven Sociale bau-bau woef (hond) Onomatopee uitdrukkingen (41,5%) Sociale pappa (36,9%) pap / maaltijd Sociale (52,9%) bye (43,1%) hi (39,3%) uitdrukkingen uh-oh (35,5%) Sociale uitdrukking nonna (32,8%) oma Substantieven brum-brum broem Onomatopee uitdrukkingen baa-baa Onomatopee (31,9%) (28,7%) ball (30,9%) Substantieven acqua (27,2%) water Substantieven dog (30,6%) Substantieven nonno (23,1%) opa Substantieven no (28,5%) Sociale nanna (21,5%) slapen / bedtijd Sociale uitdrukkingen bottle (25,2%) Substantieven uitdrukking no (21,5%) nee Sociale uitdrukking woof (24,9%) Onomatopee miao (21,0%) miauw Onomatopee baby (24,6%) Substantieven grazie (20,5%) dankjewel Sociale uitdrukking yum-yum Sociale (24,1%) uitdrukkingen grr (23,5%) Onomatopee ciao (17,9%) hallo / dag Sociale uitdrukking cuccu-settete [spelletje] (16,9%) Sociale uitdrukking kitty (21,8%) Substantieven palla (16,4%) bal Substantieven vroom (20,2%) Onomatopee muuh (15,9%) boe (koe) Onomatopee book (19,9%) Substantieven non c’è più er is niet meer Sociale (14,9%) uitdrukking bird (19,6) Substantieven scarpe (14,4%) schoenen Substantieven duck (18,8%) Substantieven coccode kukeleku Onomatopee (13,8%) 17 balloon Substantieven (18,4%) cat (18,2%) beh-beh bèh (schaap) Onomatopee ih-oh (12,8%) ia (ezel) Onomatopee (12,8%) Substantieven [eigen naam kind] (12,8%) night-night Sociale (17,1%) uitdrukkingen quack (17,0%) Onomatopee bimbo (12,3%) kind Substantieven shoe (17,0%) Substantieven pronto (11,8%) hallo (telefoon) Sociale uitdrukking meow (16,6%) Onomatopee bum (11,3%) boem Sociale uitdrukking Het grootste verschil tussen tabel 1 en 2 is het grote aantal Onomatopeeën bij de Amerikaanse en Italiaanse kinderen. Bij een aantal woorden kan er twijfel zijn over of een woord een Sociale uitdrukking of een Onomatopee is, bijvoorbeeld bum. In tabel 1 staan echter helemaal geen dierengeluiden, terwijl die in tabel 2 wel veel voorkomen. In tabel 1 komen wel meer dierennamen voor. Misschien dat Italiaanse kinderen dieren in eerste instantie aanduiden met het geluid dat ze maken. Bijvoorbeeld ze noemen een haan coccode. De Amerikaanse kinderen produceren wel enkele dierennamen. Een ander groot verschil is dat er in tabel 2 geen werkwoorden en bijwoorden voorkomen. Dat kan ook met de jonge leeftijd van de kinderen te maken hebben. Overeenkomsten zijn er ook. Zo zijn veel geproduceerde woorden ‘mama’, ‘papa’, ‘oma’ en ‘bal’. Ook komen sociale uitdrukkingen veel voor. In dit scriptieonderzoek zal ook worden gekeken naar de eerste woorden die kinderen produceren en tot welke woordsoort deze woorden behoren. In de vroege woordenschat van kinderen komen veel overextensies en onderextensies voor. Bij onderextensies gebruiken kinderen een woord voor maar een deel van de leden waar de categorie uit bestaat. Dit lijkt dus op het situatiegebonden woordgebruik van kinderen. Bij overextensies gebruiken kinderen een woord ook voor andere referenten die een perceptuele overeenkomst hebben met het woord. Bijvoorbeeld het gebruik van ‘eendje’ voor alle vogels (Clark, 1993). Uit onderzoek blijkt dat in sommige domeinen eerder overextensie plaatsvindt dan bij andere. Bij het eerste woord dat een kind leert voor een letter of een getal vindt vaak 18 overextensie plaats. Datzelfde geldt voor termen voor vervoersmiddelen en kleding en iets minder vaak voor dieren. Dit gebeurt in meerdere talen. Volgens Clark kan men hieruit twee dingen concluderen. Ten eerste zijn sommige domeinen interessanter voor kinderen, en ten tweede doen kinderen meer moeite doen om te praten over dingen die ze interesseren. Dat kan leiden tot overextensies. Clark ziet het gebruik van overextensies als een communicatieve strategie. Kinderen gebruiken het woord dat het dichtst bij het woord komt dat ze eigenlijk willen gebruiken. Overigens bestaat er een verschil tussen productie en receptie: de overextensies die kinderen produceren, gebruiken ze meestal niet bij het begrijpen van woorden. Dit is onderzocht door Thomson & Chapman (1977, in Ingram, 1989). Zij hebben vijf Engelse kinderen (gemiddelde leeftijd 22,4 maanden) getest. Ze kozen bij elk kind vier overextensies uit de productiegegevens uit. Voor proefpersoon J. waren dit bijvoorbeeld ‘Daddy’, ‘dog’, ‘apple’ en ‘ball’. Vervolgens kregen de kinderen een groot aantal plaatjes en foto’s te zien. Om bijvoorbeeld het woord ‘apple’ te testen, kreeg het kind elf foto’s te zien van verschillende soorten appels, vijftien foto’s van bekende objecten (bijvoorbeeld tomaten, sinaasappel, aardbei, voetbal, banaan) en vier foto’s van minder bekende objecten (uien, zeep). Eerst moest het kind een productietaak uitvoeren. Het kreeg plaatjes te zien totdat het minstens vijf plaatjes correct had benoemd en tien niet correct. Vervolgens moest het kind de begripstaak doen. Alle vier de woorden werden zestien keer getest. Het kind moest telkens antwoord geven op ofwel Show me the X ofwel Where is the X? Tien keer kreeg het kind een juiste foto en een onjuiste foto te zien, vijf keer een foto met een overextensie naast een onjuiste foto en één keer twee ongerelateerde foto’s. Een kind had volgens de onderzoekers een woord correct begrepen (dus geen overextensie in het begrip) als acht keer of meer de juiste foto was geselecteerd op de eerste tien trials. Uit dit onderzoek bleek dat slechts acht van de twintig woorden overextensie vertoonden in begrip. Er is dus sprake van minder overextensies in het begrip dan in de productie van kinderen. Ook Nelson (1973) heeft gekeken naar de verwerving van de eerste 50 woorden. Zij heeft ze ingedeeld in (1) Specific Nominals: woorden die gebruikt worden om maar naar één exemplaar van een categorie te verwijzen, bijvoorbeeld ‘mommy’ (2) General Nominals: woorden die gebruikt worden voor alle leden van een categorie, bijvoorbeeld ‘ball’ (3) Action Words: woorden die een actie beschrijven, vereisen of vergezellen, of 19 die aandacht beschrijven of vragen, bijvoorbeeld ‘go’, ‘bye-bye’ (3) Modifiers: woorden die verwijzen naar eigenschappen van dingen of gebeurtenissen, bijvoorbeeld ‘big’, ‘mine’ (4) Personal Social: woorden die gemoedstoestand en sociale relaties uitdrukken, bijvoorbeeld ‘yes’, (5) Function Words: woorden die alleen een grammaticale functie hebben, bijvoorbeeld ‘what’. De volgende tabel beschrijft de percentages van bovengenoemde categorieën van de eerste tien woorden tot 41-50 woorden: Tabel 3: De verwerving van de eerste 50 woorden per woordsoort (Nelson, 1973) Vocabulaireniveau 1-10 11-20 21-30 31-40 41-50 Nominal specific 24% 12% 14% 12% 9% Nominal general 41% 45% 46% 60% 62% Action words 16% 15% 14% 12% 9% Modifiers 8% 10% 8% 8% 12% Personal-social 5% 13% 11% 4% 4% Function words 6% 4% 7% 3% 3% Wat opvalt, is dat het aantal algemene nomina sterk toeneemt en het aantal specifieke nomina daalt. Nelson is van mening dat kinderen in het begin geen concepten in hun hoofd hebben, maar gebeurtenisschema’s. Bij die gebeurtenissen zijn alleen specifieke personen, dieren of objecten betrokken. Daarom gebruiken kinderen in eerste instantie vooral specifieke nomina. Pas later kan het kind begrippen uit het gebeurtenisschema decontextualiseren. Zo leert het dus de woorden die verwijzen naar de gehele categorie. Dit zijn de algemene nomina. De verschillen tussen de woorden die kinderen verwerven zijn echter groot. Zoals hierboven aangegeven zijn er bepaalde woorden die de meeste kinderen in hun vroege vocabulaire hebben, maar er blijven individuele verschillen. Nelson (1973) heeft gekeken naar de vocabulaires van achttien kinderen, toen die uit 50 woorden bestonden. Als er complete overeenstemming tussen de kinderen zou zijn geweest, dan waren er in totaal 50 verschillende woorden gevonden in het onderzoek. Als er sprake was geweest van complete idiosyncrasie, dan waren er 900 (50 x 18) verschillende woorden geweest. Nelson heeft echter 356 verschillende woorden geteld. Nelson heeft de verschillende woorden die kinderen produceren geanalyseerd. Het blijkt dat de selectie van juist deze woorden niet wordt bepaald door persoonlijke ervaring of blootstelling aan de objecten of behoefte aan de objecten. Zo heeft Nelson geen 20 woorden als ‘tafel’, ‘broek’, ‘raam’ of ‘straat’ gevonden in het 50-woorden-vocabulaire, hoewel deze objecten toch volop aanwezig zullen zijn geweest in het dagelijks leven van de kinderen . Ze concludeert hieruit dat kinderen vooral woorden leren voor referenten die ze kunnen manipuleren, of waarmee ze een actie uit kunnen voeren. Dit zijn woorden als ‘schoen’, ‘sleutel’, ‘fles’. Deze referenten vertonen een opvallende verandering, ze bewegen bijvoorbeeld of maken geluid. Ook dingen die uit zichzelf iets doen en die het kind kan observeren, worden eerder geleerd. Het gaat dan om bijvoorbeeld auto’s en dieren. Nelson komt tot de volgende conclusies over de eerste woorden die kinderen leren: 1. Er vindt een individuele selectie plaats van alle mogelijke woorden. De ouders selecteren welke woorden zij gebruiken en de kinderen selecteren welke zij leren. 2. De woorden die geselecteerd worden, vertonen ‘organisatiethema’s’, categorieën, die de organisatie van de wereld volgens het kind reflecteren. Het kind kent bijvoorbeeld woorden van de categorieën dieren, voedsel of voertuigen. Deze thema’s zijn meestal gebaseerd op actie en bevatten meer dan één term. Deze conclusie wordt ondersteund door de resultaten van Schlichting (1996), zoals te zien is in tabel 1. 3. Er zijn individuele verschillen in het leren van woorden. Ruwweg kunnen deze worden ingedeeld in referentiële of expressieve manieren van spreken. De referentiële stijl houdt in dat er veel objectnamen worden verworven en de expressieve stijl dat er veel sociale woorden en frasen worden verworven. Op dit laatste punt van Nelson gaat paragraaf 2.4.1 verder in. 2.4.1 Referentieel versus expressief Nelson (1973) heeft een onderscheid gemaakt tussen kinderen die vooral objectnamen hebben in hun vroege woordenschat, dat wil zeggen veel algemene nomina (volgens de indeling in tabel 3), en kinderen die vooral veel sociale woorden en frasen gebruiken, dus veel persoonlijk-sociale woorden en specifieke nomina. Eerstgenoemde kinderen worden door Nelson referentiële kinderen genoemd en de andere kinderen expressieve kinderen. Als criterium heeft Nelson gebruikt dat meer dan 50% van het vocabulaire (de eerste 50 woorden) van het kind in de ‘algemene nomina’-categorie moest vallen om 21 referentieel genoemd te worden. Uit deze verdeling bleek dat de referentiële kinderen zoals gezegd meer algemene nomina hadden, maar minder persoonlijk-sociale woorden en minder functiewoorden dan de expressieve kinderen. Aangezien voor de expressieve kinderen taal leren vooral het leren uitdrukken van gevoelens, behoeften en sociale vormen is, concludeert Nelson dat de functie van de taal (zoals kinderen die zien) voor hen de inhoud bepaalt. Nelson heeft ook gekeken naar het aantal uitingen dat uit twee of meer woorden bestaat. Het ging om uitingen die geproduceerd werden voordat de kinderen een vocabulaire van 50 woorden hadden. Voor referentiële kinderen varieerden deze uitingen van nul tot vijf woorden (gemiddeld 2,4), voor expressieve kinderen van zes tot achttien (gemiddeld 12,6). Het verschil tussen beide groepen kinderen in het gebruik van functiewoorden hangt hiermee samen. Het taalgebruik van de expressieve kinderen bevat meer stereotype frases en uitdrukkingen. Hier komen over het algemeen ook functiewoorden in voor. De expressieve kinderen produceren dus meer functiewoorden dan de referentiële. Het aantal nieuwe woorden per maand bleek significant te verschillen voor referentiële en expressieve kinderen. Nelson vond een snelheid van gemiddeld 12,7 woorden per maand voor referentiële kinderen en 9,0 woorden per maand voor de expressieve. Ook de maximale verwervingssnelheid verschilde significant: respectievelijk 31,5 woorden per maand en 20,3. Dit wil zeggen dat de expressieve kinderen meer continuïteit in de verwerving vertoonden. Volgens Nelson liet deze groep minder vaak een spurt zien (zie paragraaf 2.5). Hoewel de expressieve kinderen op significant jongere leeftijd tien frases (dat wil zeggen: uitingen die uit meer dan één woord bestaan) uitten (18,6 maanden versus 20,7 maanden), hadden de referentiële kinderen een significant grotere woordenschat op tweejarige leeftijd (215, 4 woorden versus 143,9 woorden). Nelson concludeert dat gemiddelde uitingslengte en vocabulaire dus verschillende eigenschappen van de taal van een kind meten. Referentiële maten kunnen lexicale verwerving voorspellen, maar geen syntactische verwerving. Andere onderzoekers zijn het echter niet met Nelson eens. Velen zijn van mening dat het verschil tussen kinderen in verwervingsstijl niet zo eenduidig is. Volgens Ingram (1989) is er meer sprake van een continuüm. Er zijn een paar extreme gevallen, maar de meeste kinderen vertonen slechts een neiging naar het ene of andere type. Bates et al. (1988) hebben een two strand theory gedefinieerd over individuele verschillen tussen kinderen. Ze zetten twee leerstijlen tegenover elkaar die min of meer 22 overeenkomen met het onderscheid van Nelson tussen referentiële en expressieve kinderen. Aan de ene kant (strand 1) staan de kinderen die al vroeg gericht zijn op woorden. Zij verwerven een referentiële woordenschat. Tijdens de grammaticaverwerving zullen ze veel morfologische overgeneralisaties vertonen. Aan de andere kant (strand 2) zijn er de kinderen die vanaf het begin gericht zijn op intonatiecontouren. Zij verwerven expressieve vocabulaires. De grammaticaverwerving wordt gekenmerkt door ondergeneralisatie en inconsistente toepassing van de regels. Bates et al. hebben de volgende tabel samengesteld met daarin de individuele verschillen in de taalontwikkeling die uit verschillende onderzoeken naar voren zijn gekomen. Tabel 4: De two strand theory (Bates et al., 1988) Strand 1 Strand 2 Semantics High proportion of nouns in first 50 words Low proportion of nouns in first 50 words Single words in early speech Formulae in early speech Imitates object names Unselective imitation Greater variety within lexical categories Less variety within lexical categories Meaningful elements only Use of ‘dummy’ words High adjective use Low adjective use Context-flexible use of names Context-bound use of names Rapid vocabulary growth Slower vocabulary growth Grammar Telegraphic in Stage I Inflections and function words in Stage I Refers to self and others by name in Stage I Refers to self and others by pronoun in Stage I Noun-phrase expansion Verb phrase expansion Morphological overgeneralization Morphological undergeneralization Consistent application of rules Inconsistent application of rules Novel combinations Frozen forms Imitation is behind spontaneous speech Imitation is ahead of spontaneous speech Fast learner Slow learner Pragmatics Object-oriented Person-oriented Declarative Imperative Low variety in speech acts High variety in speech acts Phonology Word-oriented Intonation-oriented High intelligibility Low intelligibility 23 Segmental emphasis Suprasegmental emphasis Consistent pronunciation across word tokens Variable pronunciation across word tokens Demographic variables Female Male Firstborn Later-born Higher SES Lower SES Bates et al. (1988) concluderen echter dat het two-strand model te simpel is. Kinderen laten zich niet altijd in strands indelen. Ook hier zal er eerder sprake zijn van een continuüm. Er zullen kinderen zijn die de eigenschappen vertonen zoals beschreven bij strand 1 of strand 2, maar er zullen ook veel kinderen zijn die aan geen van beide beschrijvingen beantwoorden. Er is een complexer model nodig om de taalontwikkeling te kunnen verklaren. 2.5 Woordenschatspurt Bij het begin van de woordenschatverwerving leren kinderen langzaam nieuwe woorden bij. Daarna gaat het echter steeds sneller. Een kind van 1;6 produceert ongeveer 50-200 woorden en een kind van 2;0 500 of 600 (Clark, 1993). Tijdens het tweede levensjaar maken veel kinderen een versnelling mee in het verwerven van nieuwe woorden. Dit wordt de woordenschatspurt genoemd. Meestal vindt deze plaats als een kind een vocabulaire bezit van 50-100 woorden. Er zijn verschillende verklaringen voor het verschijnsel gegeven. Bates et al. (1995) sommen enkele gegeven verklaringen op. Volgens sommige onderzoekers verwerven kinderen een plotseling inzicht dat dingen namen hebben, of dat alle objecten een naam moeten hebben. Anderen denken dat er een algemene cognitieve verandering plaatsvindt. Ook zijn er onderzoekers die denken dat er een reorganisatie in de fonetische segmentatie of in de articulatie plaatsvindt. Clark (1993) noemt ook enkele verklaringen. Een van de verklaringen is de motorische ontwikkeling: als de woordenschatspurt plaatsvindt, dan zou er een bepaalde beheersing van articulatieprogramma’s voor de productie moeten zijn. Volgens Clark is de motorische ontwikkeling namelijk belangrijk bij de vroege woordenschatverwerving. Als kinderen er langer over doen om articulatieprogramma’s op te zetten voor het 24 produceren voor woorden, dan zullen ze ook pas later woorden gaan combineren, want dit vereist nog meer van het articulatiesysteem. Sommige onderzoekers zetten echter hun vraagtekens bij het bestaan van de woordenschatspurt. Nelson (1973) bijvoorbeeld merkte op dat de expressieve kinderen onder haar proefpersonen een geleidelijker woordenschatgroei vertoonden dan de referentiële kinderen. Alleen bij de laatste groep kinderen, die relatief meer nomina leerden, was er een stijging in de verwervingssnelheid waar te nemen. Goldfield & Reznick (1990) hebben het verschijnsel ook bestudeerd. Van hun achttien proefpersonen bleken dertien kinderen een versnelde woordenschatgroei te vertonen. Dit gebeurde voordat zij 50 woorden hadden verworven, op een gemiddelde leeftijd van 1;7.7. Deze dertien kinderen bleken vooral veel nomina te verwerven (71% van de geleerde woorden waren nomina). Het aantal nomina vormde een steeds groter deel van het totale vocabulaire; naarmate de woordenschat toenam, nam ook de proportie nomina toe. Goldfield & Reznick noemen het daarom ook wel een naming explosion. De kinderen werden overigens onderzocht van 1;2 tot 1;10. Vijf kinderen vertoonden een meer geleidelijke groeicurve. Er was bij hen ook minder verschil in de proportie nomina naarmate het lexicon groeide. De verschillende woordsoorten waren meer evenredig verdeeld. Goldfield & Reznick hebben bij al hun proefpersonen gekeken of deze als eerst geboren waren of niet. Dit zou invloed kunnen hebben op het voorkomen van een woordenschatspurt. De kinderen zonder woordenschatspurt waren allemaal niet het oudste kind van het gezin. Van de dertien kinderen die wel een woordenschatspurt vertoonden waren er acht wel het oudste kind. Dit effect van geboortevolgorde was significant. Goldfield & Reznick concluderen dat kinderen die een woordenschatspurt vertonen zich concentreren op één strategie, namelijk het leren van namen voor dingen. De andere groep kinderen probeert verschillende soorten ervaringen te beschrijven, waardoor ze verschillende woordsoorten gebruikt. Volgens Goldfield & Reznick is het niet waarschijnlijk dat de woordenschatspurt verklaard kan worden door een verandering in symbolische status van het woord (dat wil zeggen: het inzicht dat je met woorden dingen kunt benoemen), aangezien zij voorbeelden hebben gevonden van vroeg woordgebruik voor objecten in verschillende contexten, bijvoorbeeld ‘bal’ voor plaatjes van een bal, ballonnen, speelgoedballen en cirkels. 25 Een andere veel genoemde verklaring voor de woordenschatspurt is een cognitieve verandering, namelijk het inzicht dat alle dingen benoemd en gecategoriseerd kunnen worden. Deze verklaring wordt verworpen door de onderzoekers, omdat er ook kinderen zijn gevonden die een groot vocabulaire bezitten, maar niet de woordenschatspurt hebben doorgemaakt. Het zou vreemd zijn als deze kinderen nog niet het inzicht hadden dat alle dingen benoemd kunnen worden. Een andere verklaring heeft te maken met het taalaanbod. Veel eerstgeboren kinderen uit het onderzoek bleken wel een woordenschatspurt te vertonen, terwijl nieteerstgeborenen een geleidelijker groeicurve hadden. Ouders hebben voor hun eerste kind vaak meer tijd om benoemspelletjes te doen. Niet-eerstgeborenen krijgen taalaanbod vanuit meerdere bronnen. Deze input is gevarieerder en minder gericht op het benoemen van dingen. Ganger & Brent (2004) hebben de woordenschatspurt onderzocht door wiskundige formules op de gegevens toe te passen. De meest gebruikte manier om te onderzoeken of kinderen een woordenschatspurt vertonen, is het gebruik van een zogenaamde drempel. Bijvoorbeeld: een kind moet ten minste tien nieuwe woorden leren in veertien dagen als men het wil beschouwen als een woordenschatspurt. Verschillende onderzoekers hanteerden echter verschillende criteria, zodat de onderzoeken moeilijk met elkaar te vergelijken zijn. Ganger & Brent hebben gekeken of hun proefpersonen een groeicurve vertoonden die overeenkwam met een logistieke functie of met een kwadratische functie. In het eerste geval zou er sprake zijn van een spurt, in het tweede geval van een geleidelijke groei. Slechts vier van de twintig proefpersonen bleken bewijs te vertonen van een woordenschatspurt. De onderzoekers hebben dezelfde technieken toegepast op gegevens van Goldfield & Reznick (1990) en van Dromi (1987). Van de proefpersonen van Goldfield & Reznick waren er slechts één of twee die een spurt vertoonden volgens de groeicurven van Ganger & Brent. Dat is dus veel minder dan de dertien die Goldfield & Reznick zelf hebben gevonden. De proefpersoon van Dromi vertoonde volgens deze technieken geen spurt. De kinderen in het huidige onderzoek zijn gemiddeld twee jaar oud. Dat is de leeftijd waarop veel onderzoekers aannemen dat de woordenschatspurt plaatsvindt. De leeftijden variëren van 18 tot en met 34 maanden. Er zal worden gekeken of bij deze proefpersonen ook een woordenschatspurt waar te nemen is. 26 2.6 Theorieën over woordenschatverwerving Er zijn verschillende theorieën over hoe kinderen leren om bepaalde concepten uit te drukken. Dit probleem wordt ook wel the mapping problem genoemd. In deze paragraaf worden enkele belangrijke theorieën over woordenschatverwerving genoemd. De indeling die hier is gebruikt is een chronologische, zoals Dromi (1987) de theorieën heeft geordend. Voor de beschrijving van de theorieën is voornamelijk gebruik gemaakt van Dromi (1987) en Barrett (1995). Semantic Feature Hypothesis – Clark Clark (1973, 1977, in Dromi, 1987) ging ervan uit dat betekenissen van woorden zijn opgebouwd uit een aantal universele semantische kenmerken. Deze zijn voornamelijk gebaseerd op de waarneming. Als kinderen woorden gaan gebruiken, dan kennen ze nog niet de volledige betekenis van die woorden. Ze kennen nog niet alle semantische componenten. De verwerving daarvan gaat geleidelijk. Dit leidt ertoe dat kinderen veel overextensies hebben. Ze zeggen bijvoorbeeld tegen allerlei dieren ‘hond’, omdat de semantische eigenschappen die ze hebben afgeleid alleen [+vier poten] en [+harig] zijn. Er is veel kritiek gekomen op deze hypothese. De voorspellingen die Clark deed op basis van haar hypothese bleken niet uit te komen. Overextensies kwamen bijvoorbeeld minder vaak voor dan dat het model voorspelt. Het model was te simplistisch om woordenschatverwerving te verklaren. Functional Core Hypothesis – Nelson Volgens Nelson (1974, in Dromi, 1987) worden objecten waargenomen als functioneel geheel. Kinderen besluiten tot welke categorie een woord behoort op basis van deze functie. Ze kijken dus wat ze met een object kunnen doen. Een kind vormt een functioneel kernconcept, waarin alle objecten hiërarchisch worden gerangschikt. Volgens Nelson is functionele informatie voor een kind belangrijker dan bijvoorbeeld perceptuele informatie. Op basis van de functie van een object vormt het kind een categorie en op basis van perceptie kunnen objecten in een categorie geplaatst worden. De eerste woorden die kinderen leren zijn dan ook namen voor dingen die kunnen bewegen of die ze zelf kunnen manipuleren. Ook op deze theorie is veel kritiek geweest. Zo zei Bowerman (1978, in Dromi, 1987) dat de theorie alleen de verwerving van objectwoorden kon verklaren. Bovendien bleken niet alle woorden in actiecontext verworven te worden. Ook vond Bowerman bij 27 haar dochters voorbeelden van overextensies die gemaakt waren op basis van perceptuele eigenschappen in plaats van functionele. Ook Nelsons aanname dat functies opvallender zijn dan vormeigenschappen wordt bekritiseerd. Gentner (1982, in Dromi, 1987) zegt dat formele eigenschappen veel gedifferentieerder, constanter en beter te onderscheiden zijn. Vorm en functie zijn bovendien vaak met elkaar verbonden. Prototype Model – Bowerman Volgens deze theorie leren jonge kinderen als betekenis van een woord in eerste instantie de prototypische referent van dat woord. Dit is het beste, meest typische voorbeeld van een bepaalde categorie. Het kind generaliseert het woord naar andere referenten die eigenschappen delen met het prototype. Deze theorie kan het verschijnsel verklaren dat referenten die niet precies dezelfde eigenschappen hebben, toch tot dezelfde categorie kunnen behoren. Niet alle leden van één categorie hebben dezelfde eigenschappen, maar ze delen allemaal eigenschappen met het prototype. Je kunt spreken van verschillende gradaties in lidmaatschap, omdat woorden in meerdere of mindere mate kunnen lijken op het prototype. De theorie verklaart de aanwezigheid van onderextensies als volgt: de kans dat een referent met een bepaald woord wordt aangeduid, wordt bepaald door het aantal eigenschappen dat de referent gemeen heeft met het prototype. Dat wil zeggen dat de referenten die meer afwijken van het prototype eerder worden weggelaten. Het kind gebruikt het woord dan niet voor bepaalde referenten, terwijl dat wel zou moeten, omdat deze referenten niet genoeg eigenschappen gemeen hebben met het prototype. Problemen met deze theorie zijn er volgens Barrett (1995) vooral vanwege een gebrek aan consensus over wat precies een prototype is. Verder kan ook deze theorie bepaalde verschijnselen, zoals contextgebonden woorden, niet verklaren. Word-Referent Pairing Model – Schlesinger Het model van Schlesinger (1982, in Dromi, 1987) is heel anders dan de tot dusverre besproken theorieën. Volgens Schlesinger worden alle woorden gekoppeld aan enkele referenten en op die manier opgeslagen in het geheugen. Door herhaaldelijke ervaring zal het kind uiteindelijk overeenkomsten ontdekken tussen de referenten die gekoppeld zijn aan hetzelfde woord. De overgang naar het benoemen van een categorie vindt plaats als er sprake is van een conflict tussen de koppeling van referent en woord die het kind in het hoofd heeft, en een nieuwe naam die de ouder hiervoor geeft. Het kind gaat dan 28 kijken naar de verschillen tussen de referenten. Het gevonden verschil zal een positieve cue zijn voor het ene woord en een negatieve cue voor het andere woord. De onderliggende categorie noemt Schlesinger protoverbal elements. Deze elementen bestaan bij volwassenen uit enerzijds een interne representatie van gepaarde referenten en anderzijds een verzameling cues die zijn ontwikkeld door ervaring met het woord en de referenten. Event Representation Theory – Nelson Dit is een latere theorie van Nelson dan de Functional Core Hypothesis. Volgens deze theorie bouwen kinderen kennis op van herhaaldelijk terugkerende gebeurtenissen in hun dagelijks leven. Daar vormen ze een mentale representatie van. Deze is holistisch, dus niet geanalyseerd. Als de eerste woorden verschijnen, dan worden deze in eerste instantie op deze representaties als geheel ‘geplakt’. Deze woorden zijn dus contextgebonden ofwel sociaal-pragmatisch. Tijdens het tweede levensjaar zal het kind de gebeurtenisschema’s gaan analyseren en concepten gaan vormen. Er vindt dan decontextualisatie plaats. Bovendien zal dit leiden tot het ontstaan van een groot aantal concepten: een woordenschatspurt. Problemen met deze theorie zijn het feit dat de eerste woorden niet altijd contextgebonden of sociaal-pragmatisch zijn, maar vaak ook al direct referentieel. Verder vertonen niet alle kinderen een woordenschatspurt (zie paragraaf 2.5). Multiroute Model – Barrett Volgens Barrett zijn er twee verschillende routes die gevolgd kunnen worden bij woordenschatverwerving. Contextgebonden en sociaal-pragmatische woorden worden verbonden met gebeurtenisschema’s. Referentiële woorden worden verbonden met mentale representaties van prototypische referenten. Er zijn dus twee soorten interne representaties waar kinderen gebruik van kunnen maken. Het model lijkt dus een combinatie van de Event Representation Theory en de Prototype Theory. In dit model is wel plaats voor decontextualisatie. Dit gebeurt namelijk als het onderliggende gebeurtenisschema wordt verdeeld in verschillende componenten en de juiste component die hoort bij het woord eruit wordt gehaald. Ook de referentiële woorden kunnen veranderingen ondergaan volgens het model. Een kind gebruikt eerst alleen woorden die sterk lijken op het prototype. Daarom is er eerst vaak sprake van onderextensie. Vervolgens worden de woorden toegepast op meerdere 29 referenten en kunnen er overextensies ontstaan. Deze veranderingen treden op, omdat het kind gaat analyseren wat de eigenschappen van het prototype zijn. Toch is Barrett van mening dat ook dit model de woordenschatverwerving niet compleet kan verklaren. Volgens hem kunnen uitingen van affectie niet met het model verklaard worden. Deze zouden niet de route volgen van externe gebeurtenissen en ook niet die van prototypische referenten, maar deze zouden verbonden moeten worden met een interne toestand van het kind. Ook is het niet zeker of alle referentiële woorden binnen het model passen. Barrett denkt dan met name aan woorden die betrekking hebben op eigenschappen, kwaliteiten en toestanden van objecten, acties en gebeurtenissen. Lexical Contrast Theory - Clark Clark heeft naar aanleiding van de kritiek een nieuw model ontwikkeld, de Lexical Contrast Theory. Ze gaat uit van twee principes: contrast en conventionaliteit. Contrast wil zeggen dat sprekers alle vormverschillen aangrijpen om een betekenisverschil te markeren. Kinderen nemen aan dat elk nieuw woord een andere betekenis heeft dan de woorden die ze al kennen. Conventionaliteit wil zeggen dat sprekers verwachten dat er voor bepaalde betekenissen een vorm is die gebruikt wordt in de taalgemeenschap (Clark, 1993). Volgens Dromi (1987) volgt uit deze hypothese dat de conceptuele ontwikkeling voorafgaat aan de woordverwerving. Pas als een concept is verworven, kan het bijbehorende woord worden verworven. Overextensies worden verklaard als een poging van het kind om te communiceren. Een bepaald woord wordt dus verkeerd gebruikt, omdat het kind het juiste concept nog niet verworven heeft. Barret (1995) meent dat dit model niet alle verschijnselen kan verklaren die betrokken zijn bij taalverwerving. Clark gebruikt het model vooral om latere lexicale ontwikkeling, vanaf ongeveer twee jaar, te verklaren. Sentence-to-world pairing - Gleitman Ook Gleitman (1994) heeft een theorie over woordenschatverwerving. Veel onderzoekers gaan ervan uit dat kinderen moeten ontdekken dat een bepaald woord vaker wordt gebruikt als er een bepaald concept aanwezig is en veel minder vaak als dat concept niet aanwezig is. Gleitman is het daar echter niet mee eens. De traditionele theorieën, zoals zojuist beschreven, gaan volgens haar uit van word-to-world pairing. Kinderen moeten het woord dat ze horen koppelen aan iets wat ze in de wereld om zich heen zien. 30 Deze verklaring voldoet niet voor de verwerving van werkwoorden. Die verwerving gaat volgens Gleitman door middel van sentence-to-world pairing. Ze zegt dat in het vroege vocabulaire van kinderen er meestal weinig werkwoorden voorkomen. Dat is het geval omdat kinderen kennis moeten hebben van de structuur van zinnen in hun moedertaal. Het kost tijd voordat het kind deze kennis heeft verworven. Ook zijn veel verba niet waarneembaar, dus ze zijn veel minder concreet voor kinderen. Bovendien gebeurt het labelen van objecten meestal gelijktijdig met het wijzen naar of het vasthouden van een object. Bij werkwoorden vindt het uitspreken van het woord meestal voor of na de gebeurtenis plaats. Daarom is word-to-world pairing bij werkwoorden vaak problematisch. Lederer et al. (1991, in Gleitman, 1994) hebben een experiment uitgevoerd waarin 50 volwassen proefpersonen keken naar gesprekken van moeders met hun kind van achttien maanden oud. Sommige proefpersonen zagen de films zonder geluid. Een tweede groep kreeg alleen te horen welke nomina er door de moeders werden gezegd (ze kregen dus geen video te zien). De derde groep kreeg de lijst zinnen te zien die de moeders geproduceerd hadden, maar alle nomina en verba waren omgezet in nonsenswoorden, bijvoorbeeld Rom GORPS that the rivenflak is grum, can vany GORP the blicket? De proefpersonen moesten zeggen welk werkwoord door de moeders werd geproduceerd. Voor de eerste groep bleek dit erg moeilijk te zijn. Slechts 7% van de pogingen was correct. De tweede groep behaalde een score van 13% correct. De derde groep deed het het beste: 52% correct. Hieruit blijkt dus ook dat de betekenis van werkwoorden moeilijk uit de context is af te leiden. Een stuk makkelijker is het als er syntactische informatie wordt gegeven. Dit betekent echter niet dat men alleen op syntactische informatie let bij het leren van werkwoorden. Als de proefpersonen bijvoorbeeld zowel de nomina wisten als de frames te zien kregen, dan werd een score van 75% behaald. Als vervolgens ook het beeld werd getoond, dan was de werkwoordsidentificatie bijna perfect. Dus alleen visuele informatie en informatie over nomina is niet voldoende om werkwoorden te leren. Syntactische informatie is veel informatiever. Een combinatie van de verschillende soorten informatie werkt echter het beste bij het leren van werkwoorden. 31 2.7 Noun bias Veel onderzoekers gaan ervan uit dat kinderen bepaalde aangeboren eigenschappen hebben als het gaat om taalverwerving. De noun bias is daar een van. Men neemt hierbij aan dat kinderen een conceptuele predispositie hebben dat woorden betrekking hebben op objecten (Tardif et al., 1999). Nomina zouden daarom vroeg verworven moeten worden. Uit verschillend onderzoek blijkt dat Engelse kinderen meer nomina hebben dan werkwoorden of andere woordsoorten in hun vroege lexicon. Nelson (1973) bijvoorbeeld toonde aan dat meer dan de helft (65%) van de eerste 50 woorden die haar proefpersonen produceerden, nomina waren. 13% waren actiewoorden. Ook uit het onderzoek van Bates et al. (1994) blijkt dat nomina het eerst worden verworven. Wel heeft onderzoek aangetoond dat er veel individuele variatie bestaat. Zoals in paragraaf 2.4.1 is besproken zijn er ook kinderen die de nadruk leggen op sociale woorden en formules, de expressieve kinderen. Toch hebben ook zij een groot aantal nomina in hun vocabulaire. Dit verschil tussen nomina en werkwoorden in het vroege lexicon van Engelse kinderen kan volgens Sandhofer et al. (2000) op twee manieren verklaard worden. Ten eerste kunnen kinderen met hun vroege vocabulaire de input reflecteren. Dat wil zeggen dat ze meer nomina horen en dus ook meer nomina produceren. Het zou echter ook kunnen dat kinderen van nature geneigd zijn om namen voor dingen te leren, voordat ze relaties tussen dingen kunnen benoemen. Volgens Gentner (1982, in Sandhofer et al., 2000) kan de eerste oorzaak niet de juiste zijn. Volgens haar vormen werkwoorden in de input een relatief klein aantal types (dat wil zeggen het aantal verschillende woorden), maar een groot aantal tokens (het totaal aantal woorden). Nomina zouden juist een groot aantal types en een klein aantal tokens representeren. Het zou dus logischer zijn als kinderen eerder werkwoorden dan nomina zouden leren, omdat vaker hetzelfde werkwoord geproduceerd wordt in de input. Dit is niet het geval en om dat te verklaren heeft Gentner de Natural Partition Hypothesis geformuleerd. Volgens deze hypothese komen nomina toch vaker voor in de vroege woordenschat, omdat objectcategorieën perceptueel eenvoudiger zijn dan de categorieën van andere woordsoorten. De semantische structuren die ten grondslag liggen aan werkwoorden zijn complexer dan de structuren die de betekenis van nomina definiëren. Objecten zijn concreet en tastbaar en daarom makkelijker te leren. Gentner geeft dus een cognitieve verklaring voor het feit dat werkwoorden laat worden verworven. 32 Gentner (1988, in Gentner & Boroditsky, 2001) heeft ook de zogenaamde Division of Dominance gedefineerd, een continuüm waarop de verschillende woordsoorten zijn gerangschikt. Aan de ene kant van het continuüm bevinden zich de woorden van de open klasse en aan de andere kant die van de gesloten klasse. Volgens Gentner is er sprake van verschillende gradaties waarin woorden kunnen behoren tot de open of gesloten klasse. In figuur 1 staat het continuüm afgebeeld. De meest ‘open’ woorden zijn dus eigennamen en de meest ‘gesloten’ woorden zijn lidwoorden en voegwoorden. Division of Dominance cognitive dominance linguistic dominance open class proper names concrete nouns Ida dog spoon closed class kinship terms & other relational systems grandmother uncle verbs skate enter spatial prepositions on over determiners conjunctions the and Figuur 1: Division of Dominance (Gentner & Boroditsky, 2001) Gentner baseert haar voorspelling dat nomina eerder worden verworven dan verba op twee hypotheses die voortkomen uit de Division of Dominance. De eerste, de Natural partitions hypothesis, is hiervoor al genoemd. De tweede is de Relational relativity hypothesis. Volgens deze hypothese is de betekenis van relationele termen afhankelijk van het linguïstische systeem en daarom verschilt deze per taal. Volgens Gentner is er sprake van cognitieve dominantie bij vroege woordenschatverwerving. Pas later wordt linguïstische dominantie belangrijk. De nomina aan de ene kant van het continuüm komen in alle talen voor, omdat ze door iedereen als geheel kunnen worden waargenomen. Werkwoorden en preposities worden 33 linguïstisch gespecificeerd. Om deze termen te leren moet men wat van de taal weten. Deze woorden zullen dus later verworven worden. Kinderen moeten woorden uit de spraak om zich heen verbinden met referenten die ze kennen. Zij hebben al concrete objecten geïdentificeerd in de wereld voordat ze deze konden benoemen. Het correcte label is alleen nog niet gevonden. Voor verba is dit niet het geval. Weliswaar worden relaties al vroeg waargenomen, maar deze moeten worden samengevoegd tot referentiële eenheden. Ook Dromi (1987) heeft in het onderzoek naar haar dochter ontdekt dat nomina het grootste deel vormden van haar eenwoordsuitingen, namelijk 61%. Werkwoorden vormden 13% van de woordenschat. Dit onderzoek ging over het Hebreeuws en niet over het Engels, zoals de hiervoor genoemde onderzoeken. Dromi is het echter niet eens met Gentners conclusie dat cognitieve eigenschappen de noun bias verklaren. Volgens haar zijn er linguïstische verklaringen. Zo uitte haar dochter al vanaf jonge leeftijd actieconcepten. Zij deed dit echter met behulp van nomina of sociale woorden. Ze gebruikte bijvoorbeeld het woord pipi (urine) voor de po, het toilet, een onaangekleed deel van het lichaam, alle natte of vieze objecten en de handeling van het uitdoen van kleding. Zo gauw haar dochter werkwoorden ging gebruiken, deed ze dit op de correcte manier en consistent. De werkwoorden werden niet gebruikt voor andere woordsoorten, zoals in eerste instantie wel gebeurde met de nomina. Uit ander onderzoek blijkt echter dat de noun bias niet universeel is. Kinderen die Koreaans (Gopnik & Choi, 1995, in Caselli et al., 1995) of Mandarijn Chinees (Tardif, 1996) leren, blijken niet in het patroon te passen. Tardif (1996) meldt dat er verschillende factoren zijn die invloed hebben op de noun bias. Het is bijvoorbeeld de vraag wanneer de bias precies voorkomt. Misschien is het wel zo dat er alleen sprake is van een noun bias tijdens de woordenschatspurt (zie paragraaf 2.5). Dan worden namelijk vooral nomina verworven (Goldfield & Reznick, 1990). Uit ander onderzoek (Choi & Gopnik, 1995) blijkt echter dat Koreaanse kinderen ook een woordenschatspurt doormaken, maar zij verwerven juist vooral verba. Ook blijkt er een verschil te kunnen ontstaan naar aanleiding van de manier waarop de gegevens voor onderzoek verzameld worden. Volgens Tardif (1996) leidt het gebruik van ouderrapportage tot een overmatige rapportage van nomina. Men gaat ervan uit dat inputfactoren een belangrijke rol spelen bij de aanwezigheid van een noun bias. Deze kunnen per taal verschillen en dat zou het verschil in de 34 aanwezigheid van de noun bias kunnen verklaren, dat tussen verschillende talen wordt gevonden. De volgende factoren zijn van belang (Tardif et al., 1997): • Frequentie Woorden die vaker voorkomen in de input worden eerder geleerd. Hiermee hangt samen een verschil tussen pro-drop talen en niet pro-drop talen. Bij prodrop talen is het subject niet verplicht en kan dus worden weggelaten. Werkwoorden worden niet weggelaten en komen dus vaker voor. • Saillantie / Positie in de uiting Woorden die aan het begin of einde van een uiting staan, zijn opvallender dan woorden die in het midden staan. Een pro-drop taal die als woordvolgorde SVO heeft, zal vaak een werkwoord aan het begin van de uiting hebben staan. Ook talen met een flexibele woordvolgorde zullen vaker werkwoorden aan het begin of eind van een uiting hebben. • Morfologische transparantie Als werkwoorden veel morfologische inflecties bevatten, dan zijn ze moeilijker te leren. Ook de aanwezigheid van veel onregelmatige inflecties zorgt ervoor dat werkwoorden moeilijker te leren zijn. In het Engels worden nomina slechts vervoegd voor getal (enkelvoud of meervoud). Werkwoorden daarentegen worden vervoegd voor persoon, getal en tijd. Ze zijn daarom veel complexer. In bepaalde talen zijn werkwoorden en nomina even morfologisch complex. Er zal dan niet veel verschil moeten zijn tussen het leren van beide woordsoorten. • Pragmatiek Een hypothese van Tardif (1996) was dat de ouders van kinderen die Mandarijn leren niet zo vaak de taalspelletjes spelen die Engelse ouders doen. Engelse (en ook Nederlandse) ouders lokken namen van objecten uit bij hun kinderen door te vragen: “Wat is dat?” Misschien dat ouders uit andere culturen meer gericht zijn op acties dan op objecten. Ook kunnen Engelse en Chinese ouders volgens Tardif et al. (1997) verschillen wat betreft het antwoord dat ze verwachten op hun vragen. Engelse ouders vragen: “Do you want to drink some more juice?” De kinderen antwoorden daarop met “More” of “Juice” of “Yes”. In het Mandarijn antwoorden kinderen op zo’n vraag met “Want” of “Drink”, oftewel een werkwoord. 35 Tardif et al. (1997) hebben, net als Gentner, gekeken naar het aantal types en tokens in de input van Engelse, Italiaanse en Mandarijn-Chinese kinderen. Daaruit bleek dat Engelse ouders ongeveer evenveel nomina als verba types produceerden. De Chinese ouders produceerden meer verba types dan nomina types. Voor de Italiaanse ouders was het verschil niet significant. Wat betreft de tokens produceerden de ouders uit alle drie de landen meer verba tokens dan nomina tokens. De Chinese ouders produceerden echter meer verba tokens dan zowel de Italiaanse als de Engelse ouders. De Engelse en Italiaanse kinderen in dit onderzoek bleken een trend te vertonen om meer nomina types en tokens te produceren dan verba. De Chinese kinderen produceerden significant meer verba types en tokens dan nomina. Kim et al. (2000) hebben onderzoek gedaan naar Engelse en Koreaanse kinderen. Koreaanse kinderen hoorden hun ouders meer verba types gebruiken. Deze verba waren fonologisch en morfologisch opvallender dan de nomina. Ook werden de verba op zo’n manier gebruikt dat de kinderen makkelijk konden afleiden waarnaar verwezen werd. De vocabulaires van de Koreaanse kinderen bevatten dan ook een grotere proportie verba dan die van de Engelse kinderen. De Koreaanse kinderen hadden echter wel, net als de Engelse kinderen, meer nomina dan verba in hun vocabulaire. Bornstein et al. (2004) hebben de woordenschat van 269 kinderen van twintig maanden oud, afkomstig uit zeven verschillende landen onderzocht. Zij hebben dit gedaan aan de hand van een woordenlijst waarop de ouders de woorden moesten aanstrepen die hun kind produceerde. De talen die zijn onderzocht zijn: Spaans, Nederlands, Frans, Hebreeuws, Italiaans, Koreaans en Amerikaans-Engels. Uit dit onderzoek blijkt dat alle moeders meer nomina aanstreepten dan verba. Ook meldden alle moeders meer nomina dan adjectiva en meer nomina dan woorden uit de gesloten klasse. Ook Goldfield (2000) heeft de noun bias onderzocht. Zij vond dat moeders even veel nomina als verba types gebruikten en meer verba dan nomina tokens tegen hun kinderen. Qua pragmatiek waren de moeders echter gericht op nominaproductie. Meer dan een derde van de uitingen van de moeders waren gericht op het leiden van het gedrag van het kind. Met behulp van werkwoorden werd dus aangegeven dat het kind een actie moest beginnen of beëindigen. Begrip van werkwoorden is dus belangrijker dan productie ervan. Zij concludeert dan ook dat ouders kinderen expliciet aanmoedigen om nomina te produceren en impliciet van hen verwachten dat ze werkwoorden begrijpen. 36 In de hiervoor beschreven onderzoeken is te zien dat er verschillende resultaten zijn verkregen wat betreft de aanwezigheid van een noun bias. Tardif et al. (1999) hebben naar aanleiding van deze resultaten besloten om twee onderzoeksmethodes te vergelijken: observatie van de spontane taal en woordenlijsten (ouderraportage). Ook hebben ze drie soorten contexten onderzocht waarin het kind werd geobserveerd: een plaatjesboek werd beschouwd als context waarin nomina worden uitgelokt, mechanisch speelgoed (bewegende speeltjes) zou verba uitlokken en gewoon speelgoed (blokken, knuffelbeesten en dergelijke) zou de neutrale conditie vormen. Tardif et al. hebben Engelse en Mandarijn-Chinese kinderen vergeleken. Zowel de Engelse als de Chinese kinderen produceerden meer nomina dan verba bij het lezen van het boek. In de andere twee condities produceerden beide groepen meer verba dan nomina, maar de verschillen waren niet significant. Het onderzoek met behulp van de ouderraportage leverde een hogere ratio nomina ten opzichte van verba op voor de Engelse kinderen, vergeleken met de Chinese kinderen. Beide groepen kinderen vertoonden een noun bias, maar voor de Chinese kinderen was deze minder groot. Bovendien vertoonden niet alle Chinese kinderen de noun bias. Tardif concludeert dat nomina blijkbaar een belangrijke woordsoort vormen voor jonge kinderen, maar dat de hoeveelheid van de nomina en de aanwezigheid van een noun bias in grote mate afhangt van verschillende factoren, zoals het gebruik van een bepaalde methode en de context waarin men onderzoekt. Ook in het huidige onderzoek zal worden gekeken naar de aanwezigheid van een noun bias. Onderzocht zal worden welke woordsoorten het meest voorkomen. Evenals Tardif et al. (1997) hebben gedaan, zal geprobeerd worden om de resultaten in verband te brengen met eigenschappen van de Marokkaans-Arabische en de Nederlandse taal (zie hierover ook paragraaf 4.4 en 4.5). 2.8 Tweetalige taalverwerving Het onderzoek dat in deze scriptie wordt uitgevoerd gaat over jonge tweetalige kinderen in Nederland. De mate van tweetaligheid kan echter sterk verschillen per kind. Er zijn kinderen die vanaf de geboorte zowel Marokkaans-Arabische als Nederlandse input hebben gekregen. Andere kinderen zijn Marokkaans-Arabisch opgevoed door hun ouders en hebben pas op wat latere leeftijd het Nederlands gehoord. Het criterium om 37 mee te doen aan het onderzoek was dat Marokkaans-Arabisch de belangrijkste taal moest zijn die tegen het kind werd gesproken. Er kan een onderscheid worden gemaakt tussen Bilingual First Language Acquisition en Bilingual Second Language Acquisition (De Houwer, 1995). De eerste term verwijst naar het verwerven van twee of meer talen vanaf de geboorte, of maximaal een maand na de geboorte. De andere gevallen worden door De Houwer BSLA genoemd. Het onderscheid is belangrijk, aangezien er in het geval van BFLA een vergelijking met eentalige kinderen gemaakt kan worden, omdat de taalverwerving plaatsvindt vanaf de geboorte. Andere termen die gebruikt worden zijn respectievelijk ‘simultane taalverwerving’ en ‘successieve taalverwerving’. In dit onderzoek kunnen zowel kinderen voorkomen die een simultane taalverwerving hebben, als kinderen die een successieve taalverwerving hebben. Volgens Romaine (1989, in De Houwer, 1995) spelen de volgende drie aspecten een belangrijke rol bij tweetalige taalverwerving: 1. De taal die de ouders spreken met het kind. 2. De moedertaal van de ouders. 3. De dominante taal die in het land of de streek wordt gesproken. Het is echter de vraag of die meerderheidstaal in dit geval wel zo belangrijk is. Jonge kinderen komen die meerderheidstaal waarschijnlijk niet zo vaak tegen, aangezien ze nog niet naar school gaan en geen formele zaken hoeven af te handelen. Voor kinderen is het belangrijk wat de taal is die de mensen om hem of haar heen spreken. Vaak wordt de one person / one language strategie gezien als de beste methode om kinderen tweetalig op te voeden. Hierbij gebruikt de ene ouder alleen taal A met het kind en de andere ouder alleen taal B. Niet alle onderzoekers zijn het er echter mee eens dat dit de beste aanpak is. Een zeer belangrijke kwestie in het onderzoek naar tweetalige taalverwerving is de vraag of een tweetalig kind begint met een enkel systeem of twee gescheiden systemen in het hoofd. Volterra & Taeschner (1978, in De Houwer, 1995) hebben een model ontwikkeld dat bestaat uit drie stadia. In het eerste stadium hebben tweetalige kinderen een ongedifferentieerd linguïstisch systeem met woorden uit beide talen. In het tweede stadium hebben ze een ongedifferentieerd grammaticaal systeem; ze passen dus dezelfde syntactische regels toe op beide talen. In het derde stadium zijn de talen gescheiden. Men is nu echter van mening dat dit model niet overeenkomt met de werkelijkheid. Er is door verschillende onderzoekers bewijs gevonden dat jonge kinderen wel degelijke crosslinguïstische equivalenten gebruiken. Bovendien kan het 38 ontbreken van een woord in taal A, maar niet in taal B net zo goed wijzen op het afwezig zijn van dat woord in de input. Een theorie die samenhangt met het model van Volterra & Taeschner is Clarks Principle of contrast. Volgens dit principe zouden kinderen ervan uit gaan dat elk woord een andere betekenis moet hebben. Ze gebruiken dus het woord van die taal voor een referent, waarin ze het voor het eerst hebben geleerd. Dit zou doorgaan tot kinderen een vocabulaire van ongeveer 150 woorden hebben verworven (Clark, 1987, in Pearson et al., 1995). Jonge kinderen blijken echter wel al te beschikken over equivalenten in beide talen. Pearson et al. (1995) vonden dat gemiddeld 30% van alle woorden een translation equivalent (dus een begrip dat in twee talen wordt geproduceerd) is, zowel bij kinderen met een vocabulaire van 2-12 woorden, als kinderen met een vocabulaire tot 500 woorden. Ook uit de resultaten van dit scriptieonderzoek (zie hoofdstuk 6) zal blijken dat ook de jonge proefpersonen van het sample vaak woorden in zowel het MarokkaansArabisch als in het Nederlands produceren. Men gaat er over het algemeen vanuit dat tweetalige taalverwerving hetzelfde verloopt als eentalige taalverwerving. De Houwer somt vele onderzoeken op waarin eentalige en tweetalige kinderen worden vergeleken, en komt tot de conclusie dat men vooral overeenkomsten heeft gevonden en geen verschillen. Beide groepen kinderen maken dezelfde soorten fouten en gebruiken dezelfde structuren in dezelfde ontwikkelingsstadia. Een andere belangrijke kwestie is of het goed of slecht is voor een kind om tweetalig op te groeien. Volgens Appel & Vermeer (2000) kan ‘subtractieve tweetaligheid’ voor problemen zorgen. Er is sprake van subtractieve tweetaligheid als de eerste taal niet voldoende wordt ondersteund. Dit is soms het geval bij minderheidsgroepen die een sociaal minder gewaardeerde taal leren. Dit kan namelijk leiden tot ‘dubbel semilingualisme’, waarbij men twee talen op een laag niveau beheerst. Dit kan bijvoorbeeld het geval zijn bij het Marokkaans-Arabisch, een minderheidstaal in Nederland. Als beide talen voldoende worden ondersteund dan kan tweetaligheid een positief effect hebben. Tweetalige kinderen leren bijvoorbeeld eerder dat de relatie tussen woorden en hun referenten arbitrair is. Appel & Vermeer geven aan dat uit het meeste onderzoek blijkt dat tweetalige kinderen voor beide talen iets achter liggen op eentalige kinderen. Dit is bijvoorbeeld het geval 39 voor de woordenschat. De woordenschat voor elke taal apart is kleiner, maar als alle woorden bij elkaar worden opgeteld, dan is het vocabulaire meestal groter. Appel & Vermeer halen onderzoek aan van Narain & Verhoeven (1994) waaruit blijkt dat de meeste allochtone kinderen een dominantie in de eigen taal hebben als ze naar de basisschool gaan. Voor Turkse kinderen duurt die dominantie tot ongeveer tien jaar, bij Antilliaanse kinderen tot ongeveer vijf jaar. Marokkaanse kinderen zitten er tussenin. Junker & Stockman (2002) hebben de zogenaamde Bilingualism deficit hypothesis onderzocht. Dit is de opvatting dat tweetalige sprekers zwakkere taalleerders zijn aangezien het tegelijkertijd leren van twee talen meer informatieverwerking vereist van de taalleerder. De cognitieve bronnen moeten verdeeld worden over twee talen, dus gaat de taalverwerving langzamer. Verschillende onderzoekers hebben echter aangetoond dat tweetalige kinderen alleen een achterstand hebben als slechts een van beide talen wordt onderzocht. Pearson et al. (1993) concluderen dat het patroon van lexicale ontwikkeling in de twee talen bij tweetalige kinderen erg lijkt op de groei bij eentalige kinderen. Ze zijn niet langzamer in woordenschatproductie dan eentalige kinderen. Wat betreft begrip zijn ze zelfs beter. Daarom moet bij het ontwikkelen van normen rekening gehouden worden met beide talen. 40 3. Tweetalige Lexilijst 3.1 Rescorla’s Language Development Survey De tweetalige Lexilijst is een taalscreeningsinstrument dat ontwikkeld is voor jonge anderstalige kinderen in Nederland. Het is een bewerking van de Lexilijst Nederlands van dr. Liesbeth Schlichting. Deze lijst is weer gebaseerd op de Language Development Survey van Rescorla (1989). Rescorla heeft de Language Development Survey (LDS) ontwikkeld om taalachterstand te kunnen detecteren bij kinderen van ongeveer twee jaar oud. Volgens Rescorla (1989) waren er geen gebruiksvriendelijke instrumenten voor kinderen van deze leeftijd. De meeste gestandaardiseerde taaltests namen veel tijd in beslag, aangezien ze afgenomen moesten worden door een logopedist of spraak-/taalpatholoog. Ook waren er enkele andere problemen, bijvoorbeeld met de sensitiviteit van het instrument. Dat wil zeggen dat kinderen met lichte problemen vaak niet werden opgemerkt. Een ander probleem was dat aan ouders wel werd gevraagd of hun kind een vocabulaire van 50 woorden had, maar aan hen werd niet gevraagd deze woorden ook te noemen. Rescorla besloot daarom zelf een instrument te ontwikkelen, de Language Development Survey. Dit is een instrument dat werkt met ouderrapportage. Het instrument bestaat uit een lijst met woorden en een aantal vragen over de productie van woordcombinaties. De woorden die op de lijst staan, zijn gekozen naar aanleiding van onderzoek naar woordenschatontwikkeling. De lijst is verdeeld in verschillende semantische categorieën waarin woorden staan die met een hoge frequentie voorkomen in het vocabulaire van jonge kinderen, maar ook woorden die minder frequent zijn. De LDS is enkele keren herzien en bevat nu 309 woorden verdeeld over veertien semantische categorieën. Het is de bedoeling dat ouders de woordenlijst nagaan en aanstrepen welke woorden hun kind produceert. Verder moeten ze drie voorbeelden van de langste woordcombinaties die het kind heeft geproduceerd opschrijven. 41 3.2 Validiteit en betrouwbaarheid van ouderraportage Door verschillende onderzoekers is gekeken naar de betrouwbaarheid van instrumenten die gebruik maken van ouderrapportage. Er zijn verschillende voordelen aan ouderrapportage. Zo is het gebruik van dergelijke instrumenten goedkoop en snel. Bovendien is het niet storend voor de ouders of de kinderen. Ouders zijn beter ingesteld op wat hun kinderen zeggen, omdat ze hen dagelijks in verschillende contexten observeren. Ze verstaan hun eigen kind ook beter dan vreemden dat kunnen. Factoren als gezondheid of aandacht van het kind hebben bij ouderrapportage ook geen invloed, zoals dat wel het geval is bij gestandaardiseerde tests of spontane taalanalyses (Pan et al., 2004). Er zijn echter onderzoekers die twijfelen aan de validiteit van ouderrapportage. Bates et al. (1994) melden bijvoorbeeld enkele nadelen aan het gebruik van ouderrapportage: men kan niets zeggen over de fonologische ontwikkeling en ook niet over de frequentie waarmee de kinderen een bepaald woord gebruiken. Verder weet men niet of woorden alleen imitaties zijn of dat ze in spontane taal gebruikt worden en men weet niets over de context. Een groot nadeel dat Dale (1991) noemt is dat ouders misschien niet nauwkeurig kunnen rapporteren, omdat ze geen training hierin hebben gehad. Bovendien speelt trots een grote rol, waardoor ze de neiging kunnen hebben hun eigen kind te overschatten. Een ander nadeel van de Lexilijst, dat niet zozeer met ouderrapportage te maken heeft, maar eerder met het gebruik van dergelijke lijsten, is dat niet duidelijk is hoe de kinderen de woorden gebruiken. Misschien gebruiken kinderen bijvoorbeeld wel het woord ‘bal’, maar doen ze dit voor alle ronde objecten, bijvoorbeeld voor appels, de maan en wielen. De referentie klopt dan dus niet. De vraag is echter of dit erg is als men puur naar de productie van woorden kijkt. Pan et al. hebben gekeken naar de correlaties tussen een instrument dat werkt met ouderrapportage, spontane taalanalyse en gestandaardiseerde taaltests. Ze werkten met de MacArthur Communicative Development Inventories als instrument voor de ouder. Dit is een variant op de LDS. De CDI is een lijst die ontwikkeld is door Fenson et al. (1994) om de communicatieve vaardigheden van jonge kinderen vast te stellen. Er is een lijst voor kinderen tussen de 8 en 18 maanden (Infant form) en een voor kinderen tussen de 16 en 30 maanden (Toddler form). De Infant form meet woordbegrip, woordproductie en gebaren bij heel jonge kinderen. Het wordt ook de Words and Gestures Scale genoemd. De lijst bestaat uit 396 42 woorden in negentien semantische categorieën. De ouder moet aangeven of het kind (a) het woord begrijpt en (b) het woord begrijpt en produceert. Verder is er een lijst met 63 communicatieve en/of symbolische gebaren (Bates et al., 1994). De Toddler form meet woordproductie en enkele aspecten van de grammatica bij iets oudere kinderen. Deze schaal wordt de Words and Phrases Scale genoemd. Deze lijst bestaat uit 680 woorden in 22 categorieën, waarvan de ouder alleen moet aangeven of het kind ze produceert. Ouders blijken namelijk het woordbegrip van hun kind niet meer te kunnen bijhouden na de leeftijd van 1;4 (Bates et al., 1994). Het tweede deel van de Toddler form bestaat uit enkele vragen over de grammatica. Ouders moeten de drie langste uitingen van hun kind opschrijven. Bovendien staan er 37 zinsparen die op één punt in de grammatica van elkaar verschillen, bijvoorbeeld “Kitty sleeping” versus “Kitty is sleeping”. Ouders moeten aangeven welke zin het kind waarschijnlijk zou gebruiken (Bates et al., 1994). Uit de resultaten blijkt dat alle verschillende taalmaten die door Pan et al. zijn getest, significante positieve correlaties met elkaar vertonen. Deze correlaties varieerden van .35 tot .91. De hoogste correlatie (.91) was echter tussen de correlatie tussen het aantal types en het aantal tokens, twee taalmaten van de spontane taalanalyse. Het ouderrapportagemiddel dat gebruikt werd, was de CDI. Deze correleerde significant en positief met het aantal types (.49) en het aantal tokens (.35), de twee taalmaten van de spontane taalanalyse. Met de twee taaltests waren de correlaties .54 (met de Bayley language factor) en .50 (met de PPVT, een receptieve taaltest). De correlaties zijn dus niet zo hoog. Ook hebben Pan et al. gekeken naar de voorspellingen die men kan doen op basis van dergelijke taalmaten over het receptieve vocabulaire van dezelfde kinderen een jaar later (met 3;0 jaar). Hun onderzoek is uitgevoerd met proefpersonen uit gezinnen met een laag inkomen. Gedeeltelijk waren dit proefpersonen uit een etnische minderheidsgroep. Ook deze predictieve validiteit was aanwezig: alle taalmaten voorspelden de receptieve vocabulairescores een jaar later. Het is belangrijk om te weten dat een middel dat werkt met ouderrapportage ook gebruikt kan worden bij etnische minderheidsgroepen. In het huidige onderzoek wordt ook een minderheidsgroep onderzocht door middel van ouderrapportage. Het onderzoek van Pan et al. vormt bewijs voor het feit dat dat mogelijk is. Pan et al. hebben verder nog gekeken naar de relaties tussen demografische variabelen en taalscores. Hieruit bleek dat blanke moeders aangaven dat hun kinderen een groter vocabulaire hadden dan zwarte en Spaanstalige moeders. Het kan dus zijn dat blanke moeders het vocabulaire van hun kinderen overschatten of dat de zwarte of Spaanse 43 moeders het vocabulaire onderschatten. Een andere factor die van invloed kan zijn geweest, is dat de kinderen van een etnische minderheid vaak in tweetalige gezinnen opgroeiden. Ook kunnen er culturele verschillen zijn in het belang dat men hecht aan het vocabulaire van het kind. Ook andere onderzoekers hebben de validiteit van de CDI onderzocht. Bates et al. (1988) schrijven dat ze wel grote verschillen hebben gevonden tussen ouderrapportages en taalobservaties. Met 13 maanden produceerden kinderen volgens de ouders gemiddeld 12 woorden, maar volgens taalobservaties gemiddeld 1,7 woorden. Met 20 maanden waren deze gemiddelden respectievelijk 142 en 36. Ook de samenstelling van het vocabulaire verschilt bij de twee methodes. In de spontane taalanalyse is het gebruik van de gesloten klasse in percentage van het totale vocabulaire veel groter dan het percentage dat blijkt uit de ouderrapportage. Er zijn dus grote verschillen tussen de instrumenten. Bates et al. zeggen echter dat in spontane taal ook maar een beperkt aantal woorden uit de open klasse gebruikt kan worden. Om begrijpelijke taal te produceren zijn echter wel veel grammaticale functiewoorden nodig. Ze concluderen dan ook dat ouderrapportage weergeeft wat voor woorden een kind weet en spontane taal wat een kind gebruikt. Daarom is het gebruik van ouderrapportage niet slechter dan het gebruik van spontane taalanalyses. Bij elk kind zal er een verschil tussen beide meetmethoden ontstaan, dus de kinderen zijn onderling, voor elke methode apart, wel goed te vergelijken. In verschillende artikelen is echter de validiteit en de betrouwbaarheid van het gebruik van de CDI aangetoond. Dale (1991) heeft de concurrentenvaliditeit onderzocht door de score van kinderen op de CDI te vergelijken met resultaten van dezelfde kinderen op gestandaardiseerde taaltests en een spontane taalanalyse. De totale vocabulairescore, behaald op de CDI, correleerde significant positief met alle taalmaten. De taalmaten die hiervoor zijn gebruikt zijn de Expressive One-Word Picture Vocabulary Test, de typetoken ratio gebaseerd op de eerste 100 woord tokens, totaal aantal verschillende woorden in 100 uitingen, Memory for Sentences subtest of Stanford-Binet IV, gemiddelde uitingslengte (MLU) van een taalsample van 100 uitingen, Index of Productive Syntax, frequentie van vier regelmatige gebonden morfemen in het taalsample en pronominale referentie als proportie van alle referenties in het taalsample. De correlaties met de score op de CDI waren .48 tot .78, dus hoger dan de door Pan et al. gemelde correlaties. Uit onderzoek van Jackson-Maldonado et al. (1993) blijkt dat de manier waarop de ouders instructie krijgen over het invullen van de lijst verschil kan uitmaken voor de 44 score. Zij hebben een Spaanse bewerking van de CDI gebruikt in het zuidwesten van de Verenigde Staten en in Mexico. Ze hebben drie manieren vergeleken: (1) Post: ouders werden benaderd door Spaanstalige studenten, waarna de procedure werd uitgelegd. Ze moesten de lijst invullen en opsturen. (2) Persoonlijk gesprek: de interviewer gaf instructie en liet de ouders de lijst invullen, maar bleef beschikbaar voor vragen, of nam de hele lijst woord voor woord met hen door. (3) Wachtkamer: interviewers gaven instructies terwijl ouders zaten te wachten in de wachtkamer van de arts. Ze moesten de lijst alleen, zonder hulp, invullen. Het bleek dat ouders in de wachtkamer significant minder woorden rapporteerden dan ouders bij beide andere procedures. Blijkbaar is het dus belangrijk dat ouders voldoende tijd hebben om de lijst in te vullen. Als ze in een wachtkamer zitten, dan willen ze waarschijnlijk zo snel mogelijk klaar zijn met invullen, zodat ze naar de arts kunnen. Bovendien moeten ze in de wachtkamer waarschijnlijk tegelijkertijd op hun kind(eren) letten. Dat kan afleiden van de taak van het invullen. Klee et al. (1998) hebben de specificiteit en de sensitiviteit van de Language Development Survey van Rescorla (1989) onderzocht. Op deze lijst is de Lexilijst gebaseerd. Bij proefpersonen van 24,7 maanden was de sensitiviteit 91%, dus bijna alle kinderen met een taalachterstand werden opgespoord. De specificiteit was 87%, dus 87% van de kinderen zonder taalachterstand werd ook als zodanig herkend door het instrument. Klee et al. hebben ook gekeken naar de concurrentenvaliditeit van de LDS. Ze hebben de scores verkregen op de LDS (dus door ouderrapportage) vergeleken met resultaten van uitgebreid klinisch onderzoek. Tot dit onderzoek behoorden de volgende elementen: - een gesprek met de ouders over de ontwikkeling, onderwijs en de medische geschiedenis van het kind en over het voorkomen van taal-, leer-, of leesproblemen in de familie - een audiologische test - de Infant Mullen Scales of Early Learning (MSEL), bestaande uit een deel dat grove motorische ontwikkeling test, een deel dat visuele organisatie en geheugen test, een deel over fijne motorische ontwikkeling, een deel over auditieve en auditief-visuele organisatie en geheugen en een deel over communicatieve en verbale vermogens. - vragenlijsten die de ouders thuis moesten beantwoorden over functioneren van de familie en gedrag - een spontane taalanalyse van een gesprek tussen het kind en een ouder van 20 minuten 45 Uit dit onderzoek bleek dat de woordenschatscore op de LDS een sterke positieve correlatie vertoonde met alle expressieve taalmaten (.67-.77). De maten die gebruikt waren, zijn totaal aantal begrijpelijke woorden, aantal verschillende begrijpelijke woorden en gemiddelde uitinglengte in morfemen. Ook op vier van de vijf MSEL schalen waren significante positieve correlaties te vinden met de LDS-score (.27-.73). Alleen visuele expressieve organisatie was niet significant gecorreleerd met woorden op de LDS. Ook Rescorla (1989, 1993) zelf heeft de validiteit en betrouwbaarheid van de LDS onderzocht. Rescorla et al. (1993) melden dat de LDS als uitgangspunt heeft dat een ouder valide en betrouwbare informatie kan geven over de expressieve taalvaardigheid van het eigen kind en dat deze informatie specifiek en gedetailleerd is in plaats van globaal en algemeen. Rescorla (1989) heeft de test-hertest betrouwbaarheid van het instrument onderzocht door 30 moeders de LDS twee keer in te laten vullen met een interval van een week ertussen. De betrouwbaarheid varieerde van .86 tot .99 voor de verschillende semantische categorieën en was .99 in totaal. De concurrentenvaliditeit (getest met de Bayley Scale en de Reynell Expressive Language Scale) was .87. 3.3 Lexilijst Nederlands Schlichting & lutje Spelberg (2002, 2004) hebben besloten een Nederlands taalscreeningsinstrument te maken gebaseerd op de LDS van Rescorla: de Lexilijst Nederlands. Dit is geen vertaling van de LDS, maar een originele nieuwe lijst. De lijst bestaat uit woorden en zinnetjes die jonge kinderen gebruiken. Met de lijst kan men nagaan of de taalontwikkeling van kinderen tussen de 15 en 27 maanden normaal verloopt. Het is van belang dat een taalachterstand tijdig wordt onderkend, omdat deze op twee dingen zou kunnen wijzen. Ten eerste zou er sprake kunnen zijn van een specifieke taalstoornis. Ten tweede kan een achterstand in de taalontwikkeling een indicatie vormen voor algemene achterstand, dus ook op andere gebieden dan alleen de taalontwikkeling (Schlichting & lutje Spelberg, 2002). Eerder al hadden Schlichting et al. (1995) een Nederlandse versie ontwikkeld van de Language Development Survey. Ook dit was geen vertaling, maar een bewerking. De woorden en zinnetjes op de lijst waren geselecteerd naar aanleiding van onderzoek van Schlichting (1996) naar de productie van de eerste vijftig woorden of zinnetjes bij 37 46 Nederlandse kinderen. De lijst is daarna aangevuld met woorden die door ouders werden aangedragen tijdens een vooronderzoek. De normeringsgegevens waren echter beperkt voor deze Lexilijst. Bovendien was er sprake van een plafondeffect bij kinderen van 27 maanden. Daarom werd een nieuw onderzoek (Schlichting & lutje Spelberg, 2002) opgestart met meer moeilijke woorden om zo de nieuwe Lexilijst Nederlands te produceren. De Lexilijst werd aangevuld met 179 woorden uit de Basiswoordenlijst van 1000 woorden (Schlichting, 2001). Men kwam zo tot een nieuwe Lexilijst met 488 woorden en 11 zinnetjes. De lijst werd voorgelegd aan ouders van kinderen van 15, 17, 19, 23, 25 en 27 maanden. Dit waren in totaal gegevens over 809 kinderen. Woorden die door minder dan 5% van de ouders waren aangekruist, werden verwijderd, evenals eigennamen. Dit waren veertien items, dus er bleven 485 items over. Dit aantal is vrij hoog. Het is praktischer als een lijst minder items bevat, omdat het anders veel werk is voor de ouders om in te vullen. Men vormde daarom twee gelijkwaardige lijsten van 263 woorden en elf zinnetjes. Tussen de lijsten bestaat een zekere overlap in woorden. De zinnetjes zijn op beide lijsten gelijk. Als de Lexilijst Nederlands bij een kind wordt afgenomen dan kan men dus kiezen voor versie A of B. Beide lijsten zijn vergelijkbaar, maar ze bevatten andere woorden, dus zijn er ook aparte normtabellen. Ook voor jongens en meisjes bestaan er aparte normtabellen. In alle leeftijdsgroepen bleken meisjes hoger te scoren dan jongens. De Lexilijst maakt gebruik van ouderrapportage. Het is de bedoeling dat ouders op de lijst aankruisen welke woorden en zinnetjes hun kind zelf zegt. Het gaat dus om de productieve woordenschat. Uit onderzoek blijkt dat de woordenschatproductie, gemeten met instrumenten zoals de Lexilijst, hoog correleert met de taalontwikkeling als geheel (Schlichting & lutje Spelberg, 2002). De woordenschatproductie kan dus als maat worden genomen voor de algemene taalontwikkeling. Volgens Schlichting & lutje Spelberg (2002) is de Lexlijst in de volgende settings geschikt: • Consultatiebureau: standaard als meetinstrument voor de taalontwikkeling, of incidenteel als men een taalachterstand vermoedt. • Kinderdagverblijf of peuterspeelzaal: bij vermoeden van een taalachterstand. • KNO-onderzoek, Foniatrisch of Kindergeneeskundig onderzoek: als screeningsinstrument bij twijfel over de taalontwikkeling • Logopedisch of psychologisch onderzoek: als instrument om de actieve woordenschat te meten bij kinderen. 47 • Onderzoeksprojecten: als indicatie voor het niveau van de taalontwikkeling en als instrument om de taalontwikkeling longitudinaal te onderzoeken. Schlichting & lutje Spelberg hebben ook gekeken naar de betrouwbaarheid en validiteit van de Lexilijst Nederlands. Voor de verschillende leeftijdsgroepen (15, 17, 19, 21, 23, 25 en 27 maanden) is de correlatie uitgerekend tussen beide paralleltests (lijst A en lijst B). De correlaties waren tussen .97 en 1.00. Dat wil zeggen dat de betrouwbaarheid zeer hoog is. De validiteit van de Lexilijst Nederlands is onderzocht met de versie van de Lexilijst uit 1995. Deze is toen afgenomen bij 91 ouders van kinderen van 21 maanden oud. Bij deze kinderen werd toen ook de Reynell Test voor Taalbegrip afgenomen en de Test voor Zinsontwikkeling en de Test voor Woordontwikkeling, beide afkomstig uit de Schlichting Test voor Taalproductie. De correlaties waren respectievelijk .42, .64 en .72 (zie tabel 5). Bij een zeventien van deze zelfde kinderen is de predictieve validiteit van de Lexilijst Nederlands onderzocht door hen zes maanden later weer dezelfde tests af te nemen. De correlaties zes maanden later waren respectievelijk .64, .80 en .82. Tabel 5 Correlaties met de Lexilijst Nederlands (Schlichting & lutje Spelberg, 2002) Reynell Test voor Test voor Test voor Taalbegrip Zinsontwikkeling Woordontwikkelimg .42 .64 .72 maanden later (n = .64 .80 .82 Afname met 21 maanden (n = 91) Afname 6 17) De correlaties na zes maanden zijn weliswaar veel hoger, maar dit heeft te maken met het kleine aantal proefpersonen bij wie de hertest is gedaan. De verschillen zijn namelijk niet significant. 48 3.4 Tweetalige Lexilijst Er bleek grote behoefte te zijn aan een taalscreeningsinstrument voor jonge anderstalige kinderen in Nederland (Hoogsteder et al., 1999). Deze kinderen horen meestal zowel het Nederlands (bijvoorbeeld van broertjes of zusjes en van televisie) als de eerste taal. Als hun woordenschat getest zou worden met de Nederlandse Lexilijst, dan zou men dus maar een deel van hun woordenschat bekijken, het Nederlandse deel. Volgens de normtabellen zouden deze kinderen dan een taalachterstand hebben, terwijl ze eigenlijk in de meeste gevallen wel een normale taalontwikkeling doormaken, zij het dat hun woordenschat verdeeld is over twee talen. Stichting Studio Taalwetenschap heeft in samenwerking met Liesbeth Schlichting een project opgezet om de Nederlandse Lexilijst te bewerken voor een aantal veel gesproken talen in Nederland. Het gaat om de volgende talen: • Tarifit (Berbers) • Turks • Marokkaans-Arabisch • Papiaments • Fries Het normeringsonderzoek naar Tarifit en Turks wordt uitgevoerd door het Instituut Maatschappelijke Gezondheidszorg aan de Erasmus Universiteit, in Rotterdam en Den Haag. Het normeringsonderzoek naar het Fries wordt geleid door Henk lutje Spelberg van de Rijksuniversiteit Groningen en het Papiaments en Marokkaans-Arabisch worden onderzocht in Amsterdam. In deze scriptie gaat het om de tweetalige Lexilijst Marokkaans-Arabisch/Nederlands. 3.4.1 Constructie Lexilijst Marokkaans-Arabisch/Nederlands Voor de constructie van deze tweetalige Lexilijsten is men in eerste instantie uitgegaan van de Nederlandse Lexilijst. Men heeft de woorden op deze lijst vertaald. Vervolgens heeft men gebruik gemaakt van informatie uit verschillende bronnen. Drs. Anneke Kesler heeft onderzoek naar de tweetalige Lexilijst MarokkaansArabisch/Nederlands gedaan als scriptieonderzoek in het kader van haar opleiding tot jeugdarts. Zij heeft voor haar Arabische vertaling de eerste versie van de Lexilijst 49 Nederlands gebruikt. Deze vertaling is vervolgens getest bij twintig kinderen in Marokko, in Rabat, en bij vijf kinderen in Amsterdam. Hierna zijn de lijsten weer enigszins aangepast en in 2001 bij consultatiebureaus in Amsterdam-West uitgezet. 54 ouders met kinderen tussen de 18 en 45 maanden zijn benaderd om mee te werken aan het onderzoek. Dit onderzoek betrof, behalve de Marokkaans-Arabisch/Nederlandse versie van de Lexilijst, ook de Noord-Berbers/Nederlandse versie en de ZuidBerbers/Nederlandse versie. Ouders moesten verschillende vragen beantwoorden over het gezin en de herkomst, zoals de streek waar ze vandaan kwamen. Vervolgens werd een van de drie Marokkaans/Nederlandse Lexilijsten meegegeven, waarop ze moesten aankruisen welke woorden het kind kon produceren. Als de ouders aangaven de lijst niet te kunnen lezen, dan kregen ze hulp van een buurtmoeder, die dezelfde taal sprak. Uiteindelijk is over 27 kinderen (54%) de Marokkaans-Arabische lijst ingevuld. Op basis van de frequentie van de aangekruiste woorden en zinnen en de door ouders toegevoegde woorden (bijvoorbeeld ‘olijf’) is een selectie gemaakt van 243 woorden en dertien zinnen voor de Marokkaans-Arabisch/Nederlandse Lexilijst (Kesler-Koppe, 2003). Vervolgens hebben twee arabisten, dr. Yahya E-Rramdani van de Universiteit van Tilburg en drs. Ankie van Pel van de Universiteit van Amsterdam, in opdracht van Stichting Studio Taalwetenschap de lijst van Anneke Kesler uitgebreid. Ze hebben hierbij gekeken naar de nieuwe, aangepaste versie van de Lexilijst uit 2002. Dit leverde een zeer uitgebreide lijst op. Deze is vervolgens getest op een beperkte pilotgroep. De woorden die door geen enkele ouder gescoord werden en de woorden waarover twijfel of discussie bestond, zijn vervolgens geschrapt uit de lijst. Ten slotte zijn er per categorie om en om woorden weggestreept. Er zijn dus zowel woorden in de lijst opgenomen die bijvoorbeeld vijftien keer gescoord zijn als woorden die maar twee keer gescoord zijn. Op deze manier staan er dus zowel relatief moeilijke woorden in de lijst als relatief makkelijke woorden. Als er alleen maar makkelijke woorden in de lijst zouden staan, dan zou er snel een plafondeffect bereikt worden; veel kinderen zouden alles goed hebben, waardoor er geen goede vergelijking tussen kinderen gemaakt kan worden.Als er alleen moeilijke woorden in de lijst zouden staan, dan zouden er veel kinderen zijn met een lage score. Ook dan is een vergelijking met andere kinderen niet goed te maken. 50 3.4.2 Problemen met de constructie van de tweetalige Lexilijst MarokkaansArabisch/Nederlands Onderzoekers zijn verschillende problemen tegengekomen bij de constructiefase van de tweetalige Lexilijsten. Het Marokkaans-Arabisch is een gesproken taal en geen schrijftaal. De spellingsregels van het Standaard-Arabisch waren ook niet van toepassing op het MarokkaansArabisch. Anneke Kesler heeft daarom besloten gebruik te maken van een fonetisch transcriptiesysteem in het Latijnse schrift. Hierbij speelde een rol dat veel Marokkanen in Nederland het Arabische schrift niet kunnen lezen. Verder zijn er veel verschillen in het woordgebruik tussen de verschillende gebieden in Marokko. Juist omdat het Marokkaans-Arabisch een gesproken taal is, bestaan er veel varianten. Woorden die men in het ene gebied wel gebruikt, zijn onbekend in het andere gebied. Zie hierover ook hoofdstuk 4. 3.4.3 Normering Lexilijst Marokkaans-Arabisch/Nederlands De constructiefase van de tweetalige Lexilijsten was op het moment van mijn stage al afgerond. De lijsten moesten echter genormeerd worden. Per taal zijn hiervoor, om statistische redenen, ongeveer 320 proefpersonen nodig, verdeeld over vier leeftijdsgroepen: 21 maanden, 23 maanden, 25 maanden en 27 maanden. Van elke leeftijdsgroep zijn 80 proefpersonen nodig. Besloten is om te gaan werken met netwerken met contactpersonen die zelf afkomstig zijn uit de Marokkaanse cultuur. Zij konden binnen hun eigen kennissenkring mensen zoeken om de Lexilijst in te vullen. Uit gegevens over de bevolking in de verschillende stadsdelen in Amsterdam bleek dat het onderzoek naar het Marokkaans-Arabisch het beste in Amsterdam-West kon plaatsvinden, in de stadsdelen Geuzenveld/Slotermeer, Bos en Lommer en Osdorp. Via diverse instellingen zijn jonge Marokkaanse vrouwen benaderd die zowel het Marokkaans-Arabisch als het Nederlands vloeiend beheersen. De volgende instellingen hebben meegewerkt aan het normeringsonderzoek: • Opvoedsteunpunt Geuzenveld/Slotermeer 51 De vrouwen die hier werken geven ouders advies over allerlei aspecten van de opvoeding, zoals voorscholen, peuterspeelzalen en consultatiebureaus. • Moeder-Kind Centrum Bos en Lommer In het centrum worden allerlei activiteiten georganiseerd voor moeders en kinderen, zoals kooklessen, aerobics en Nederlandse les. • Vrouw en Vaart Dit is een centrum waar allerlei activiteiten voor vrouwen worden georganiseerd, waaronder kinderopvang, fietslessen en aerobics. Bovenstaande instellingen waren het belangrijkste in het onderzoek. Er waren verder nog twee Marokkaanse vrouwen van de Taalcoördinatie in Geuzenveld/Slotermeer betrokken bij het onderzoek en een stagiaire van Stichting DOCK (een welzijnsorganisatie die zich bezighoudt met werkgelegenheid, scholing en jongeren). De Marokkaanse vrouwen kregen instructie over het invullen van de Lexilijst. Vervolgens gingen zij jonge Marokkaanse moeders in hun omgeving benaderen die de lijst in konden vullen. Hiervoor kregen zij een vergoeding van vijf euro per lijst. Hoofdstuk 5 gaat uitgebreider in op de procedure van het verzamelen van gegevens. De verzamelde lijsten worden vervolgens ingevoerd in de computer. Op basis van deze gegevens zullen normtabellen worden ontwikkeld voor jonge Marokkaanse kinderen in Nederland. Op dit moment is het normeringsonderzoek nog in volle gang. 3.5 Conclusie Verschillende onderzoekers hebben aangetoond dat instrumenten die werken met ouderrapportage betrouwbaar zijn. Zo heeft Dale (1991) significante positieve correlaties gevonden tussen het aantal door ouders gerapporteerde woorden en de scores op verschillende taaltests en de score van een spontane taaltest. Ook Klee et al. (1998) hebben de validiteit van een ouderraportage-instrument onderzocht door de scores te vergelijken met het resultaat van een uitgebreid klinisch onderzoek. De correlaties waren allemaal significant en positief. Ook Pan et al. (2004) hebben significante correlaties gevonden met andere manieren van het meten van taal bij kinderen, maar de correlaties waren niet zo hoog. Niet alle onderzoeken hebben aangetoond dat het gebruik van ouderrapportage vergelijkbaar is met het gebruik van spontane taalanalyse. Bates et al. (1988) hebben 52 zelfs grote verschillen gevonden tussen het aantal woorden dat kinderen volgens hun ouders kenden en het aantal woorden dat de kinderen gebruikten tijdens spontane taalobservaties. Dit hoeft echter geen probleem te vormen voor het gebruik van ouderrapportage als meetinstrument. Bates et al. concluderen dat ouderrapportage weergeeft welke woorden een kind weet en spontane taal wat een kind gebruikt. In een gesprek komen lang niet alle woorden voor die een kind weet. Misschien dat een kind iets gaat vertellen over een hond, maar dat betekent niet dat hij andere dierennamen zoals ‘kat’, ‘paard’ en ‘konijn’ niet ook beheerst. Bovendien zal het verschijnsel dat Bates et al. hebben gevonden (groter aantal door ouders gerapporteerde woorden vergeleken met het aantal gevonden woorden in de spontane taal) voor alle kinderen gelden. Op deze manier kunnen kinderen toch met elkaar vergeleken worden. Wat in het voordeel spreekt van ouderrapportage-instrumenten zoals de Language Development Survey is dat de sensitiviteit en de specificiteit hoog zijn. Dat betekent dat bijna alle kinderen met een taalachterstand door het instrument worden opgespoord en dat er weinig kinderen onterecht het stempel ‘taalachterstand’ krijgen. En instrument dat werkt met ouderrapportage is bovendien gemakkelijk in het gebruik. Voor dit onderzoek zijn 232 proefpersonen gebruikt. Als bij alle proefpersonen een spontane taalobservatie gedaan had moeten worden, dan had dit veel meer tijd gekost. Dit zou tot gevolg hebben gehad dat er minder proefpersonen zouden zijn geweest. Daarom is het gebruik van de tweetalige Lexilijst, een ouderrapportage-instrument, geschikt om de huidige onderzoeksvragen te beantwoorden. In paragraaf 5.3 wordt verder ingegaan op de inhoud van deze tweetalige Lexilijst Marokkaans-Arabisch/Nederlands. 53 4. Marokkaans-Arabisch 4.1 Ontstaan van het Marokkaans-Arabisch Marokko vormt samen met andere landen in Noordwest-Afrika de Maghreb. Dit is Arabisch voor ‘westen’. De naam ‘Marokko’ komt van ‘Marrakech’, een plaats in het zuiden van Marokko. In Marokko zijn enkele ontoegankelijke bergketens: het Rifgebergte in het noorden, de Atlas in het midden en westen en de Anti-Atlas in het zuiden. Deze bergen hebben grote invloed gehad op de taalsituatie in het land, omdat de mensen die er woonden zeer geïsoleerd leefden. Hun taal is niet beïnvloed door externe factoren (Nortier, 1989). Oorspronkelijk werd in alle Maghreb landen Berbers gesproken. Berbertalen behoren tot de Afro-Aziatische taalfamilie. Het Arabisch hoort tot de Semitische taalgroep, een subgroep van de Afro-Aziatische taalgroep. Alle Semitische talen stammen af van één taal die Proto-Semitisch wordt genoemd (bron: Ethnologue). In de 7e en 8e eeuw kwamen het Arabisch en de Islam naar Marokko. Arabieren vielen Marokko binnen en veroverden het land. De arabisatie begon in de steden. De bevolking bekeerde zich al snel tot de Islam, maar de verspreiding van de Arabische taal ging veel langzamer. In de oudste Arabische dialecten zijn nog sporen van het Berbers terug te vinden. In de berggebieden bleef hett Berbers de belangrijkste taal, omdat men daar weinig contact had met andere dorpen en steden (Nortier, 1989). In de 11e, 12e en 13e eeuw werd Marokko binnengevallen door bedoeïenenstammen van het Arabische schiereiland. Door grote droogte in hun eigen land, kwamen zij naar het westen. Dit was de sterkste Arabische migratie (E-Rramdani, 2003). Door de overheersing van de Arabieren is het Berbers grotendeels verdrongen door het Arabisch. Ook nu nog zijn er bedoeïenendialecten terug te vinden in de taal (Nortier, 1989). In de 15e eeuw kwamen er veel vluchtelingen uit Spanje naar Marokko. Zij vestigden zich vooral in het noorden (E-Rramdani, 2003). Van 1912 tot 1956 viel Marokko onder Frans protectoraat. De Franse taal wordt ook nu nog gesproken in Marokko. Het noordelijkste deel van het land viel in de 20e eeuw onder Spaans protectoraat en ook die taal is nog terug te vinden in Marokko. Ceuta en Melilla zijn twee Spaanse enclaves in Marokko (Nortier, 1989). 54 4.2 De taalsituatie in Marokko Volgens Ethnologue zijn er wereldwijd 206 miljoen mensen die Arabisch spreken. Het gaat dan om alle gesproken Arabische variëteiten samen. Verder wordt de taal voor de godsdienst gebruikt door honderden miljoenen moslims over de hele wereld. Het is dus een belangrijke taal. Je kunt echter niet spreken over ‘het Arabisch’. Er bestaan namelijk vele verschillende Arabische dialecten, die op allerlei punten van elkaar verschillen. De taal die gebruikt wordt voor de godsdienst wordt Klassiek Arabisch genoemd. De taal die in Marokko wordt gesproken in het dagelijks leven is het Marokkaans-Arabisch. Dit is echter ook weer de collectieve naam voor alle gesproken Arabische variëteiten in Marokko. In formele taalsituaties gebruikt men meestal het Modern Standaard Arabisch. Deze taal is afgeleid van het Klassiek Arabisch, maar beide varianten worden door niemand als moedertaal verworven. Men leert als moedertaal een van de verschillende Arabische dialecten die er bestaan. Het Modern Standaard Arabisch is ongeveer hetzelfde voor de hele Arabische wereld. Marokko is dus een multilinguïstische maatschappij. De belangrijkste talen zijn: • Berbers Er bestaan verschillende varianten van het Berbers. Je kunt niet spreken over een enkele taal. De Berbertalen hebben de oudste traditie. Grofweg zijn er drie groepen Berbertalen te onderscheiden die in Marokko worden gesproken. In het noorden in de Rifgebergten wordt Tarifit gesproken, in de centrale Atlasgebergten wordt Tamazight gesproken en in de zuidelijke Atlas, de Anti-Atlas en de Sous-vallei wordt Tashelhit (of Selha) gesproken (De Ruiter, 1989). Ongeveer een derde van de Marokkaanse bevolking spreekt Berbers. Volgens Ethnologue spraken in 1991 1,5 miljoen mensen in Marokko Tarifit. In 1998 spraken 3 miljoen mensen Tamazight en 3 miljoen mensen spraken Taselhit. Sprekers van de ene Berberse variant kunnen niet automatisch sprekers van een andere variant verstaan. Over het algemeen geldt dat hoe groter de geografische afstand tussen twee gebieden is, des te minder goed de sprekers elkaar kunnen verstaan. Vaak wordt dan voor de onderlinge communicatie het MarokkaansArabisch gebruikt (De Ruiter, 1989). Berbers is geen schriftelijke taal. Wel beheersen veel Berbers het Arabische schrift. Berbers die dit niet kunnen, worden als ongeletterd beschouwd door zowel Berbers 55 als niet-Berbers. De taal heeft een laag sociaal prestige, maar wel een hoge affectieve waarde. Het is de thuistaal van veel mensen en wordt wel beschouwd als teken voor etnische solidariteit (Nortier, 1989). Sprekers van het Berbers zijn echter vaak snel bereid om hun moedertaal te vergeten en Marokkaans-Arabisch te spreken, omdat die taal hoger wordt gewaardeerd. E-Rramdani (2003) meldt twee belangrijke gebeurtenissen de afgelopen jaren voor de erkenning van het Berbers. In 1994 verklaarde koning Hassan de Tweede dat het Berbers een plaats zou krijgen op school. Men is hiermee gestart in het jaar 2002/2003. Verder heeft koning Mohammed de Zesde in 2001 besloten dat er een Koninklijk Instituut voor de Amazigh (dat wil zeggen Berberse) Cultuur zal komen. De meeste Marokkanen in Nederland zijn afkomstig uit het Rifgebergte en spreken Tarifit. • Arabisch De officiële nationale taal is Klassiek Arabisch. Deze taal wordt gesproken voor literaire, religieuze en andere formele doeleinden. Het is de taal van de Koran. Zoals De Ruiter (1989) opmerkt wordt het Arabisch gezien als de perfecte taal die de perfecte eigenschappen van God uitdrukt. De taal heeft dus een hoge status. Klassiek Arabisch wordt in de hele Arabische wereld gebruikt. Men leert deze taal op school. Dit geldt ook voor het Modern Standaard Arabisch, dat zoals gezegd van het Klassiek Arabisch is afgeleid. Het Standaard Arabisch verschilt vooral van het Klassiek Arabisch op het gebied van het lexicon. Er zijn nieuwe woorden voor nieuwe concepten aan de taal toegevoegd. In mindere mate kan ook de syntaxis afwijken. Het Standaard Arabisch wordt vooral gebruikt voor literatuur, kranten en televisie (De Ruiter, 1989). De gesproken variant wordt het Marokkaans-Arabisch genoemd. Dit is de taal die kinderen thuis als eerste taal leren. Het is niet één taal of dialect, maar de verzamelnaam van alle Arabische varianten die in Marokko worden gesproken (Nortier, 1989). De taal wordt gewoonlijk niet geschreven. Als men iets schrijft, dan gebeurt dat in het Standaard Arabisch. Etnologue schat dat in 1995 18,8 miljoen mensen het Marokkaans-Arabisch spraken in Marokko. Een andere schatting is dat in 1991 65% van de bevolking het sprak als moedertaal en 20% als tweede taal. • Frans Vanwege het Franse protectoraat in de twintigste eeuw is ook het Frans een belangrijke taal in Marokko. De Fransen wilden hun cultuur uitdragen door 56 bijvoorbeeld een Frans schoolsysteem op te zetten. De Marokkaanse economie werd in dienst gesteld van Frankrijk. Dit zorgde ervoor dat het Frans de dominante taal werd op het gebied van economie, bestuur en technisch onderwijs (De Ruiter, 1989). In 1956 werd Marokko onafhankelijk, maar nog steeds wordt de Franse taal veel gebruikt. Kinderen leren nog steeds Frans vanaf de derde klas op de lagere school (E-Rramdani, 2003). De taal heeft een hoge sociale status in Marokko. Er worden verschillende varianten van het Frans gesproken. Veel mensen gebruiken een variant die nauwelijks lijkt op het Frans zoals het in Frankrijk wordt gesproken. • Overig Het Spaans werd alleen in het noorden van Marokko gesproken vanwege het Spaanse protectoraat. In Ceuta en Melilla is het Spaans nog steeds de officiële taal. Ook in Marokko wordt het Engels steeds belangrijker. Kinderen leren deze taal op school (Nortier, 1989). Figuur 2 is een kaartje van Marokko met daarop aangegeven in welke gebieden vooral Berbers wordt gesproken en in welke gebieden Arabisch wordt gesproken. Berbers: 1 = Tarifit 2 = Tamazight 3 = Tashelhit Arabisch: 4 = Bergdialecten 5 = Oost-Marokkaanse bedoeïenendialecten 6 = West-Marokkaanse bedoeïenendialecten 7 = Hassaniya Figuur 2: Talen in Marokko (El Aissati, 2002) Het Berbers en Marokkaans-Arabisch lijken grammaticaal gezien niet op elkaar, maar sociolinguïstisch gezien wel; beide talen worden in vergelijkbare domeinen gebruikt, namelijk als thuistaal, voor het dagelijks gebruik. Het Klassiek Arabisch en het Frans daarentegen worden alleen voor officiële doeleinden gebruikt. 57 De taalsituatie in Marokko wordt vaak aangeduid met het begrip ‘diglossie’. Er is sprake van diglossie als in een gemeenschap twee verschillende varianten van dezelfde taal gebruikt worden. De ene variant wordt verworven op school en wordt gebruikt in bepaalde contexten, de andere variant is verworven voordat scholing heeft plaats gevonden en wordt in andere contexten gebruikt. De taal die formeel verworven is wordt ook wel de High vorm genoemd, de H-taal. Toespraken, nieuwsuitzendingen en schriftelijk taalgebruik vinden meestal in de H-taal plaats. De L-taal, de taal met een laag prestige, wordt gebruikt in privé-gesprekken en persoonlijke correspondentie. De hoge taal is in dit geval het Klassiek Arabisch en de lage variant het MarokkaansArabisch. Grabe (1979, in Nortier, 1989) is ook van mening dat er tussen het Klassiek Arabisch en het Marokkaans Arabisch een diglossierelatie bestaat. Hij geeft de volgende kenmerken van diglossie en meent dat deze van toepassing zijn op de situatie in Marokko: 1. Diglossie is een stabiele taalsituatie die eeuwen kan duren. 2. Bij diglossie is er sprake van specifieke functies voor elke taalvariant. 3. Diglossie onderscheidt een prestigieuze taal van een regionaal dialect. Tweetalige sprekers zien het dialect als een non-taal hoewel dit de taal is die meestal gebruikt wordt in alledaagse situaties. 4. Tweetalige sprekers vinden de hoge variant mooier. 5. In het geval van het Arabisch heeft de hoge taal een religieuze basis. 6. Van de hoge variant is er veel schriftelijk materiaal en dit materiaal wordt hoog gewaardeerd. 7. De lage taal is de moedertaal en de hoge variant wordt verworven door onderwijs en religie. 8. Volgens Ferguson (1959) zijn er bij diglossie altijd grote grammaticale verschillen tussen de hoge en de lage variant. 9. Veel concepten in de hoge en lage variant met dezelfde betekenis worden door verschillende woorden uitgedrukt. 10. Fonologisch gezien lijkt de lage variant op de hoge variant, maar de hoge variant heeft meer fonemen van ofwel een parasysteem of een subsysteem (Ferguson, 1959). Er is een duidelijk verschil tussen diglossie en een situatie met een standaardtaal en een dialect. In het laatste geval kunnen beide varianten gebruikt worden voor een alledaagse conversatie. Bij diglossie gebruikt men nooit de hoge variant voor een alledaagse conversatie (Ferguson, 1959, in Nortier, 1989). 58 Hoewel het Berbers en het Marokaans-Arabisch vaak dezelfde functie hebben, is er in de relatie tussen Berbers en Klassiek Arabisch geen sprake van diglossie. Forkel (1980, in Nortier, 1989) zegt dat er geen diglossierelatie tussen het Berbers en het Klassiek Arabisch kan zijn, omdat beide talen linguïstisch gezien niet nauw verwant zijn. Er is niet zo veel literatuur over het Marokkaans-Arabisch. Dit kan te maken hebben met het feit dat er geen algemeen geaccepteerde schriftelijke variant van deze taal bestaat. 4.3 Marokkanen in Nederland In de jaren ’60 was er in West-Europa een groot tekort aan ongeschoolde arbeiders. In de landen rond de Middellandse Zee was er een enorm reservoir aan arbeiders, dus emigreerden veel Italianen, Spanjaarden, Joegoslaven en Grieken naar onder andere Nederland (Nortier, 1989). In 1963 sloot Nederland een akkoord met Marokko om Marokkanen te rekruteren voor de Nederlandse arbeidsmarkt. Zo begon de Marokkaanse migratie naar Nederland (ERramdani, 2003). Er is sprake van drie migratiegolven. De eerste golf was van 1963-1973. Vooral Marokkaanse mannen migreerden naar Nederland om als gastarbeiders te werken. Zij hadden nog sterke banden met Marokko. Van 1973-1981 was de tweede golf. Steeds meer mannen lieten hun familie uit Marokko overkomen naar Nederland, omdat ze langer bleven dan ze verwacht hadden. Men ging zich permanent vestigen in Nederland. De derde stroom was in de jaren ’80. De kinderen van de gastarbeiders werden volwassen en besloten meestal om in Nederland te blijven wonen. Hun echtgenoten haalden ze echter vaak uit Marokko (E-Rramdani, 2003). Volgens Van der Meer (1984, in Nortier, 1989) spreekt 70% van de Marokkanen in Nederland Berbers en 30% Marokkaans-Arabisch. Veel Berbers spreken echter ook Marokkaans-Arabisch. Ook Boumans (2002) geeft enkele cijfers. Volgens hem spreekt 55% van de Marokkanen in Nederland Tarifit, 10% Sous-Berbers (Tashelhit) en 35% MarokkaansArabisch. 59 Met deze cijfers is het te verklaren dat de tweetalige Lexilijst ontwikkeld wordt voor het Marokkaans-Arabisch/Nederlands en het Tarifit/Nederlands, zoals in paragraaf 3.4 staat. Dit zijn de twee meest gesproken talen door Marokkaanse mensen in Nederland. Marokkaanse kinderen in Nederland hebben vaak de mogelijkheid om lessen Arabische taal en cultuur te volgen, waardoor ze bekend blijven met het Arabisch. Veel Marokkanen spreken onderling een mix van Arabisch en Nederlands. Marokkanen die rond 1976 naar Nederland kwamen, deden dit om geld te verdienen. Ze gingen zo snel mogelijk van school om te kunnen werken. Ze hadden dus weinig Nederlands onderwijs gehad en spraken de Nederlandse taal niet goed. Marokkanen die rond 1980 naar Nederland kwamen waren echter, vanwege grote werkloosheid, gedwongen weer terug te gaan naar school. Deze groep leerde dus veel beter Nederlands te spreken (Nortier, 1989). Volgens Hoffmann (1991) is voor veel immigranten tweetaligheid een voorbijgaande fase. Volgens haar spreekt de eerste generatie immigranten de moedertaal goed en de tweede taal een beetje. De moedertaal hebben ze in hun geboorteland geleerd en de tweede taal moeten ze leren om te kunnen leven in hun nieuwe land. De tweede generatie wordt opgevoed in de moedertaal van hun ouders. Ze gaan echter naar school en leren daarom de tweede taal in de meeste gevallen goed. De derde generatie leert de oorspronkelijke moedertaal van hun grootouders minder goed en de vierde generatie leert deze helemaal niet meer. Hoffmann heeft daar het volgende schema bij gemaakt: First generation Second generation Third generation Fourth generation LA +LB LA and LB +LA LB LB ( + = ‘some’ LA = Language A LB = Language B Figuur 3: Tweetaligheid van immigranten (Hoffmann, 1991) Hoffmann maakt echter een onderscheid tussen migranten en immigranten. Immigranten verlaten hun geboorteland om zich voor altijd te vestigen in een ander land. Van hen wordt verwacht dat zij zich zo snel mogelijk aanpassen. Migranten verlaten hun geboorteland om werk te zoeken en betere levensomstandigheden. Migratie wordt gezien als iets tijdelijks. Men houdt er rekening mee dat men weer terugkeert naar het moederland. Het is daarom belangrijk dat 60 migranten hun eigen taal behouden. De mate waarin kinderen tweetalig worden is daarom onvoorspelbaar. Veel Marokkanen zijn in eerste instantie als migranten naar Nederland gekomen. Zij zochten betere levensomstandigheden en besloten pas later om zich permanent te vestigen. Volgens cijfers van het Centraal Bureau voor de Statistiek telde Nederland 16 258 032 inwoners in 2004. Hieronder waren 3 088 152 allochtonen. 306 219 personen hiervan waren Marokkaans. 166 464 Marokkanen waren eerste generatie allochtonen, oftewel mensen die in het buitenland zijn geboren en later naar Nederland zijn gekomen. In totaal waren er 139 755 Marokkanen in 2004 die tot de tweede generatie allochtonen gerekend worden. 14 437 personen hiervan hadden één ouder die geboren was in het buitenland. Van 125 408 personen waren beide ouders in Marokko geboren. Totale bevolking 16 258 032 Autochtonen 13 169 880 Allochtonen 3 088 152 Marokkanen 306 219 Eerste generatie 166 464 1 ouder in buitenland 14 347 Tweede generatie 139 755 2 ouders in buitenland 125 408 Figuur 4: Marokkanen in Nederland (Bron: Centraal Bureau voor de Statistiek) 61 Omdat het onderzoek naar de Lexilijst vooral werd uitgevoerd in Amsterdam is ook gekeken naar het aantal Marokkanen in deze stad. In 2004 waren in Amsterdam in totaal 353 076 allochtonen. Daarvan kwamen 62 776 personen uit Marokko. El Aissati (2002) beschrijft de resultaten van een onderzoek in Lombok (Utrecht). 54 Marokkaanse informanten moesten vragenlijsten invullen over de talen die zij spreken. Hieruit blijkt dat het Berbers en Marokkaans-Arabisch voornamelijk met de ouders wordt gesproken. Met broers en zussen en leeftijdgenoten spreekt men vooral Nederlands. Vaak worden binnen één gesprek meerdere talen gebruikt (codemixing). Een van de vragen was welke taal wordt gebruikt om het eerste contact te leggen met een Marokkaanse leeftijdgenoot. 90% van de informanten koos voor het Nederlands. De reden die werd opgegeven was dat men niet weet welke taal de gesprekspartner spreekt (Marokkaans-Arabisch, Tarifit of Tashelhit). Slechts enkelen zouden overstappen op de Marokkaanse taal als ze dezelfde taal zouden blijken te spreken als hun gesprekspartner. Ook in een Marokkaanse vriendengroep praat men vaak Nederlands, omdat er meestal een deel is dat geen Arabisch verstaat, en een deel dat geen Berbers verstaat. Bovendien kunnen de Berbervarianten ook weer van elkaar verschillen (Boumans, 2002). Dit is een groot verschil met Turkse leeftijdgenoten, die onderling vooral Turks praten. Behalve de hiervoor genoemde reden, noemt Boumans nog het feit dat er in Marokko een groot verschil is tussen de verschillende spreektalen en de officiële taal in het land (er is sprake van diglossie). De gesproken Marokkaanse talen ondervinden dus nauwelijks steun van het onderwijs of de media, want die maken gebruik van de officiële taal. Verder is volgens Boumans het nationaal bewustzijn bij Turken sterker dan bij Marokkanen. Wel zijn de Nederlandse gesprekken van Marokkaanse jongeren onderling meestal doorspekt met Marokkaanse woorden. Het gaat dan vaak om woorden die cultuurspecifieke concepten uitdrukken. Ook gespreksmarkeringen worden vaak in het Marokkaans-Arabisch geuit, bijvoorbeeld ‘echt waar?’, ‘of’, maar ook scheldwoorden. Op de vraag welke taal wordt gebruikt om contact te leggen met mensen van de eerste generatie, antwoordde 85% echter de Marokkaanse taal. 80% zou niet overstappen op het Nederlands als zou blijken dat beiden die taal beheersen. Dit is een kwestie van respect. Boumans (2002) beschrijft de gecompliceerde verhoudingen tussen het Berbers en het Marokkaans-Arabisch. Er zijn families waarin niet iedereen dezelfde taal spreekt. Dat heeft volgens Boumans te maken met het feit dat tegelijk met de migratie naar Europa 62 er ook binnen Marokko sprake was van migratie van rurale naar stedelijke gebieden. De Berberse migranten in de steden in Marokko groeien vervolgens dus op met het Arabisch. Een vaak voorkomende situatie is dat ouders tweetalig Marokkaans-Arabisch en Berbers zijn, maar tegen hun kinderen alleen Arabisch spreken. Dit was ook het geval in het onderzoek van deze scriptie. Er waren enkele ouders die invulden dat zij moedertaalsprekers van het Berbers waren, maar dat de thuistaal Marokkaans-Arabisch was. 4.4 Karakteristieken van de taal In het Marokkaans-Arabisch bestaan drie volle klinkers (a, i en u) en twee onstabiele, korte klinkers, de ronde Å (uitgesproken zoals in het Engelse put) en de ongeronde sjwa. De volgende consonanten komen voor: Tabel 6: Marokkaans-Arabische consonanten (Nortier, 1989) Bilabiaal Stop Labiodentaal b b. Frica- Apicaal Palataal Velair t t. d d. f s s. z z. gk šÅ¾ Uvulair q x .g tief Nasaal Faryngaal ? h. h 9 m m. Late- n l l. raal Flap- r r. tril Semi- w Glottaal y vocaal Enkele consonanten zijn weergegeven met een punt achter de letter. Dit zijn keelklanken. Ze worden ook wel emfatische klanken genoemd, omdat uitspraak ervan de indruk geeft dat ze met nadruk worden uitgesproken. Ze zijn lager van toon dan de niet-emfatische klanken. Bij één klank staat de punt voor de letter, namelijk bij .g. Deze wordt uitgesproken zoals de Franse r in Paris. 63 De 9 is een faryngale consonant. De uitspraak lijkt op de a in het Engelse father, maar het is een stemhebbende fricatief. De ? is de glottale stopklank. Arabische woorden zijn meestal gebaseerd op een root bestaande uit drie consonanten. Deze root wordt aangevuld met klinkers en medeklinkers. Bijvoorbeeld de consonanten k t b drukken altijd een betekenis uit die te maken heeft met ‘schrijven’. De exacte betekenis van een woord wordt bepaald door het patroon van klinkers en affixen. Bijvoorbeeld: kataba = hij schreef, ktab = boek. In het Marokkaans-Arabisch komen geen volledig ongemarkeerde vormen voor. De werkwoorden zijn altijd vervoegd voor persoon, getal, tijd en geslacht. Volgens Ennaji (1985) wijst dit erop dat het werkwoord een centrale syntactische en morfologische positie inneemt. Toch heeft het Arabisch wel een soort niet-finiete werkwoordsvormen. Er zijn namelijk vormen die niet gemarkeerd zijn voor tijd. Deze vormen zijn opgenomen in de Lexilijst, bijvoorbeeld: (2) ye-msji go:IMPF:3:PL1 Deze vorm kan niet op zichzelf een uiting vormen, net zoals Nederlandse infinitieven dat niet kunnen. Het verschil met Nederlandse infinitieven is dat de Arabische infinitieven wel vervoegd zijn voor persoon, getal en geslacht (Nortier, 1989). Overigens zijn deze vormen wel gemarkeerd voor het imperfectum, maar er zou een duratief of toekomstpartikel toegevoegd moeten worden om een uiting te vormen. Daarom noemt men deze vorm niet gemarkeerd voor tijd. Er zijn vier verschillende soorten werkwoorden. Daarnaast is er een klein aantal onregelmatige werkwoorden dat anders vervoegd wordt. Persoon, geslacht en getal worden op het werkwoord aangegeven door middel van prefixen en suffixen. Er zijn twee mogelijke tijden: het perfectum en het imperfectum. Het perfectum wordt gebruikt voor het verleden en wordt uitgedrukt door middel van een suffix dat persoon, getal en geslacht aangeeft. Het imperfectum wordt gebruikt om het heden en de toekomst aan te geven en maakt gebruik van een prefix, die persoon en geslacht aangeeft, en een suffix die getal aangeeft. 1 IMPF = imperfect tense PL = plural (Nortier, 1989) 64 Nomina in het Marokkaans-Arabisch kunnen ofwel mannelijk, ofwel vrouwelijk zijn. Vrouwelijke nomina eindigen normaliter op een –a. De meeste nomina en adjectiva hebben een enkelvouds- en een meervoudsvorm. Deze meervoudsvormen zijn meestal onvoorspelbaar. Enkele nomina hebben ook een duale vorm (Nortier, 1989). (3) lehya (4) ktab (5) ktub beard:F:SG book:M:SG book:M:PL “Beard.” “Book.” “Books.” (Harrell, 1965) Het Marokkaans-Arabisch is een pro-droptaal, dus persoonlijke voornaamwoorden verschijnen alleen als er geen werkwoord in de zin staat, of als er sprake is van nadruk. Voornaamwoordelijke elementen worden uitgedrukt met behulp van clitics. Dit geldt bijvoorbeeld voor het uitdrukken van bezitsrelaties bij nomina of voor het aangeven van het direct of indirect object bij verba. Het is de vraag of dit echte clitics zijn of suffixen zoals Harrell (1962) ze noemt. Het onderscheid tussen deze twee termen is in dit geval niet geheel duidelijk. Clitics zijn losse woordjes, die echter niet alleen voor kunnen komen. Ze horen bij een ander woord in de zin, zoals ‘Ik zie ‘m’. ‘m’ is een clitic, want dit element kan niet los voorkomen en ook niet op een andere plek in de zin staan. Suffixen en prefixen zitten aan een woord vast, zoals ‘-je’ in ‘huisje’. Vooral bij een taal als het Marokkaans-Arabisch, die normaalgesproken niet geschreven wordt, is het moeilijk aan te geven of het gaat om een apart woordje, of dat het element aan het woord vastzit. Het verschil tussen suffixen of prefixen en clitics is dus niet duidelijk bij het Marokkaans-Arabisch. (6) (9) 2 ktab -i (7) šeft (8) šeft- ha book:M:SG PC:1:SG see:PF:1:SG see:PF:1:SG PC:3:F:SG “My book.” “I saw.” “I saw her.” sifet- hÅm- l- i send:PF:3:M:SG PC:3:PL to PC:1:SG2 PC = pronoun clitic PF = perfect tense F = feminine M = masculine SG = singular (Nortier, 1989) 65 “He sent them to me.” (Harrell, 1962) De lidwoorden worden uitgedrukt door middel van prefixen. Er zijn bepaalde lidwoorden, zoals in voorbeeld (10) en onbepaalde. Onbepaaldheid wordt uitgedrukt door ofwel het lidwoord weg te laten, of door het woordje ši toe te voegen (met als betekenis “een of andere”), of door het woord wahed (“één”) toe te voegen, samen met het bepaald lidwoord. Als wahed namelijk als telwoord wordt gebruikt, dan komt het na het nomen en bovendien wordt het dan verbogen voor geslacht. (10) l- bab (11) ši- ktab DEF- door:M:SG some book:M:SG “The door.” “A book.” (Harrell, 1962) (12) wahed le- mra one:M:SG DEF woman:F:SG “A woman.” (Nortier, 1989) Adjectiva komen na nomina. Nomina en adjectiva corresponderen met elkaar wat betreft getal en geslacht. (13) ktab mezyan (14) book:M:SG good:M:SG “A good book.” ktub mezyanin book:M:PL good:M:PL “Good books.” (Nortier, 1989) Adverbia kunnen zowel aan het begin van een zin staan, als aan het eind, maar ook midden in de zin kunnen adverbia voorkomen. (15) ka- nemši nhar DU- go:IMPF:1:SG day:M:SG wahed le- l- medrasa one:M:SG to- DEF- school:F:SG3 “I go to school one day.” 3 DEF = definite article DU = durative (Nortier, 1989) 66 (Nortier, 1989) Het Klassiek Arabisch heeft een VSO-volgorde. In het Marokkaans-Arabisch komen verschillende woordvolgordes voor. Volgens Ennaji (1985) is de VSO-volgorde de ongemarkeerde woordvolgorde in het Marokkaans-Arabisch. SVO wordt alleen gebruikt onder speciale omstandigheden. Omdat het Arabisch een pro-droptaal is wordt het persoonlijk voornaamwoord vaak niet uitgedrukt. Het is dan onmogelijk om te bepalen of de woordvolgorde van een zin VSO of SVO is (Nortier, 1989): (16) dewwez žuž de- s- simanat spend:PF:3:M:SG two of- DEF week:F:PL “He spent two weeks.” (Nortier, 1989) Er zijn twee soorten vraagzinnen: vraagzinnen waarop ‘ja’ of ‘nee’ geantwoord moet worden en open vragen. Die laatste kunnen worden gevormd door een vragend bijwoord (17), een vragend voornaamwoord (18) of door een vraagintonatie (19). (17) fayn n- nas? (18) škun huwa? (19) mša-t l-bareh? where DEF-people? who he? go:PF:3:SG:F yesterday “Where are the people?” “Who is he?” “She went yesterday?” (Harrell, 1962) Ja/nee-vragen kunnen worden gevormd door middel van een vraagintonatie of ze kunnen worden ingeleid door het partikel waš. Er is geen sprake van inversie. Caselli et al. (1995) noemen een aantal crosslinguïstische verschillen tussen talen die invloed kunnen hebben op de volgorde waarop nomina en verba worden verworven. Deze komen ongeveer overeen met de criteria van Tardif et al. (1997) die in paragraaf 2.7 worden genoemd. 1. Woordvolgorde Bij talen die een SVO-volgorde hebben, komt het werkwoord meestal in het midden van een uiting. Daar valt het niet zo op. Woorden die aan het begin of aan het eind van een uiting staan, vallen meer op. Men gaat er bij woordenschatverwerving door jonge kinderen vanuit dat vooral woorden aan het 67 eind van een uiting makkelijker geleerd worden. Het Marokkaans-Arabisch heeft een VSO-volgorde. Dat betekent dat werkwoorden dus vaak aan het begin van een uiting voorkomen. Dit is niet zo’n opvallende plaats als aan het eind van een uiting, maar wel opvallender dan in het midden van een uiting. 2. Subjectomissie Het Marokkaans-Arabisch is een pro-droptaal. Caselli et al. (1995) vergelijken Engels (geen pro-drop) en Italiaans (pro-drop) met elkaar en merken hierbij op dat bij Italiaanse kinderen een veel grotere proportie van de inhoudswoorden die ze horen uit werkwoorden bestaat. Dit komt doordat er geen apart onderwerp aangegeven hoeft te worden in de zin. Dat zou ook voor het MarokkaansArabisch kunnen gelden. 3. Clitics In het Italiaans verschijnen persoonlijke voornaamwoorden in de vorm van clitics voor het werkwoord (Caselli et al., 1995). Dit leidt tot een SOV-volgorde, of een OV-volgorde, omdat het subject kan worden weggelaten. Het werkwoord staat dus vaak op een saillante laatste positie. In het Marokkaans-Arabisch worden persoonlijke voornaamwoorden uitgedrukt door suffixen (of clitics), dus na het werkwoord. Zie voorbeeld (6) en (7).Dat leidt dus niet net zoals in het Italiaans tot een OV-volgorde. In het Marokkaans-Arabisch komt het werkwoord voor het direct object. 4. Agreement Engelse werkwoorden bevatten weinig informatie over het onderwerp waar het bij aansluit. Italiaanse werkwoorden dragen veel meer informatie. Italiaanse werkwoorden sluiten namelijk aan bij het onderwerp in persoon en getal. In het Engels is er slechts een onderscheid tussen derde persoon enkelvoud (-s) en de rest. Daarom gebruiken Italiaanse luisteraars agreement om de rol van elementen in de zin te bepalen (Caselli et al., 1995). Volgens Caselli et al. draagt het feit dat Engelse werkwoorden weinig informatie bevatten bij aan de relatief late verwerving. In het Marokkaans-Arabisch worden werkwoorden altijd vervoegd voor persoon, geslacht en getal. Nomina worden verbogen voor geslacht en getal. Werkwoorden bevatten dus meer informatie dan nomina. In het Marokkaans-Arabisch staan werkwoorden dus vaak vooraan in de zin. Dit is een redelijk opvallende plaats. Ook is het een pro-droptaal, dus relatief meer 68 inhoudswoorden zijn werkwoorden. De persoonlijke voornaamwoorden komen echter na het werkwoord, dus er is geen sprake van een OV-volgorde, zoals in het Italiaans. Verder bevatten Marokkaans-Arabische werkwoorden veel informatie (meer dan nomina), dus het zijn belangrijke woorden in de taal. Wel is het zo dat woorden die meer inflecties hebben meestal moeilijker te leren zijn. De meeste MarokkaansArabische werkwoorden zijn echter regelmatig en daardoor gemakkelijk. De verbuiging van nomina voor bijvoorbeeld meervoud is daarentegen niet regelmatig en daardoor moeilijker. Het is voor dit onderzoek van belang te weten wat enkele belangrijke karakteristieken van het Marokkaans-Arabisch zijn, omdat deze eigenschappen bepaalde resultaten kunnen verklaren. Door crosslinguïstische verschillen kan het voor kinderen gemakkelijker zijn om werkwoorden te leren of gemakkelijker om nomina te leren. In hoofdstuk 6 zal gekeken worden of er verschil is tussen het Marokkaans-Arabisch en het Nederlands met betrekking tot de verwerving van nomina en verba, en of deze verschillen terug te voeren zijn op de verschillende karakteristieken van de talen. Daarom zullen in de volgende paragraaf kort enkele verschillen tussen het MarokkaansArabisch en het Nederlands worden besproken. 4.5 Vergelijking met het Nederlands In het Nederlands worden nomina, verba, adjectiva en adverbia onderscheiden. Er is echter een grote hoeveelheid woorden die zowel als adjectivum als als adverbium gebruikt kunnen worden. In voorbeeld (20) wordt ‘mooi’ gebruikt als adjectivum en in voorbeeld (21) als adverbium: (20) Dat is een mooi huis. (21) Zij danst mooi. In andere talen zijn deze woordsoorten wel van elkaar gescheiden. In het Engels wordt bijvoorbeeld in het eerste geval beautiful gebruikt en in het tweede geval beautifully. Nomina worden in twee groepen verdeeld: mannelijke en vrouwelijke nomina enerzijds en onzijdige nomina anderzijds (Bornstein et al., 2004). Verder worden ze vervoegd 69 voor getal. De meeste meervoudsvormen worden gevormd door –en aan het woord toe te voegen. Hierop bestaat een klein aantal uitzonderingen. In het Marokkaans-Arabisch is het meervoud echter meestal onvoorspelbaar. In het Nederlands is er sprake van verb second. Dit wil zeggen dat het finiete werkwoord in de hoofdzin direct na het eerste zinsdeel komt. Het niet-finiete werkwoord komt achteraan in de zin. De woordvolgorde in hoofdzinnen is dus SVO. (22) De jongen leest een boek. (23) De jongen heeft een boek gelezen. In bijzinnen is de woordvolgorde anders. Alle werkwoorden komen dan achteraan in de zin (Van Kampen & Wijnen, 2000): (24) Ik zie dat de jongen een boek leest. (25) Ik zie dat de jongen een boek heeft gelezen. De plaats van het werkwoord is dus lastiger dan in het Marokkaans-Arabisch, waar het doorgaans aan het begin van de uiting staat. In het Nederlands wordt het werkwoord vervoegd voor persoon, getal en tijd. In het meervoud is er geen onderscheid tussen eerste, tweede en derde persoon. In het enkelvoud is er een verschil tussen eerste persoon enerzijds en tweede/derde persoon anderzijds, bijvoorbeeld ‘ik loop’ versus ‘jij loopt’ en ‘hij loopt’ (Van Kampen & Wijnen, 2000). Wat betreft de verleden tijd is er een onderscheid tussen sterke en zwakke verba. Zwakke werkwoorden worden gevormd door aan de stam van het werkwoord –de of –te toe te voegen, bijvoorbeeld ‘hij werkte’. Sterke werkwoorden ondergaan een klinkerverandering, bijvoorbeeld ‘hij liep’. Dit wordt vaak fout gedaan door kinderen. Er is dan sprake van overgeneralisatie van de vervoeging van zwakke verba naar sterke verba. Kinderen zeggen vaak ‘hij liepte’ (Van Kampen & Wijnen, 2000). Nederlands is geen pro-droptaal zoals het Marokkaans-Arabisch, dus het is verplicht om het onderwerp in de zin uit te drukken. Van Kampen & Wijnen (2000) zeggen dat in het Nederlands de morfologie redundant is. Uit de volgorde van de zinsdelen kan men afleiden wat de functie is van alle constituenten. Dit is in tegenstelling tot het Italiaans, waar de morfologie autonoom is. Een Nederlandssprekend kind kan dus de werkwoorden onvervoegd laten en door het pronomen en de woordvolgorde aangeven 70 wat het bedoelt, bijvoorbeeld ‘ik lopen’. Italiaanse kinderen moeten hun werkwoorden wel vervoegen. Onderspecificatie van de morfologie moet dus in het Italiaans eerder verdwijnen dan in het Nederlands. De auteurs concluderen dat autonome morfologie eerder wordt verworven dan redundante morfologie. Ook in het Marokkaans-Arabisch is de morfologie autonoom. Op de vier door Caselli et al. (1995) genoemde punten (zie paragraaf 4.4) heeft het Nederlands de volgende eigenschappen: 1. Woordvolgorde Het Nederlands heeft een SVO-volgorde voor bewerende hoofdzinnen, maar SOV voor bijzinnen. Er is sprake van inversie bij vraagzinnen, dus dan kan het werkwoord vooraan in de zin komen. De plek van het werkwoord varieert dus. 2. Subjectomissie Het Nederlands is geen pro-droptaal. Het subject moet altijd uitgedrukt worden. 3. Clitics Er is in beperkte mate sprake van clitics. Men kan bijvoorbeeld zeggen “Ik zag ‘m”. ‘m’ is hier een clitic, want het kan niet op zichzelf staan en ook geen andere positie innemen in de zin. Deze clitics komen na het werkwoord, op de positie van het direct object. 4. Agreement Het werkwoord wordt vervoegd voor getal en tijd. Nomina worden alleen verbogen voor getal, enkelvoud en meervoud. Het werkwoord staat in het Nederlands vaak op een onopvallende middenpositie in de zin. De SVO-volgorde komt het meest voor. Het werkwoord kan echter ook aan het begin van de zin of aan het eind komen. Het subject moet altijd uitgedrukt worden, dus vergeleken met pro-droptalen is de proportie werkwoorden kleiner. Werkwoorden bevatten meer informatie dan nomina, maar zijn daarom wel moeilijker te vormen. Samen met het feit dat er in de vervoeging van werkwoorden meer onregelmatigheden voorkomen dan in de verbuiging van nomina leiden deze zaken tot een voordeel voor de verwerving van nomina. 71 5. Methode 5.1 Proefpersonen De proefpersonen zijn 232 jonge kinderen die thuis het Marokkaans-Arabisch als belangrijkste taal hoorden. Het merendeel van deze kinderen is afkomstig uit Amsterdam. De gegevens zijn afkomstig van het normeringsonderzoek naar de tweetalige Lexilijst Marokkaans-Arabisch/Nederlands, uitgevoerd door Stichting Studio Taalwetenschap. De kinderen waren voor het grootste deel tussen de 20 en 28 maanden oud, maar er waren ook enkele oudere en jongere kinderen. De leeftijdsrange liep van 18 maanden tot 34 maanden. De gemiddelde leeftijd was 24 maanden. De standaarddeviatie hierbij was 96,30 dagen. Tabel 7: Aantal proefpersonen per leeftijdsgroep in maanden Aantal maanden Aantal kinderen 18 4 19 5 20 24 21 22 22 22 23 21 24 24 25 25 26 14 27 30 28 28 29 6 30 1 31 1 32 3 33 1 34 1 N = 232 Gemiddelde leeftijd = 24 maanden Standaarddeviatie = 96 dagen Er zijn iets meer vrouwelijke dan mannelijke proefpersonen: 125 meisjes (53,9%) en 107 jongens (46,1%). 72 Bij het merendeel van deze kinderen zal sprake zijn geweest van simultane taalverwerving, of Bilingual First Language Acquisition (De Houwer, 1995, zie paragraaf 2.8), aangezien het om zeer jonge kinderen gaat die zowel Nederlands als Marokkaans-Arabisch om zich heen horen. Dit is echter niet met zekerheid te zeggen. Onder de proefpersonen zouden ook kinderen kunnen zijn die alleen MarokkaansArabisch spreken en die later pas Nederlands leren. In de dataverzameling is één kind te vinden dat alleen Arabische woorden produceerde en geen Nederlandse. De moedertaal van beide ouders was Marokkaans-Arabisch. Dit was ook de belangrijkste taal die tegen het kind werd gesproken. Dit kind was 22 maanden oud. Er zijn twee kinderen die alleen Nederlandse woorden produceerden, hoewel de ouders in beide gevallen aangaven dat tegen het kind zowel Marokkaans-Arabisch als Nederlands werd gesproken. De moedertaal van de moeder van een van die twee kinderen is Nederlands. De moedertaal van de vader is Marokkaans-Arabisch en Nederlands. Waarschijnlijk is de vader dus in Nederland opgegroeid. In dit het geval is het niet zo vreemd dat het kind veel Nederlandse woorden produceert, omdat de moeder waarschijnlijk de belangrijkste verzorger is. De moedertaal van de moeder van het andere kind is Marokkaans-Arabisch. De moedertaal van de vader van dat kind is Egyptisch. Misschien dat de ouders onderling ook veel in het Nederlands communiceren, omdat ze niet dezelfde moedertaal spreken. Bij deze kinderen kan het ook zijn dat ze wel degelijk Arabische woorden produceren, maar dat deze toevallig niet op de lijst stonden. Het waren in beide gevallen vrij jonge kinderen (22 en 21 maanden). De groep proefpersonen is heterogeen. Er is een grote diversiteit onder de kinderen wat betreft taalgebruik thuis, de leeftijd waarop het kind voor het eerst elk van beide talen hoort, de tijd dat het kind elk van beide talen hoort en spreekt en de contexten (Patterson, 1998). 5.2 Verzamelen van gegevens Zoals beschreven in paragraaf 3.4.3 zijn door Stichting Studio Taalwetenschap Marokkaanse vrouwen benaderd die zowel het Marokkaans-Arabisch als het Nederlands beheersen. Aan hen is uitgelegd wat het onderzoek inhoudt en ze hebben instructie 73 gekregen over hoe de Lexilijst ingevuld moet worden. Vervolgens zijn zij binnen hun eigen netwerk van familie, vrienden, kennissen en collega’s gaan zoeken naar ouders met kinderen binnen de doelgroep. De contactpersonen is uitgelegd dat de kinderen de woorden zelf moesten zeggen, dus woorden geproduceerd na imitatie tellen niet mee. Verder hoefden de kinderen de woorden niet perfect te produceren. De fonologische vorm moest wel consequent gebruikt worden voor een bepaald concept. Met de contactpersonen is regelmatig een afspraak gemaakt, zodat zij hun ingevulde lijsten konden inleveren en betaald konden worden voor de lijsten. Ook konden ze vragen stellen over dingen die onduidelijk waren en opmerkingen en reacties van ouders melden. 5.3 Materiaal De tweetalige Lexilijst Marokkaans-Arabisch/Nederlands is deels al beschreven in paragraaf 3.4, maar zal hier nog iets uitgebreider worden besproken. Een kopie van de lijst is opgenomen in de Appendix. De lijst bestaat uit een voorblad, waarop de ouders enkele gegevens over het kind en over zichzelf moeten invullen, en drie pagina’s met woorden. Deze woorden zijn ingedeeld in semantische categorieën. Zowel het Marokkaans-Arabische woord als het Nederlandse equivalent is afgedrukt. Ouders moeten aangeven of hun kind een bepaald woord produceert en kunnen dus ofwel een van beide talen aankruisen, ofwel allebei, of allebei niet. De lijst bestaat uit 243 Arabische woorden en dertien Arabische zinnetjes en 237 Nederlandse woorden en dertien Nederlandse zinnetjes. Het aantal Arabische en Nederlandse woorden dat in een categorie gebruikt wordt is dus niet overal hetzelfde. Dat komt doordat er twee verschillende woorden voor één concept in een taal gebruikt kunnen worden. Bijvoorbeeld het Nederlandse woord ‘vogel’ heeft twee Arabische equivalenten: farch en hamatoen. De tweetalige Lexilijst is ingedeeld in vijftien semantische categorieën. Verder is er nog een rubriek ‘Zinnetjes’. De volgende categorieën worden onderscheiden: 74 Tabel 8: De semantische categorieën en de woordsoorten op de Lexilijst Categorie Woordsoort Spel Onomatopee & routine Nomina Adjectiva Nomina Nomina Nomina Verba Nomina Nomina Gesloten Klasse (functiewoorden, partikels en bijwoorden) Nomina Gesloten Klasse (voorzetsels en bijwoorden) Nomina Nomina Onomatopee & routine Allerlei dingen Hoe is het? Kleding Buiten Dieren Dingen doen In huis Eten en drinken Kleine woordjes Voertuigen Plaats en tijd Lichaamsdelen Mensen Gezegden en uitroepen Zinnetjes Voorbeeld Nederlands Aantal woorden MarokkaansArabisch 7 Aantal woorden Nederlands 7 woef 17 23 9 12 16 41 21 16 31 17 23 9 11 15 41 20 15 31 bal vies jas bos hond slapen raam ijsje ik 8 12 8 12 auto morgen 9 10 11 9 9 10 oog meisje hoera 13 13 jas aan De naam van de categorie, zoals die op de Lexilijst wordt genoemd, staat hier vermeld. Daarachter staat de woordsoort die in die categorie gebruikt wordt (naar analogie met Schlichting & lutje Spelberg, 2004). Er kunnen vraagtekens bij een indeling in semantische categorieën gezet worden. Er had ook gekozen kunnen worden voor een indeling die overeenkomt met de manier waarop woorden in het hoofd zijn opgeslagen. In het hoofd van een kind zijn woorden misschien opgeslagen in de vorm van gebeurtenisschema’s (zie paragraaf 2.3). Voor kinderen is het woord ‘melk’ dan niet verbonden met ‘snoepje’ of ‘aardappel’, maar met ‘slabbetje’, ‘tafel’ en ‘fles’. Dit zou een andere indeling opleveren dan de indeling die is gekozen voor de Lexilijst. Er is echter gekozen voor deze indeling in de eerste plaats om het ouders gemakkelijker te maken. Schlichting & lutje Spelberg (2002) geven als reden dat de indeling in rubrieken de waarneming van de ouders leidt. Zij kunnen zich op deze manier makkelijker situaties voor ogen halen. 75 De indeling in deze categorieën is gebaseerd op de manier waarop Rescorla het heeft gedaan in de LDS. Ook de MacArthur CDI is ingedeeld in semantische categorieën. Verder wordt deze semantische indeling gesteund door onderzoek van onder andere Schlichting (1996) en Nelson (1973). Nelson heeft gegevens voor haar onderzoek verzameld door middel van observaties en zij heeft de eerste 50 geproduceerde woorden van haar proefpersonen ingedeeld in de volgende semantische categorieën: Dieren, Eten, Speelgoed, Voertuigen, Huishoudelijke artikelen, Kleding, Mensen, Lichaamsdelen en Overig. Deze semantische categorieën zijn grotendeels ook terug te vinden op de Lexilijst. In paragraaf 2.4 in tabel 1 staan de meest voorkomende vroege woorden in het Nederlands. Deze tabel staat hier nog een keer afgedrukt met daarachter de semantische categorie waar deze woorden in zouden vallen. Tabel 9 De eerste 50 geproduceerde woorden van Nederlandse kinderen (Schlichting, 1996) en de bijbehorende semantische categorie op de tweetalige Lexilijst Marokkaans-Arabisch/Nederlands Substantieven (213) Werkwoorden (49) Sociale uitdrukkingen (45) 35 auto Voertuigen 20 eten Dingen doen 26 bah Gezegden 32 mama Mensen 17 zitten Dingen doen 25 dag Gezegden 32 papa Mensen 15 slapen Dingen doen 24 nee Gezegden 30 poes Dieren 14 poepen Dingen doen 22 au Gezegden 27 opa Mensen 13 drinken Dingen doen 21 ja Gezegden 23 koekje Eten/drinken 23 oma Mensen 22 pop 15 hap Gezegden Bijwoorden (29) 13 boem Spel Allerlei dingen 21 uit Plaats/tijd 13 kiekeboe Spel 21 bal Allerlei dingen 20 op Hoe is het? 21 paard Dieren 13 buiten Plaats/tijd Overige (29) 18 hond Dieren 13 open Plaats/tijd 21 die 17 jas Kleding 17 klok Allerlei dingen 16 eend Dieren 14 appel Eten/drinken 14 boek Allerlei dingen 13 aap Dieren 13 kaas Eten/drinken Kleine woordjes 76 De meeste semantische categorieën die op de Lexilijst staan, komen ook voor in deze tabel en bevatten dus woorden die behoren tot de eerste 50 woorden van een Nederlandstalig kind. Alleen de categorieën ‘Buiten’, ‘In huis’ en ‘Lichaamsdelen’ komen niet voor in de tabel. Volgens Clark (1993) bepalen cognitief-perceptuele processen welke semantische concepten een kind ontwikkelt. Deze zijn gelijk in verschillende culturen. Men kan aannemen dat kinderen in verschillende culturen dezelfde soort ervaringen hebben in hun directe omgeving. Dit wil niet zeggen dat alle kinderen dezelfde lexicale vormen zeggen, maar ze hebben woorden voor referenten in dezelfde categorieën, zoals eten en drinken, en kleding (Junker & Stockman, 2002). Dit zijn categorieën die op de Lexilijst voorkomen. Ook Dromi (1987) heeft onderzoek gedaan naar woordenschatverwerving. In haar geval was het een case-study van haar dochter Keren die als moedertaalspreker van het Hebreeuws is opgegroeid. Zij heeft de eerste 50 woorden die haar dochter produceerde gepubliceerd. Deze staan afgedrukt in Appendix 1 op pagina 140. In deze tabel is te zien dat ook dit kind woorden gebruikt die passen in de verschillende categorieën van de Lexilijst. Zo behoort het blaffen van een hond tot ‘Spel’, een olifant tot ‘Dieren’ en een schoen tot ‘Kleding’. Ook is echter te zien dat sommige woorden van kinderen niet gemakkelijk in te delen zijn. Zo wordt woord 10 hita toegelicht met ‘said while going out for a walk’. Er is geen duidelijke vertaling voor. Dit woord is nog exclusief verbonden met een gebeurtenisschema. Deze woorden staan vanzelfsprekend niet op de Lexilijst, aangezien ze voor ieder kind verschillen. Op grond van bovenstaande gegevens is het naar mijn mening te verantwoorden dat de Lexilijst is ingedeeld in semantische categorieën. Er had ook gekozen kunnen worden voor een indeling op grond van semantische netwerken die zich in het hoofd van de taalgebruiker bevinden, maar aangezien dit een instrument is dat werkt met ouderrapportage, is gekozen voor een manier die voor de ouders het meest begrijpelijk is. 77 5.4 Procedure In dit onderzoek wordt gebruik gemaakt van een cross-sectioneel onderzoeksdesign. De 232 proefpersonen worden in verschillende leeftijdsgroepen verdeeld en op deze manier wordt gekeken naar de ontwikkeling van de woordenschat. Het voordeel is dat met een cross-sectioneel onderzoek in korte tijd een langere periode kan worden beschouwd. Het nadeel is dat er geen sprake is van een vergelijking van hetzelfde kind op verschillende meetmomenten. Het zijn allemaal verschillende kinderen die vergeleken worden, dus veranderingen ten opzichte van jongere kinderen kunnen ook het gevolg zijn van andere variabelen. De kinderen moesten allereerst ingedeeld worden in leeftijdsgroepen. Daarvoor is gebruik gemaakt van het volgende schema. Aangezien niet alle maanden van het jaar even veel dagen tellen is de indeling in maanden altijd een benadering. Tabel 10: Indeling van het aantal dagen naar leeftijdsgroepen in maanden 18 maanden 532 t/m 562 dagen 19 maanden 563 t/m 592 dagen 20 maanden 593 t/m 623 dagen 21 maanden 624 t/m 653 dagen 22 maanden 654 t/m 684 dagen 23 maanden 685 t/m 714 dagen 24 maanden 715 t/m 745 dagen 25 maanden 746 t/m 775 dagen 26 maanden 776 t/m 804 dagen 27 maanden 805 t/m 835 dagen 28 maanden 836 t/m 865 dagen 29 maanden 866 t/m 896 dagen 30 maanden 897 t/m 926 dagen 31 maanden 927 t/m 957 dagen 32 maanden 958 t/m 987 dagen De scores op de Lexilijst die zijn berekend, zijn de volgende: • Woordscore Marokkaans-Arabisch: alle woorden die het kind produceert in het Marokkaans-Arabisch worden bij elkaar opgeteld. 78 • Woordscore Nederlands: alle woorden die het kind produceert in het Nederlands worden bij elkaar opgeteld. • Zinscore Marokkaans-Arabisch: alle zinnetjes die het kind produceert in het Marokkaans-Arabisch worden bij elkaar opgeteld. • Zinscore Nederlands: alle zinnetjes die het kind produceert in het Nederlands worden bij elkaar opgeteld. • Totaalscore Marokkaans-Arabisch: de woordscore en zinscore MarokkaansArabisch worden bij elkaar opgeteld. • Totaalscore Nederlands: de woordscore en zinscore Nederlands worden bij elkaar opgeteld. • Totaalwoordscore: de woordscores van het Marokkaans-Arabisch en het Nederlands worden bij elkaar opgeteld. • Totaalscore: de totaalscore Marokkaans-Arabisch en de totaalscore Nederlands worden bij elkaar opgeteld. • Conceptscore: alle concepten die een kind kent worden bij elkaar opgeteld. Dat wil zeggen dat als een kind zowel het Arabische kora als het Nederlandse ‘bal’ produceert, dit als twee woorden, maar als één concept wordt geteld. Zoals Pearson et al. (1993) zeggen is de Conceptscore (bij hen Total Conceptual Vocabulary) gelijk aan alle woorden in één taal plus de enkele woorden (dat wil zeggen de woorden die niet gelexicaliseerd zijn in de eerste taal) in de andere taal. Aangezien dit onderzoek over woordenschatverwerving gaat, zullen in het algemeen de woordenschatscores worden gebruikt bij de berekeningen. Om echter een vergelijking te kunnen maken met de eentalige Nederlandse groep uit het onderzoek van Schlichting & lutje Spelberg (2002), zullen ook de zinnetjes meegenomen moeten worden. Zij hebben hun normering namelijk gebaseerd op zowel de woorden als de zinnen. Samen vormen deze een Ruwe score. 79 6. Resultaten 6.1 Algemene resultaten In dit hoofdstuk zullen de resultaten van de analyses worden gepresenteerd. Allereerst zullen wat algemene resultaten worden gegeven. In de volgende paragraaf zullen de resultaten worden gepresenteerd die betrekking hebben op de eerste onderzoeksvraag. Gekeken zal worden naar de invloed van leeftijd en geslacht op de scores op de Lexilijst. De resultaten zullen worden vergeleken met de gegevens van eentalige kinderen. Bovendien zullen de conceptscore en de totaalscore met elkaar vergeleken worden. In paragraaf 6.3 zal van enkele externe factoren onderzocht worden of ze verband houden met de scores op de Lexilijst. Het gaat om het feit of ouders Nederlandse lessen hebben gevolgd, de moedertaal van de ouders, de taal die thuis wordt gesproken en het feit of de kinderen oudere broers of zussen hebben. In paragraaf 6.4 ten slotte zal gekeken worden naar de samenstelling van het vocabulaire. Zowel de semantische categorieën op de Lexilijst als de woordsoorten waartoe deze behoren zullen worden geanalyseerd. In de tekst zelf zijn alleen die tabellen opgenomen die het belangrijkst zijn voor het begrijpen van de tekst. De overige tabellen, waarin de statistische uitvoer wordt weergegeven, staan in de Appendices. In totaal zijn 232 lijsten geanalyseerd. De gemiddelde leeftijd van de proefpersonen was ongeveer 24 maanden. De range was 18 tot en met 34 maanden. De standaarddeviatie was 96,30 dagen. 107 van de proefpersonen waren jongens. Dat is 46,1%. Dat betekent dat er 125 meisjes waren, 53,9%. 36 van de 232 kinderen gingen naar de kinderopvang. Dat is 15,5%. Het gemiddelde aantal kinderen dat een gezin telde, was 2,55. De standaarddeviatie was 1,38. Van de 232 moeders hadden er 174 Nederlandse les gehad. Dat is 75,0%. Van de vaders hadden er 193 Nederlandse les gehad. Dat is 83,2%. De meeste ouders hadden bij thuistaal, de belangrijkste taal die thuis tegen het kind wordt gesproken, ofwel Marokkaans-Arabisch, ofwel Marokkaans-Arabisch en Nederlands ingevuld. Dit was het geval voor 96,6% van de proefpersonen. 80 De gemiddeld behaalde scores staan weergegeven in tabel 10. Tussen haakjes staan de standaarddeviaties. Deze zijn zeer hoog. De variatie tussen de 230 proefpersonen is dus heel groot. Blijkbaar loopt de woordenschat van kinderen van 18 tot en met 34 maanden dus zeer uiteen. Tabel 11: Gemiddelde scores voor het Marokkaans-Arabisch en het Nederlands Marokkaans-Arabisch Nederlands Woordscore 46,34 (38,90) 45,38 (44,39) Zinscore 2,31 (2,80) 1,97 (2,73) Totaalscore per taal 48,69 (41,36) 47,40 (46,81) Totaalwoordscore 91,72 (72,36) Totaalscore 96,09 (76,66) Conceptscore 79,53 (56,34) In totaal zijn er 10 751 Marokkaanse woorden geproduceerd door de proefpersonen en 10 529 Nederlandse woorden. De verhouding is dus Nederlands : Marokkaans-Arabisch = 1 : 1,0211. 6.2 Woordenschatontwikkeling van Marokkaans-Arabisch-sprekende kinderen in Nederland 6.2.1 Samenhang tussen leeftijd, geslacht en scores op de Lexilijst 6.2.1.1 Leeftijd In de onderstaande tabel staan de gemiddelde scores weergegeven per leeftijdsgroep. De standaarddeviaties staan tussen haakjes weergegeven. 81 Tabel 12 Gemiddelde scores per leeftijdsgroep Leeftijd in Aantal proef- Woordscore Woordscore Totaal- maanden personen Marokkaans- Nederlands woordscore Arabisch 18 4 33,00 (16,37) 51,50 (10,79) 84,50 (17,75) 19 5 46,00 (49,41) 53,00 (82,54) 99,00 (129,89) 20 24 26,04 (18,98) 26,42 (20,93) 52,46 (32,89) 21 22 22,05 (19,59) 28,45 (24,68) 50,50 (40,14) 22 22 24,86 (15,60) 30,09 (31,37) 54,95 (42,35) 23 21 46,00 (41,81) 49,81 (54,88) 95,81 (86,13) 24 24 43,58 (31,13) 47,92 (43,12) 91,50 (69,09) 25 25 53,84 (38,10) 53,04 (50,75) 106,88 (81,44) 26 14 58,50 (44,36) 41,93 (36,19) 100,43 (63,25) 27 30 50,83 (41,10) 44,43 (37,61) 95,27 (60,40) 28 28 75,39 (50,27) 66,79 (58,91) 142,18 (87,75) 29 6 69,83 (37,20) 65,50 (33,54) 135,33 (33,10) 30 1 127,00 (-) 160,00 (-) 287,00 (-) 31 1 63,00 (-) 16,00 (-) 79,00 (-) 32 3 76,33 (24,13) 60,33 (67,00) 136,67 (90,91) 33 1 41,00 (-) 35,00 (-) 76,00 (-) 34 1 40,00 (-) 39,00 (-) 79,00 (-) In de tabel is te zien dat de woordscores toenemen met de leeftijd, zoals te verwachten is. Hierbij is vooral gekeken naar de groep proefpersonen met een leeftijd van 20 tot en met 28 maanden, aangezien de overige leeftijdsgroepen weinig proefpersonen bevatten. Zo was er maar één kind van 30 maanden, met een Arabische score van 127, en één van 31 maanden, met een Arabische score van 63. Hieruit kan men dus niet concluderen dat de woordenschatscore van 30 naar 31 maanden afneemt. De standaarddeviaties zijn opnieuw zeer hoog. Dat betekent dat niet alleen binnen de groep als geheel de variatie groot is, maar ook binnen de verschillende leeftijdsgroepen. Allereerst zijn de correlaties berekend tussen de leeftijd van de kinderen in maanden en de verschillende scores op de Lexilijst. 82 Er zijn significante correlaties gevonden met woordscore Marokkaans-Arabisch (.382), woordscore Nederlands (.210), totaalscore (.333), de totaalwoordscore (.334) en met de conceptscore (.353). Deze correlaties zijn significant met een betrouwbaarheid van 99%. De correlaties zijn echter niet zo hoog. De determinatiecoëfficiënt (r², deze geeft het aandeel van de verklaarde variantie weer) is slechts .14 voor bijvoorbeeld het Arabisch en .04 voor het Nederlands. Dat wil zeggen dat slechts 14% van de variantie voor het Arabisch wordt verklaard en slechts 4% van de variantie voor het Nederlands. Er zijn dus nog vele andere factoren die invloed hebben op de woordscore dan alleen de leeftijd. Er is veel variatie tussen kinderen. Bij bovenstaande correlaties is de hele groep proefpersonen beschouwd. Als echter alleen naar de kerngroep wordt gekeken, de kinderen van 20 tot en met 28 maanden, dan zijn de correlaties hoger. Ook deze correlaties zijn allemaal significant: met woordscore Marokkaans-Arabisch (.402), woordscore Nederlands (.246), totaalscore (.370), totaalwoordscore (.370) en conceptscore (.377). De verschillen met de correlaties voor de hele groep proefpersonen zijn echter niet enorm groot. De conclusie dat er veel variatie tussen de kinderen is, blijft gerechtvaardigd. Om die variatie in beeld te brengen zijn ook de percentielscores uitgerekend voor de woordscore Marokkaans-Arabisch, Nederlands en de totaalwoordscore. Deze percentielscores zijn vervolgens weergegeven in grafieken, figuur 5, 6 en 7. Er is voor gekozen om alleen de proefpersonen van 20 tot en met 28 maanden oud mee te nemen in de analyse, omdat de overige leeftijdsgroepen slechts een klein aantal proefpersonen bevatten. In totaal is nu van 210 proefpersonen de percentielscores berekend. Figuur 5 geeft de percentielscores voor de woordenschat Marokkaans-Arabisch, figuur 6 de scores voor het Nederlands, en figuur 7 de totaalscores voor de woordenschat als geheel. 83 Figuur 5: Percentielscores woordenschatscore MarokkaansArabisch Figuur 6: Percentielscores woordenschatscore Nederlands 84 Figuur 7: Percentielscores Totaalwoordscore De variatie is duidelijk te zien in de grafieken. Kinderen die in het 10e percentiel vallen, vertonen nauwelijks enige vooruitgang in woordenschatscore. De kinderen in het 90e percentiel daarentegen, laten een grote stijging van de woordenschat zien. De scores van de kinderen lopen steeds verder uiteen. Bij 20 maanden zijn de verschillen al redelijk groot, maar deze nemen alleen nog maar meer toe. Wat blijkt is dus dat kinderen die behoren tot dezelfde leeftijdsgroep onderling enorm kunnen verschillen. Onderzocht is ook of de woordscore Nederlands en de woordscore MarokkaansArabisch met elkaar samenhangen. Dit bleek inderdaad het geval te zijn. Er is een significante correlatie gevonden van .508. Dat wil zeggen dat als een kind meer woorden in het Arabisch kent, het ook meer Nederlandse woorden produceert. Het blijkt echter dat leeftijd een belangrijke rol speelt in dit effect. Als namelijk gecontroleerd wordt voor leeftijd, dan is de correlatie niet meer significant. Het feit dat kinderen die meer Arabische woorden ook meer Nederlandse woorden produceren heeft dus vooral te maken met de leeftijd van de kinderen. In tabel 12 is te zien dat er een grote sprong is in de woordscores tussen 22 en 23 maanden en 27 en 28 maanden. Daarom is berekend of de gemiddelden ook significant van elkaar verschilden. Dit is gedaan met een T-toets. 85 Dit blijkt inderdaad het geval te zijn voor woordscore Marokkaans-Arabisch en voor Totaalwoordscore. De gemiddelde woordscores Marokkaans-Arabisch bij 22 en 23 maanden verschillen van elkaar met een betrouwbaarheidsinterval van 95% (tweezijdige overschrijdingskans .039). Ditzelfde is het geval bij een vergelijking van de gemiddelde woordscore Marokkaans-Arabisch op 27 en 28 maanden. De tweezijdige overschrijdingskans is .046. Ook voor de Totaalwoordscores zijn er significante verschillen gevonden tussen de gemiddelde score op 27 en 28 maanden. De tweezijdige overschrijdingskans was .020. De scores op 22 en 23 maanden verschilden net niet significant van elkaar. Voor het Nederlands was er geen significant verschil tussen de woordscores op de genoemde leeftijden. Ook tussen andere leeftijdsgroepen is geen significant verschil in woordscores gevonden. Hierbij is opnieuw alleen gekeken naar de scores van kinderen van 20 tot en met 28 maanden. De kinderen in dit onderzoek laten dus op twee momenten een sterke toename zien in de Arabische woordenschat. Dit zou overeen kunnen komen met een woordenschatspurt, afhankelijk van de criteria die woorden gebruikt om de woordenschatspurt te definiëren. Zoals in paragraaf 2.5 staat, nemen sommige onderzoekers aan dat de woordenschatspurt vooral een toename in het aantal nomina inhoudt. Of dit het geval is voor deze data is onderzocht met een T-toets. Voor het Marokkaans-Arabisch blijkt er inderdaad alleen een significant verschil te zijn tussen het aantal nomina met 22 en 23 maanden. Het gemiddeld aantal geproduceerde nomina is respectievelijk 12,18 en 23,52. Dit blijkt een significant verschil bij een betrouwbaarheid van 95%. De andere woordsoorten verschillen niet significant. Bij de vergelijking tussen de woordscore Marokkaans-Arabisch met 27 en 28 maanden blijkt er een verschil tussen het aantal geproduceerde verba en het aantal geproduceerde adjectiva op beide leeftijden. Dat is respectievelijk 7,60 en 11,71 voor verba en 4,37 en 7,32 voor adjectiva. Nomina verschilden ook sterk (24,97 en 36,18) maar dit verschil was niet significant. Dezelfde berekeningen zijn ook toegepast op de Nederlandse gegevens. Er is geen significant verschil gevonden tussen de woordscores met 22 en 23 maanden en met 27 en 28 maanden, maar er was wel een trend in dezelfde richting te zien. Voor de Nederlandse gegevens zijn er geen significante verschillen tussen woordsoorten gevonden. Alleen bij een vergelijking van 20 en 21 maanden is er een verschil gevonden in het aantal Onomatopeeën en Routinewoorden. De gemiddelden waren respectievelijk 3,42 en 4,86. 86 Paragraaf 6.4 gaat verder over de verschillende woordsoorten die geproduceerd zijn. 6.2.1.2 Geslacht Vervolgens is gekeken of er een verschil kan worden gevonden tussen jongens en meisjes, wat betreft woordscores. Bij deze berekeningen is in eerste instantie geen onderscheid gemaakt in leeftijd. Er is gebruik gemaakt van een T-toets. Er blijken geen significante verschillen te bestaan tussen jongens en meisjes wat betreft woordscore Marokkaans-Arabisch, woordscore Nederlands, totaalwoordscore, totaalscore of conceptscore. Dit was noch het geval als de berekening op de hele groep van 232 proefpersonen werd toegepast, noch als alleen de kinderen van 20 tot en met 28 maanden werden geanalyseerd. In tabel 13 staan de gemiddelden afgedrukt van de berekeningen met de hele groep proefpersonen. Tabel 13 Gemiddeld behaalde scores door jongens en meisjes Jongens Meisjes Woordscore MA 44,98 47,50 Woordscore Ned 45,59 45,21 Totaalwoordscore 90,57 92,71 Totaalscore 94,87 97,14 Conceptscore 77,03 81,67 Omdat hier geen verschillen tussen beide geslachten gevonden zijn, is ook gekeken naar interactie-effecten tussen geslacht en leeftijdsgroep. Het zou kunnen zijn dat jongens en meisjes op jongere leeftijd niet van elkaar verschillen, maar later wel. Bij de Lexilijst Nederlands bleek dit het geval te zijn. In de leeftijdsgroep 15-17 maanden waren de verschillen tussen jongens en meisjes niet groot. De verschillen liepen echter op tussen 19 en 23 maanden en daalden weer vanaf 25 maanden (Schlichting & lutje Spelberg, 2002). Met een two-way ANOVA is onderzocht of er dergelijke verschillen te vinden zijn bij de Marokkaanse kinderen. Het interactie-effect ‘aantal maanden’ * ‘geslacht’ bleek niet significant voor woordscore Marokkaans-Arabisch (.979), woordscore Nederlands (.526) en 87 Totaalwoordscore (.839). Het is dus niet het geval dat jongens en meisjes op de ene leeftijd wel van elkaar verschillen en op de andere leeftijd niet. Ook zijn de grafieken getekend waarop de gemiddelde woordscores voor jongens en meisjes apart zijn aangegeven. Dit is gedaan voor de leeftijdsgroepen van 20 tot en met 28 maanden. Deze grafieken staan weergegeven in figuur 8 en 9. Hierin is te zien dat niet de jongens of meisjes consequent hoger scoren. Dit verschilt per leeftijdsgroep. Figuur 8 Gemiddelde woordscore Marokkaans-Arabisch voor jongens en meisjes 88 Figuur 9 Gemiddelde woordscore Nederlands voor jongens en meisjes 6.2.2 Vergelijking met de eentalige Nederlandse groep Met behulp van one-sample T-tests is gekeken of de totaalscores die door de kinderen in het onderzoek behaald zijn, afwijken van de normtabellen voor eentalige Nederlandse kinderen. Deze normtabellen staan afgedrukt in Schlichting & lutje Spelberg (2002). Er zijn tabellen voor jongens en meisjes apart en algemene tabellen (dus voor jongens en meisjes samen). Ook wordt er onderscheid gemaakt tussen tabellen voor Lexilijst A en voor Lexilijst B. Deze tabellen lijken echter erg op elkaar. In dit onderzoek is dan ook de algemene (jongens en meisjes samen) normtabel voor Lexilijst A gebruikt. In de tabel staan de zogenaamde Lexiquotiënten afgedrukt. Het gebruik van Lexiquotiënten komt overeen met de manier waarop IQ-scores berekend worden. De gemiddelde Lexiquotiënt is 100. Deze komt overeen met een Ruwe score (totaal aantal woorden en zinnen) en verschilt per leeftijd in maanden. Als bijvoorbeeld een jongetje van 22 maanden in totaal 140 woorden en zinnetjes heeft geproduceerd op de Lexilijst 89 Nederlands, dan kan in de normtabel worden afgelezen dat het kind een Lexiquotiënt heeft van 110. Hij scoort dus iets hoger dan gemiddeld. Omdat voor deze normtabellen is gekeken naar het totaal aantal woorden en zinnen, is ook voor de vergelijking met de Marokkaanse kinderen gekeken naar de totaalscore (woordscore + zinscore van het Marokkaans-Arabisch en het Nederlands). In de volgende tabel staat de gemiddelde score per leeftijd volgens de normtabellen van de Lexilijst Nederlands: Tabel 14 Gemiddelde score op de Lexilijst Nederlands per leeftijdsgroep (Schlichting & lutje Spelberg, 2002) Aantal 18 19 20 21 22 23 24 25 26 27 Totaalscore 30 40 50 70 95 125 160 175 190 195 maanden Er zal pas gekeken worden naar de scores van de kinderen vanaf 20 maanden oud, vanwege het kleine aantal proefpersonen in de eerste twee groepen. Bij kinderen van 22, 24, 25, 26 en 27 maanden oud wijkt het gemiddelde af van dat van de eentalige kinderen. Er is sprake van een significant lagere score voor de Marokkaans-Arabische kinderen. De normtabellen van Schlichting & lutje Spelberg stoppen bij 27 maanden. Wel geven zij in een andere tabel aan dat kinderen die ouder dan 27 maanden zijn een totaalscore van minimaal 200 woorden moeten hebben. Dit is getoetst met opnieuw een one-sample t-test. De kinderen in het huidige onderzoek bleken significant af te wijken van dit gemiddelde. Ze scoorden lager dan 200 woorden, namelijk gemiddeld 146,27. In de volgende tabel worden de resultaten nog een samengevat. Door middel van asterisken wordt aangegeven of de gemiddelden significant verschilden. Ook is in de tabel aangegeven welk Lexiquotiënt deze kinderen gemiddeld zouden hebben volgens de normtabellen van de Lexilijst Nederlands. Een Lexiquotiënt van 100 is dus een gemiddelde score. 90 Tabel 15 Vergelijking van de totaalscores van de Marokkaans-Arabische kinderen met de normen van de eentalige Nederlandse kinderen Aantal 20 21 22 23 24 25 26 27 50 70 95 125 160 175 190 195 54,3 52,7 57,3 100,1 96,0 112,8 105,4 100,2 ** ** ** ** 91 90 85 82 maanden Totaal score Lexilijst Ned Totaal ** score Lexilijst MA/Ned 101 Lexi- 96 92 95 quotiënt 6.2.3 Conceptscore en totaalscore De kinderen in het onderzoek zijn ingedeeld in vocabulairegroepen op basis van hun totaalscore. Zo zijn negen vocabulairegroepen ontstaan: 0-50 woorden (N = 89), 51-100 (N = 57), 101-150 (N = 37), 151-200 (N = 27), 201-250 (N = 9), 251-300 (N = 8), >300 (N = 5). Dit is gedaan, omdat is gebleken dat er tussen kinderen uit dezelfde leeftijdsgroep zeer veel variatie bestaat. Het is daarom beter om kinderen te vergelijken die hetzelfde vocabulaireniveau hebben en dus ongeveer een gelijk aantal woorden produceren. Voor elk van deze vocabulairegroepen is een gemiddelde conceptscore en een gemiddelde totaalscore berekend. 91 Tabel 16: Aantal proefpersonen per vocabulairegroep met gemiddelde conceptscores en totaalscores en de verhouding daartussen Vocabulaire- Aantal Conceptscore Totaalscore Verhouding groep proefpersonen 0-50 89 28,91 31,61 1 : 1,1093 51-100 57 64,96 74,63 1 : 1,1489 101-150 37 105,05 122,74 1 : 1,1684 151-200 27 147,19 175,44 1 : 1,1919 201-250 9 179,56 227,11 1 : 1,2648 251-300 8 195,63 266,75 1 : 1,364 >300 5 226,60 354,00 1 : 1,5622 Beide scores nemen toe naarmate er sprake is van een hogere vocabulairegroep. Dat is te verwachten, omdat de kinderen juist zijn ingedeeld op basis van de totaalscore. De conceptscore en de totaalscore zijn opgenomen in de tabel om de verhouding weer te kunnen geven. Wat echter ook verandert, is de verhouding tussen beide scores. Zo is de gemiddelde conceptscore bij een vocabulaire van 0-50 woorden 28,91 en de totaalscore 31,61. Dit geeft een verhouding van 1:1,093. Bij een vocabulaire van 251-300 woorden zijn de cijfers gemiddeld 195,63 concepten en 266,75 totaal. Dat is een verhouding van 1:1,364. Het verschil tussen beide getallen neemt dus toe. Bij jonge kinderen is het aantal concepten ongeveer gelijk aan het aantal woorden. Dat betekent dat woorden over het algemeen maar in één van beide talen geproduceerd worden. Later, als het kind meer woorden kent, dan gaat het ook woorden in beide talen produceren. Het concept wordt dus twee keer (een keer in beide talen) gescoord voor de totaalscore, maar één keer voor de conceptscore. Daarom neemt het verschil tussen beide scores toe. Voor een vergelijking met de Nederlandse Lexilijst moet je kijken naar het aantal concepten dat een kind kent. Anders worden concepten twee keer meegeteld, een keer in het Nederlands en een keer in het Arabisch. Daarom zal de vergelijking met de Nederlandse normen nog een keer worden uitgevoerd, maar nu met conceptscores in plaats van totaalscores. Hierbij is weer gebruik gemaakt van een indeling in leeftijd in plaats van in vocabulairegroep, omdat er een vergelijking moet worden gemaakt met de Nederlandse normtabellen. 92 Tabel 17: Vergelijking van de conceptscores van de Marokkaans-Arabische kinderen met de normen van de eentalige Nederlandse kinderen Aantal 20 21 22 23 24 25 26 27 50 70 95 125 160 175 190 195 48,0 47,8 49,6 80,9 81,5 91,5 90,8 84,6 ** ** ** ** ** ** ** 92 88 92 90 87 83 81 maanden Totaal score Lexilijst Ned Concept score Lexilijst MA/Ned Lexi- 97 quotiënt De scores zijn nu dus nog slechter dan in paragraaf 6.2.2. De kinderen van 21 tot en met 27 maanden hebben significant lagere scores dan de eentalige Nederlandse kinderen. In figuur 10 zijn de totaalscores en de conceptscores afgebeeld van de kinderen uit het onderzoek. Ook is de grafiek van de eentalige Nederlandse groep getekend. Hiervoor zijn de gemiddelde scores genomen uit de normtabellen van Schlichting & lutje Spelberg (2002). 93 Figuur 10 Gemiddelde totaalscores en conceptscores van de Marokkaanse kinderen en de Nederlandse normgrafiek Te zien is dat de totaalscores en de conceptscores ongeveer gelijk lopen. De scores van de Nederlandse kinderen wijken zeer af. Pas vanaf 20 maanden is de grafiek redelijk betrouwbaar, want in die leeftijdsgroep zaten 24 proefpersonen. De scores blijken tussen 20 en 22 maanden niet veel te veranderen, maar dan ineens vindt er een grote toename plaats voor zowel conceptscores als totaalscores. Het is duidelijk te zien dat de Marokkaanse kinderen een achterstand vertonen als Nederlandse normen worden gehanteerd. Ten slotte is onderzocht met een t-toets of er verschillen tussen jongens en meisjes zijn wat betreft conceptscores. Dat bleek niet het geval te zijn. Opnieuw zijn er dus geen sekseverschillen aangetroffen in dit onderzoek, net zoals in paragraaf 6.2.1.2. 94 6.3 De invloed van externe factoren op de scores op de Lexilijst 6.3.1 Lessen Nederlands Op de Lexilijst moesten de ouders invullen of zij wel of geen Nederlandse les hadden gevolgd. 174 moeders bleken Nederlandse les te hebben gehad. Dit is 75,0%. 58 moeders hadden dit niet. De cijfers voor de vaders waren 193 wel Nederlandse les (83,2%) en 38 geen Nederlandse les. Met behulp van een T-toets is gekeken of er een relatie bestaat tussen het gevolgd hebben van lessen Nederlands door de ouders en woordenschatscore. Er is geen significante relatie gevonden tussen het gevolgd hebben van lessen Nederlands door de ouders en de woordenschatscore Marokkaans-Arabisch. Dit was ook geen logisch resultaat geweest. Voor zowel vader als moeder is wel een significante relatie gevonden tussen het gevolgd hebben van lessen Nederlands en woordenschatscore Nederlands. De gemiddelde woordscore Nederlands van kinderen van wie de moeder geen Nederlandse les had gevolgd was 31,79. Als de moeder wel les had gehad, dan was de gemiddelde score 49,91. Met een zekerheid van 95% verschillen deze groepen significant van elkaar (.002). De gemiddelde woordscore Nederlands van de kinderen wier vader geen Nederlandse les had gehad, was 30,89. Als de vader wel Nederlandse les had gehad, dan was dat 48,17. Dit is ook een significant verschil (.007). 6.3.2 Moedertaal ouders Er is geen significante relatie gevonden tussen moedertaal van de moeder en woordenschatscore Nederlands of Marokkaans-Arabisch, getest met de one-way ANOVA (respectievelijk F(.819) en F(1,194)). Ook voor de moedertaal van de vader en woordenschatscore Nederlands is geen significant verband gevonden (F(1.368)). Dit was echter wel het geval voor de woordenschatscore Marokkaans-Arabisch (F(2.760). De verdeling van de moedertaal van de vader en moeder was als volgt: 95 Tabel 18: Moedertaal van de ouders Moedertaal Moeder Vader Nederlands 4 1 Marokkaans-Arabisch 200 200 Marokkaans- 14 8 Berbers/Marokkaans 14 20 Overig 0 3 Totaal 232 232 Arabisch/Nederlands Met een Post Hoc test is gekeken naar de richting van het verband. Voor deze test is de vader die als moedertaal het Nederlands had buiten beschouwing gelaten, aangezien de test niet kan worden uitgevoerd als een groep minder dan twee cases bevat. Hieruit blijkt dat de Marokkaans-Arabische woordscore van kinderen wier vaders als moedertaal Marokkaans/Nederlands hebben en de score van kinderen wier vaders Berbers/Marokkaans zijn, significant van elkaar verschillen. De gemiddelde woordscore Marokkaans-Arabisch van de kinderen met Arabisch/Nederlands-sprekende vaders was 21,00. Het gemiddelde van de Berbers/Arabisch-sprekende vaders was 60,65. Dat is dus een stuk hoger. Verder is er een significant verschil tussen de moedertaalgroep ‘Overig’ en de groep met als moedertaal Berbers/Marokkaans. Kinderen wier vader een ‘overige’ taal sprak, behaalden een gemiddelde Marokkaans-Arabische score van slechts 3,33. Wat echter hierbij aangemerkt moet worden is dat het in deze groepen slechts om een zeer klein aantal proefpersonen ging, zoals in tabel 18 te zien is. 6.3.3 Thuistaal Op de Lexilijst moesten de ouders aangeven wat de belangrijkste taal is die thuis tegen het kind gesproken wordt. De verdeling van de thuistalen was als volgt: Tabel 19: Belangrijkste taal die thuis tegen het kind gesproken wordt 96 Thuistaal Aantal Nederlands 4 Marokkaans-Arabisch 89 Marokkaans-Arabisch/Nederlands 135 Berbers/Marokkaans-Arabisch 3 Marokkaans-Arabisch/Frans 1 Totaal 232 Er is geen significante relatie gevonden tussen de taal die thuis tegen het kind wordt gesproken en de woordenschatscore Marokkaans-Arabisch (F (2.120)). Dit was echter wel het geval voor de relatie tussen thuistaal en woordenschatscore Nederlands (F (6.848)). Met een Post Hoc test is gekeken naar welke groepsgemiddelden van elkaar verschillen. Voor deze test is het kind dat als thuistaal Marokkaans-Arabisch en Frans kreeg aangeboden uitgesloten, omdat dit er maar één was en er geen Post Hoc analyses uitgevoerd kunnen worden als een van de groepen uit minder dan twee cases bestaat. Voor de woordenschatscore Nederlands bleken meerdere groepen significant van elkaar te verschillen: de groep die Nederlands als belangrijkste thuistaal had, verschilde van alle drie de overige groepen (de Marokkaanse groep, Marokkaans-Arabisch/Nederlands en Marokkaans/Berbers). De Marokkaanse groep verschilde, behalve van de Nederlandse groep, ook van de Marokkaans/Nederlandse groep. Laatstgenoemde verschil is het belangrijkste, aangezien beide groepen een groot aantal proefpersonen bevatten. De groep met Nederlands als belangsrijkste thuistaal bestond slechts uit vier proefpersonen, dus aan de significante verschillen met deze groep mag niet veel waarde worden gehecht. De kinderen voor wie het Marokkaans-Arabisch de belangrijkste thuistaal was, behaalden een Nederlandse score van 29,76 woorden. De groep met zowel MarokkaansArabisch als Nederlands als thuistalen behaalde een veel hogere score, namelijk 54,65 woorden gemiddeld. Dit was een significant verschil. De groep kinderen met het Nederlands als belangrijkste thuistaal behaalde een Nederlandse score van gemiddeld 103 woorden. Deze score was significant hoger dan de woordscore Nederlands van de drie overige groepen. Zoals gezegd bestond deze groep slechts uit vier kinderen. Bovendien waren alle vier deze kinderen 28 maanden oud. Ze behoorden dus tot de oudere kinderen in het sample. Daarom kunnen uit dit resultaat geen echte conclusies worden getrokken. 97 6.3.4 Broers en zussen Er is geen significante correlatie gevonden tussen het aantal kinderen binnen een gezin en de woordenschatscore Marokkaans-Arabisch of de woordenschatscore Nederlands. De groep proefpersonen is ingedeeld in vier groepen: (1) kinderen die enig kind waren (2) kinderen die één oudere broer of zus hadden (3) kinderen die twee broers of zussen hadden (4) kinderen die drie of meer broers of zussen hadden. Vervolgens is gekeken naar de gemiddelde woordenschatscore per taal. In groep 2 gaat het alleen om kinderen die een oudere broer of zus hebben. Kinderen die zelf het oudste kind thuis waren (en dus een jonger broertje of zusje hadden) zijn uitgesloten voor dit deel van het onderzoek. Het ging om vier kinderen. Uit onderzoek is gebleken dat het hebben van oudere broers of zussen invloed kan hebben op de taalverwerving. Zo vonden Goldfield & Reznick (1990) dat de vijf kinderen uit hun onderzoek die geen woordenschatspurt vertoonden, allemaal niet eerstgeborenen waren (zie paragraaf 2.5). Bij de andere groepen zijn er meerdere broers of zussen, dus kan men ervan uit gaan dat er ten minste één oudere broer of zus aanwezig is in het gezin. Het gemiddelde bleek over de eerste drie groepen steeds verder af te nemen. Maar bij groep vier was het gemiddelde voor beide talen het hoogste. In tabel 20 zijn de gemiddelde scores te lezen. Tabel 20: Scores van kinderen die enig kind waren, één broer/zus hadden, twee broers of zussen hadden of drie of meer broers of zussen hadden 1 kind 2 kinderen 3 kinderen 4 of meer thuis thuis thuis kinderen thuis Aantal proefpersonen 61 61 57 49 Woordscore MA 47,33 42,69 41,21 52,82 Woordscore Ned 45,98 43,10 42,26 50,65 Totaalwoordscore 93,31 85,79 83,47 103,47 Met behulp van een T-toets is gekeken of de gemiddelden significant van elkaar verschilden. Dat was niet het geval. 98 6.4 Samenstelling van het vocabulaire 6.4.1 Rubrieken In deze paragraaf zal de productie van woorden uit de verschillende rubrieken op de Lexilijst geanalyseerd worden. Deze rubrieken staan in tabel 8. Allereerst is een indeling gemaakt naar vocabulaireniveau. Het is een andere indeling dan in paragraaf 6.2.3, omdat hier een onderscheid is gemaakt tussen het MarokkaansArabisch en het Nederlands. Kinderen zijn dus apart voor het Marokkaans-Arabisch en voor het Nederlands ingedeeld op hun vocabulaireniveau. Dit is gedaan, omdat er zeer grote verschillen tussen de kinderen te zien zijn. Vanwege die variatie is ervoor gekozen om de kinderen in groepen in te delen die wat betreft het aantal geproduceerde woorden gelijk zijn. De verdeling over de vocabulairegroepen was als volgt: Tabel 21: Aantal proefpersonen per vocabulairegroep per taal Vocabulairegroep Marokkaans-Arabisch Nederlands 0-25 woorden 89 100 26-50 woorden 63 64 51-75 woorden 28 22 76-100 woorden 27 16 101-125 woorden 10 12 126-150 woorden 10 9 >150 woorden 5 9 Totaal 232 232 De range van het aantal geproduceerde woorden was voor het Marokkaans-Arabisch 0189 en voor het Nederlands 0-201. Per rubriek op de Lexilijst is voor elk kind het aantal woorden opgeteld dat het kind produceerde. Omdat het aantal woorden per rubriek verschilt, kan er niet naar absolute getallen worden gekeken, maar moeten eerst de proporties berekend worden. Zowel voor het Marokkaans-Arabisch als voor het Nederlands zijn de meest geproduceerde rubrieken door kinderen met een klein vocabulaire de rubrieken ‘Spel’, 99 ‘Eten en drinken’ en ‘Gezegden en uitroepen’. Deze kinderen produceren de minste woorden van de categorie ‘Plaats en tijd’. Bij kinderen met een vocabulaire van 101-125 Arabische woorden komt de rubriek ‘Kleine woordjes’ voor in de top 3. Bij kinderen met het grootste vocabulaire in het Marokkaans-Arabisch (meer dan 150 woorden) is deze rubriek zelfs de meest geproduceerde rubriek. In het Nederlandse deel van de woordenschat komt ‘Kleine woordjes’ niet voor in de top 3. Twee rubrieken die in het Nederlands wel voorkomen in de top 3, maar niet in het Arabisch zijn ‘Mensen’ en ‘Voertuigen’. In het Nederlands komt ‘Mensen’ op de eerste plaats bij een vocabulaire van 101-125 woorden en ‘Voertuigen’ bij 51-75 woorden en 126-150 woorden. De minst geproduceerde rubriek is voor het Nederlandse deel van de woordenschat altijd ‘Plaats en tijd’. Voor het Arabisch is dat bij de meeste vocabulairegroepen ook ‘Plaats en tijd’. Ook ‘Dieren’ en ‘Buiten’ worden echter weinig geproduceerd in het Arabisch. Deze bezetten de laatste plaats bij de vocabulaireniveaus van 101-125 woorden, 126-150 woorden en meer dan 150 woorden (ex aequo met ‘Plaats en tijd’). De genoemde gegevens staan weergegeven in tabel 22. Tabel 22: De drie meest geproduceerde rubrieken en de minst geproduceerde rubriek per vocabulairegroep voor het Marokkaans-Arabisch en het Nederlands 0-25 woorden 26-50 woorden 51-75 woorden Marokkaans-Arabisch Nederlands Spel (.1637) Gezegden (.1710) Eten en drinken (.1187) Spel (.1643) Gezegden (.1164) Eten en drinken (.1087) Plaats en tijd (.0131) Plaats en tijd (.0083) Spel (.2971) Eten en drinken (.3031) Eten en drinken (.2669) Spel (.2946) Gezegden (.2280) Gezegden (.2797) Plaats en tijd (.0542) Plaats en tijd (.0469) Spel (.3724) Voertuigen (.4205) Eten en drinken (.3683) Spel (.4026) Kleding (.3651) Eten en drinken (.3818) Plaats en tijd (.1369) Plaats en tijd (.1174) 100 76-100 woorden 101-125 woorden 126-150 woorden >150 woorden Spel (.5185) Spel (.5625) Eten en drinken (.4560) Eten en drinken (.5458) Lichaamsdelen (.4362) Mensen (.5139) Plaats en tijd (.2099) Plaats en tijd (.2135) Eten en drinken (.5813) Mensen (.6389) Kleding (.5778) Voertuigen (.6146) Kleine woordjes (.5677) Spel (.6071) Dieren (.3000) Plaats en tijd (.3194) Eten en drinken (.6875) Voertuigen (.7222) Kleding (.6778) Lichaamsdelen (.7037) Spel (.6571) Mensen (.6914) Buiten (.3500) Plaats en tijd (.4259) Kleine woordjes (.8903) Kleding (.8395) Lichaamsdelen (.8000) Allerlei dingen (.8301) Kleding (.7556) Eten en drinken (.8296) Buiten + Plaats en tijd Plaats en tijd (.6019) (.4833) 6.4.2 Woordsoorten In deze paragraaf wordt gekeken naar de productie van de woordsoorten. De rubrieken op de Lexilijst zijn ondergebracht in vijf woordsoorten: Nomina, Verba, Gesloten Klasse, Adjectiva en Onomatopee & Routine. In tabel 8 is te zien tot welke woordsoort elke rubriek behoort. In tabel 23 staat aangegeven hoeveel items er van elke woordsoort op de Lexilijst te vinden zijn. Tabel 23: Aantal Nomina, Verba, Gesloten Klasse woorden, Adjectiva en Onomatopeeën & Routines per taal op de Lexilijst 101 Woordsoort Marokkaans-Arabisch Nederlands Nomina 118 113 Verba 41 41 Gesloten Klasse 43 43 Adjectiva 23 23 Onomatopee & Routine 18 17 Totaal 243 237 De nomina vormen dus verreweg de grootste groep. Ook in de MacArthur CDI is dat het geval. Caselli et al. (1995) hebben deze lijst gebruikt voor hun onderzoek. Zij geven de volgende argumenten voor het feit dat nomina ongeveer drie keer zo vaak op de lijst voorkomen als verba: ten eerste weerspiegelt deze ratio het volwassen taalgebruik en ten tweede wordt deze ratio teruggevonden in ander onderzoek naar de taalverwerving, zoals dagboekstudies, laboratoriumobservaties en ander onderzoek met woordenlijsten. Alle kinderen zijn ingedeeld naar vocabulaireniveau voor het Marokkaans-Arabisch en het Nederlands apart. Hiervoor is dezelfde indeling gehanteerd als in de vorige paragraaf. Voor elk kind is het percentage van de verschillende woordsoorten van hun totale woordscore uitgerekend. Vervolgens is van deze percentages het gemiddelde genomen per vocabulaireniveau. Deze percentages staan in de volgende tabellen. Tabel 24: Gemiddelde percentages geproduceerde woordsoorten als functie van de totale woordenschat voor het Marokkaans-Arabisch Vocabulairegroep Nomina Verba Gesloten Adjectiva Klasse Onomatopee & Routine 0-25 woorden 48,0% 11,1% 9,8% 6,3% 22,0% 26-50 woorden 51,0% 13,5% 14,0% 8,3% 13,1% 51-75 woorden 51,0% 13,8% 16,0% 9,6% 9,4% 76-100 woorden 51,6% 15,6% 15,2% 8,9% 8,7% 101-125 woorden 47,0% 16,4% 19,2% 9,1% 8,4% 126-150 woorden 48,2% 16,0% 18,9% 9,5% 7,4% >150 woorden 45,4% 17,6% 20,1% 9,8% 7,0% Baseline 48,6% 17,7% 16,9% 9,5% 7,4% Tabel 25: Gemiddelde percentages geproduceerde woordsoorten als functie van de totale woordenschat voor het Nederlands 102 Vocabulairegroep Nomina Verba Gesloten Adjectiva Klasse Onomatopee & Routine 0-25 woorden 51,1% 6,4% 5,2% 7,2% 29,2% 26-50 woorden 55,3% 11,0% 10,1% 10,6% 13,0% 51-75 woorden 56,4% 10,3% 12,8% 9,8% 10,8% 76-100 woorden 54,7% 13,8% 12,0% 9,3% 10,3% 101-125 woorden 56,5% 13,4% 12,5% 9,2% 8,4% 126-150 woorden 49,7% 16,6% 16,5% 9,1% 8,1% >150 woorden 49,5% 16,0% 17,2% 10,3% 7,1% Baseline 47,7% 17,3% 18,1% 9,7% 7,2% Deze gemiddelden staan weergegeven in figuur 11 en 12. Figuur 11 gaat over het Marokkaans-Arabisch en figuur 12 over het Nederlands. De grafieken zijn gemaakt naar analogie met Bates et al. (1994, pagina 95). 103 Figuur 11: MarokkaansArabisch: woordsoorten als percentage van de woordenschat per vocabulairegroep 104 Figuur 12: Nederlands: woordsoorten als percentage van de woordenschat per vocabulairegroep De horizontale lijnen in de grafieken geven de zogenaamde baseline weer. Dat is het percentage dat de Lexilijst van die woordsoort bevat. Zo bestaat bijvoorbeeld 48,56% van het Marokkaans-Arabische deel van de Lexilijst uit Nomina. Als een kind alle woorden op de lijst kent, dan worden deze percentages bereikt. Ook zijn dit de scores die behaald zouden worden als er geen systematisch verband was tussen de grootte van het vocabulaire en de samenstelling ervan (Bates et al., 1994). Dan zouden dus op alle vocabulaireniveaus dezelfde scores behaald kunnen worden. In de grafieken is te zien dat dit niet het geval is. Allereerst zal figuur 11 over het Marokkaans-Arabisch worden toegelicht. Het percentage Nomina dat de kinderen produceren begint rond de baseline. Vervolgens neemt dit toe (bij 26-50 woorden). Dit blijft zo tot het bij 101-125 woorden weer onder de baseline zakt. Dat blijft verder ook zo. De Verba beginnen redelijk laag, maar vertonen over alle vocabulaireniveaus een geleidelijke groei. Uiteindelijk komt het percentage iets boven de baseline uit. 105 De percentages van de woorden uit de Gesloten Klasse beginnen lager dan die van de verba, maar halen die uiteindelijk wel in. Bij Bates et al. was dat niet het geval. Daar bleef de Gesloten Klasse de gehele tijd onder de Verba. Bates et al. namen echter de adjectiva en de verba samen tot een klasse ‘predikaten’. Hier zijn de Adjectiva apart behandeld. Deze beginnen onder de baseline en komen bij 51-75 woorden rond de baseline te liggen. De categorie Onomatopee en Routine ten slotte vertoont een totaal andere grafiek. Bij het laagste vocabulaireniveau is het percentage het hoogst. Vervolgens wordt dat alleen maar minder. Het eindigt ten slotte iets onder de baseline. De figuur met het Nederlandse deel van de woordenschat wijkt op bepaalde punten wat af van de Marokkaanse. De grafiek over de Nomina lijkt meer op de U-vormige figuur die Bates et al. beschrijven. Het percentage Nomina neemt toe (met een kleine afname bij 76-100 woorden) en daalt weer bij 126-150 woorden. Wel blijft het percentage steeds boven de baseline. Het percentage Verba begint een stuk lager bij de Nederlandse woordenschat. Ook komt deze uiteindelijk niet boven de baseline uit. De toename verloopt minder geleidelijk: er is sprake van een toename en vervolgens een stabilisatie of een kleine afname. Dit patroon herhaalt zich drie keer. Hetzelfde patroon is zichtbaar bij het percentage Gesloten Klasse. Daar is sprake van een toename tot de woordenschat 51-75 is, vervolgens een heel lichte afname tot 101125 woorden en ten slotte weer een toename. Dit is dus een soort S-vorm. De grafiek begint iets onder die van de Verba en eindigt er iets boven. De grafiek van de Adjectiva lijkt sterk op die van de Marokkaans-Arabische woordenschat. Hij begint onder de baseline en blijft er vervolgens rondom bewegen. Ook de grafieken van de Onomatopeeën en Routinewoorden lijken sterk op elkaar. Wat wel opvalt, is dat de Nederlandse grafiek een stuk hoger begint, hoewel de baselines ongeveer gelijk zijn. Bij 26-50 woorden zijn de percentages ongeveer gelijk. Dit betekent dat de Nederlandse grafiek een sterkere daling heeft. Eerder is al toegelicht waarom voor de indeling in vocabulairegroepen gekozen is. Omdat het ook interessant kan zijn om te zien of er veranderingen plaatsvinden op bepaalde leeftijden, is ervoor gekozen om dezelfde grafieken nu ook per leeftijdsgroep weer te geven. Alleen de kerngroep (kinderen van 20 tot en met 28 maanden) is geanalyseerd. Met behulp van deze grafieken kan gekeken worden of er een trend weer te geven is naarmate kinderen ouder worden. 106 Figuur 13: Marokkaans-Arabisch: woordsoorten als percentage van de woordenschat per leeftijdsgroep In deze grafiek is te zien dat in eerste instantie het percentage Nomina onder de baseline ligt. Vanaf 22 maanden neemt dit percentage toe. Tegelijkertijd neemt dan het percentage Onomatopeeën & Routines af. Beide grafieken lijken een spiegelbeeld van elkaar. Met 27 maanden bijvoorbeeld neemt het aantal geproduceerde Nomina namelijk weer wat af, terwijl het aantal Onomatopeeën & Routines dan toeneemt. De grafiek van de woorden uit de Gesloten Klasse lijkt op die van de Onomatopee & Routine. Ook deze grafiek stijgt als de grafiek van de Nomina daalt en andersom. Ook voor het Nederlands is dit het geval. 107 Figuur 14: Nederlands: woordsoorten als percentage van de woordenschat per leeftijdsgroep In deze figuur is nog duidelijker te zien dat zowel de grafiek van de Onomatopee & Routine als die van de Gesloten Klasse het spiegelbeeld vormen van de Nomina. Een verschil tussen de figuur van het Marokkaans-Arabisch en het Nederlands heeft te maken met de Verba en de Gesloten Klasse. In figuur 14 over het Nederlands blijven deze beide lijnen ver onder de baseline, terwijl ze in figuur 12 (de figuur gebaseerd op vocabulairegroepen) uiteindelijk de baseline bereiken. Blijkbaar duurt de ontwikkeling van het produceren van Verba en woorden uit de Gesloten Klasse wat langer en gaat deze door na de leeftijd van 28 maanden. Voor het Marokkaans-Arabisch is dit niet het geval. Beide grafieken benaderen de baselines bij 28 maanden. In figuur 11 gaan ze er uiteindelijk iets over heen, dus ook deze nemen nog iets toe. Het verschil tussen figuur 11 en 13 wat betreft het benaderen van de baseline is echter bij het Marokkaans-Arabisch niet zo groot. Ook naar analogie met Bates et al. (1994, pagina 100) is gekeken naar groei als functie van het aantal mogelijkheden dat de lijst biedt. Zoals hiervoor al is aangegeven, bestaat de Lexilijst bijvoorbeeld uit meer Nomina dan Verba (zie tabel 23). 108 Er is gekeken naar het aantal woorden van een bepaalde woordsoort dat een kind gebruikte, en dat is gedeeld door het totaal aantal woorden van die woordsoort op de lijst. Op deze manier kan worden gekeken welke woordsoort het eerst geproduceerd wordt en hoe de productie van elke woordsoort verloopt naarmate het vocabulaire groter wordt. In de volgende twee tabellen staan de percentages van de woordsoorten voor respectievelijk het Marokkaans-Arabisch en het Nederlands. Tabel 26: Gemiddelde percentages geproduceerde woordsoorten als functie van het aantal mogelijkheden op de Lexilijst voor het Marokkaans-Arabisch Vocabulairegroep Nomina Verba Gesloten Adjectiva Klasse Onomatopee & Routine 0-25 woorden 6,1% 4,0% 3,1% 3,6% 13,5% 26-50 woorden 15,7% 12,1% 11,7% 13,5% 25,5% 51-75 woorden 26,1% 20,5% 22,3% 25,0% 31,3% 76-100 woorden 37,2% 32,7% 30,0% 33,0% 40,9% 101-125 woorden 44,6% 44,9% 49,8% 44,8% 52,2% 126-150 woorden 54,1% 51,7% 57,9% 54,8% 54,4% >150 woorden 63,9% 70,7% 77,7% 71,3% 65,6% Tabel 27: Gemiddelde percentages geproduceerde woordsoorten als functie van het aantal mogelijkheden op de Lexilijst voor het Nederlands Vocabulairegroep Nomina Verba Gesloten Adjectiva Klasse Onomatopee & Routine 0-25 woorden 5,5% 2,0% 1,9% 3,6% 16,8% 26-50 woorden 18,8% 10,4% 9,0% 17,9% 28,6% 51-75 woorden 30,2% 15,1% 18,0% 25,9% 38,5% 76-100 woorden 42,0% 29,1% 24,1% 34,8% 52,2% 101-125 woorden 56,6% 37,0% 32,9% 45,7% 55,9% 126-150 woorden 59,7% 54,7% 51,9% 53,6% 64,7% >150 woorden 78,9% 70,7% 72,3% 80,7% 74,5% In figuur 15 en 16 staan de bijbehorende figuren afgebeeld. Dit zijn dus de gemiddelde percentages van het aantal mogelijkheden dat de kinderen per woordsoort hadden. 109 Figuur 15: Marokkaans-Arabisch: gemiddelde percentages woordsoorten per vocabulairegroep 110 Figuur 16: Nederlands: gemiddelde percentages woordsoorten per vocabulairegroep Wat direct opvalt, is dat de grafieken van de verschillende woordsoorten bij het Marokkaans-Arabische deel van de lijst veel dichter bij elkaar liggen dan bij het Nederlandse deel. De horizontale lijnen in de grafieken geven een percentage van 50% aan. Met behulp van die lijnen kan gekeken worden in welke vocabulairegroep de helft van een bepaalde woordsoort geproduceerd wordt. Zo wordt in het Nederlands 50% van de Gesloten Klasse geproduceerd bij een woordenschat van ongeveer 126-150 woorden. In het Arabisch is dat het geval bij 101-125 woorden. De volgorde waarin 50% van een bepaalde woordsoort bekend is, is voor het Nederlandse deel van de woordenschat: Onomatopee en Routine – Nomina – Adjectiva – Verba – Gesloten Klasse. Bij het Marokkaanse deel is dat: Onomatopee en Routine – Gesloten Klasse – Adjectiva – Nomina – Verba. De Gesloten Klasse komt op de laatste plaats in het Nederlands, maar in het Arabisch komt deze woordsoort als tweede. Verder is het verschil in Nomina duidelijk te zien. 111 Kinderen blijken in beide talen te beginnen met Onomatopeeën en Routinewoorden. Op de tweede plek van frequentie in de woordenschat van kinderen met een vocabulaireniveau van 0-25 woorden, komen de Nomina. Daarna is er een verschil tussen de talen. In het Arabisch komen dan de Verba en in het Nederlands de Adjectiva. In het Nederlands komen de Verba en de Gesloten Klasse woorden op de respectievelijk vierde en vijfde plaats. In het Arabisch komen na de Verba de Adjectiva en ten slotte de Gesloten Klasse woorden. De Gesloten Klasse woorden komen in het Arabisch dus laat op gang, maar wat opvallend is, is dat ze uiteindelijk het hoogste percentage bereiken. Bij kinderen met een vocabulaire van meer dan 150 woorden is in het Marokkaans-Arabisch de volgorde als volgt: Gesloten Klasse – Adjectiva – Verba – Onomatopee en Routine – Nomina. In het Nederlands is de volgorde: Adjectiva – Nomina – Onomatopee en Routine – Gesloten Klasse – Verba. De verschillen zijn zeer groot. In het Nederlands staat de Gesloten Klasse juist op de laatste plaats. Van de Nomina wordt het op een na grootste aantal percentage geuit, terwijl dat bij het Arabisch het kleinste aantal is. Wat betreft de Verba is het opvallend om te zien dat kinderen die nog niet zo veel woorden zeggen meer Arabische werkwoorden produceren dan Nederlandse. In de laatste twee vocabulairegroepen is dat echter niet meer het geval. Uiteindelijk zijn de percentages gelijk. Zoals in paragraaf 6.1 staat, zijn er in totaal 10 751 Marokkaans-Arabische woorden geproduceerd en 10 529 Nederlandse. Dat is een verhouding van 1 : 1,0211. Als echter naar de afzonderlijke woordsoorten wordt gekeken, dan is deze verhouding niet terug te vinden. De verhouding voor de complete woordenschat voorspelt dus niet dat de woorden per woordklasse dezelfde verhouding demonstreren. Dat wil zeggen dat de woordsoorten zich niet in beide talen op dezelfde manier ontwikkelen. Zo zijn er meer Nederlandse Nomina geproduceerd dan Marokkaans-Arabische, zoals uit bovenstaande tabellen en grafieken ook is gebleken. De verhouding Nederlandse Nomina: Arabische Nomina is 1 : 0,9525. Voor Verba is de verhouding ook anders. Zoals al eerder beschreven, worden er meer Marokkaanse Verba dan Nederlandse geproduceerd. De verhouding is 1 : 1,2009. Ook wat betreft de Gesloten Klasse was er een verschil in het voordeel van het Marokkaans-Arabisch. De verhouding is 1 : 1,2762. 112 Voor de Adjectiva valt de verhouding weer uit in het voordeel van het Nederlands. Dit blijkt ook bijvoorbeeld uit tabel 25 en 26. De verhouding is 1 : 0,7818. Het verschil in geproduceerde Onomatopeeën & Routines is weer wat minder groot, 1 : 0,9198. Er is ook gekeken naar correlaties tussen de verschillende woordsoorten. Het doel hiervan was om te kijken of de woordsoorten zich gezamenlijk ontwikkelen, of dat de ontwikkeling van de ene woordsoort misschien ten koste gaat van de andere. Voor deze berekeningen is het percentage genomen dat kinderen van een bepaalde woordsoort produceerden, dus bijvoorbeeld geproduceerde nomina gedeeld door het aantal nomina op de lijst. Alle correlaties bleken significant te zijn bij het MarokkaansArabisch. Dat wil zeggen dat kinderen die meer Nomina produceren, ook meer Verba, Gesloten Klasse, Adjectiva en Onomatopeeën en Routinewoorden produceren. Er is sprake van sterke positieve verbanden tussen .703 en .880. Als echter apart per vocabulaireniveau wordt gekeken dan zijn er verschillen. In onderstaande tabel zijn alleen de significante correlaties tussen woordsoorten weergegeven. Tabel 28: Significante correlaties tussen woordsoorten per vocabulairegroep voor het MarokkaansArabisch Vocabulaire- 0-25 26-50 51-75 76-100 101-125 126-150 >150 niveau Nomina .373** -.431* Verba Nomina .309** .279* .672* Adjectiva -.368** Nomina -.446* -.506** -.697* Gesloten Kl -.375** Nomina .922* Onomatopee Verba .213* .336** Adjectiva Verba .378** Onomatopee 113 Adjectiva .240* Gesloten Kl Adjectiva .254* Onomatopee Gesloten Kl .325** Onomatopee *p ≤ .05 ** p ≤ .01 Opvallend is dat er ook sprake is van negatieve correlaties, bijvoorbeeld Nomina en Gesloten Klasse in vier vocabulairegroepen. Dat betekent dus dat als de kinderen meer Nomina produceerden, zij minder Gesloten Klasse woorden produceerden. Dezelfde berekeningen zijn uitgevoerd op het Nederlandse deel van het vocabulaire. Ook hier is er sprake van significante, sterke, positieve correlaties tussen alle woordsoorten (tussen .704 en .916). Ook voor het Nederlandse vocabulaire is vervolgens per vocabulairegroep gekeken. Tabel 29: Significante correlaties tussen woordsoorten per vocabulairegroep voor het Nederlands Vocabulaire 0-25 26-50 51-75 76-100 101-125 126-150 >150 -.818** Nomina Verba Nomina .401** .328** .614* .854** Adjectiva Nomina .327** -.722* Gesloten Kl Nomina .226* -.271* Onomatopee -.694* Verba Adjectiva .572* Verba Gesloten Kl Verba -.432* Onomatopee Adjectiva -.596* -.709* 114 Gesloten Kl Adjectiva Onomatopee Gesloten Kl .217* Onomatopee *p ≤ .05 ** p ≤ .01 Bornstein et al. (2004) hebben bovenstaande correlaties ook berekend voor hun gegevens. Zij hebben kinderen onderzocht van 20 maanden oud uit zeven verschillende landen. Uit het onderzoek bleek dat de kinderen die meer Nomina zeiden, ook meer Verba, Adjectiva en Gesloten Klasse woorden zeiden (ze hebben niet gekeken naar Onomatopeeën en Routinewoorden). Dit was het geval voor kinderen uit alle landen. Zij concluderen hieruit dat individuele verschillen in woordenschat in alle woordklassen doordringen en dat deze covariatie niet taal- of cultuurspecifiek is. Bornstein et al. hebben ook per vocabulairegroep onderzocht of de woordsoorten correlaties vertoonden. Alleen bij kinderen met een woordenschat van 51-100 woorden was dit niet het geval. De onderzoekers nemen aan dat deze kinderen de woordenschatspurt (zie paragraaf 2.5) bereikt hebben en dat dat de oorzaak is voor het ontbreken van correlaties tussen woordklassen. In de woordenschatspurt worden namelijk met name nomina verworven. Voor dit onderzoek is dat echter niet het geval. In tabel 28 en 29 is namelijk te zien dat op alle woordenschatniveaus minimaal één correlatie is gevonden, behalve in de hoogste vocabulairegroep Nederlands. Bornstein et al. hebben geen negatieve verbanden gevonden. In dit onderzoek is dat wel het geval. Waar dit aan ligt is onduidelijk. Het verschijnsel is echter in feite al geobserveerd in figuur 13 en 14. Daar lieten de figuren van de Nomina en de Gesloten Klasse een tegenovergestelde beweging zien: als het aantal Nomina steeg, dan nam het aantal Gesloten Klasse woorden af. Een andere oorzaak kan de grote heterogeniteit van de groep uit dit onderzoek zijn. De proefpersonen van Bornstein et al. waren allemaal 20 maanden oud. Bovendien hebben zij hun proefpersonen in slechts vier vocabulairegroepen ingedeeld (0-50 woorden, 51100 woorden, 101-200 woorden en 201-500 woorden). Met behulp van een gepaarde T-toets is gekeken of de gemiddelden van de verschillende woordsoorten van elkaar verschillen. Op deze manier wordt gekeken of 115 het echt het geval is dat bijvoorbeeld de Verba en de Gesloten Klasse woorden in het Marokkaans-Arabisch vaker geproduceerd worden door de kinderen dan in het Nederlands. Er is daarbij gebruik gemaakt van proportiescores, omdat het aantal woorden per woordsoort niet helemaal parallel loopt voor het Arabisch en het Nederlands (zie tabel 23). Voor Verba bleken de gemiddelden inderdaad te verschillen. De gemiddelde proportiescore (voor alle leeftijden) was voor het Marokkaans-Arabisch 0,1678 en voor het Nederlands 0,1397. Dit verschil was significant met een betrouwbaarheid van 95% (.027). Ook voor Gesloten Klasse woorden was dit het geval. De gemiddelde proportiescore was respectievelijk 0,1686 en 0,1321. Dit verschil is significant met een betrouwbaarheid van 99% (.004). Een ander significant verschil (99%), maar nu in het voordeel van het Nederlands, is gevonden tussen de gemiddelde proportiescores Onomatopee & Routine. Voor het Marokkaans-Arabisch was het gemiddelde 0,2665 en voor het Nederlands 0,3068. De gemiddelden van de overige woordsoorten verschilden niet significant van elkaar. Verder is gekeken naar de 27 meest geproduceerde woordjes, ongeacht de taal. De bedoeling was om de 25 meest geproduceerde woordjes te noteren, maar zoals in tabel 30 te zien is zijn de laatste vijf woorden allemaal 115 keer geproduceerd, dus ex aequo op de 23e plaats. Achter het woord staat aangegeven hoe vaak het is gezegd, of het een Nederlands of Marokkaans woord is, indien het een Arabisch woord is de vertaling, uit welke categorie het woord komt en tot welke woordsoort het behoort. Tabel 30: De 27 meest geproduceerde woordjes in het onderzoek Woord Aantal MA/Ned auto 184 papa Rubriek Woordsoort Ned Voertuigen Nomen 167 Ned Mensen Nomen saafi 162 MA op / klaar Hoe is het? Adjectivum didi 162 MA pijn Gezegden en Onomatopee & uitroepen Routine kora 158 MA dag 157 Ned bal 156 Ned Vertaling bal Allerlei dingen Nomen Gezegden en Onomatopee & uitroepen Routine Allerlei dingen Nomen 116 batata 149 MA aardappels Eten / drinken Nomen hlieb 141 MA melk Eten / drinken Nomen kakka 140 MA poepen Dingen doen Verbum douche 140 MA douche In huis Nomen ijsje 136 Ned Eten / drinken Nomen jas 133 Ned Kleding Nomen baba 132 MA Mensen Nomen ballon 132 Ned banana 132 MA banaan Eten / drinken Nomen la-la-la 131 MA hop Spel Onomatopee & papa Allerlei dingen Nomen paardje Routine hop baab 127 MA op / klaar 126 koekje be-slama deur In huis Nomen Ned Hoe is het? Adjectivum 124 Ned Eten / drinken Nomen 121 MA Gezegden en Onomatopee & uitroepen Routine dag patat 120 Ned Eten / drinken Nomen boe 115 Ned Spel Onomatopee & Routine lief 115 Ned ana 115 MA ik / mij Hoe is het? Adjectivum Kleine Gesloten Klasse woordjes hada 115 MA dat / deze Kleine Gesloten Klasse woordjes au 115 Ned Gezegden en Onomatopee & uitroepen Routine Volgens Caselli et al. (1995), die de eerste 50 geproduceerde woorden van Amerikaanse en Italiaanse kinderen presenteren, komt dit op hetzelfde neer als de 50 ‘eerst verworven’ woordjes. Ze gaan er dus vanuit dat woorden die het vaakst geproduceerd worden, ook door de jongste kinderen geproduceerd worden. 117 Als deze tabel vergeleken wordt met tabel 1 uit paragraaf 2.4, waarin de 50 meest geproduceerde woorden door Nederlandse kinderen staan (uit het onderzoek van Schlichting (1996), dan zijn er overeenkomsten te vinden. Het meest geproduceerde woord is ‘auto’ en vervolgens ‘papa’ (‘mama’ staat niet in de Lexilijst). Verder komt het woord saafi en het Nederlandse equivalent ‘op / klaar’ op beide lijsten veel voor. Ook kora en ‘bal’ zijn belangrijke woorden voor zowel de tweetalige Marokkaanse kinderen als de eentalige Nederlandse kinderen. Op beide lijsten komen veel etenswaren voor: ‘koekje’, ‘appel’ en ‘kaas’ in het onderzoek van Schlichting (1996), batata, hlieb, ‘ijsje’, banana, ‘koekje’ en ‘patat’ in het huidige onderzoek. Er staan vijftien Nomina in de tabel. Dat is 55,6%. Natuurlijk zijn de meeste woorden die op de lijst staan ook Nomina. Er staat slechts één werkwoord in de tabel, namelijk kakka. Dit woord komt ook veel voor in het onderzoek van Schlichting. Het equivalent van het Nederlandse werkwoord ‘eten’, dat in haar onderzoek het vaakst geproduceerd werd, staat echter niet op de Lexilijst Marokkaans-Arabisch/Nederlands. Het werkwoord dat na kakka het meest geproduceerd wordt is overigens het Nederlandse werkwoord ‘spelen’, dat door 107 kinderen wordt geuit. Daarna volgen ‘poepen’ (95 keer), ‘slapen (94 keer) en y-boes (kussen, 92 keer). Veel van de woorden in de tabel behoren tot de categorie Onomatopee & Routine (namelijk 6, 22,2%). Het woordje ‘dag’ (en het Arabische equivalent be-slama) en ‘au’ komen ook voor in het onderzoek van Schlichting. Er staan drie adjectiva in de tabel: saafi en het Nederlandse equivalent ‘op / klaar’ en ‘lief’. Dit is 11,1%. Ten slotte komen er twee woordjes voor uit de Gesloten Klasse, namelijk het Arabische woord voor ‘ik/mij’ en het Arabische woord voor ‘dat/deze’. Zoals eerder in deze paragraaf is aangetoond, komt de Gesloten Klasse in het Arabisch veel vaker voor dan in het Nederlands. Het is dan ook waarschijnlijk geen toeval dat deze twee woorden uit de Gesloten Klasse juist Marokkaans-Arabisch zijn. In de handleiding van de Lexilijst Nederlands (Schlichting & lutje Spelberg, 2002) is een tabel opgenomen met daarop de woorden van de Lexilijsten (A en B) in volgorde van dalende frequentie. Daarbij is het aankruisingspercentage over alle leeftijdsgroepen aangegeven. Per woord is dus gekeken door welk percentage van de proefpersonen het is geproduceerd. De woorden die hierop staan zijn vergelijkbaar met de woorden in 118 tabel 1. Het eerste werkwoord dat voorkomt is ook ‘eten’, dat door 65% wordt geproduceerd. Het komt op de 29e plek. Dat is dus later dan het eerste werkwoord (kakka) bij de tweetalige groep uit dit onderzoek. Als deze 27 woordjes per leeftijdsgroep bekeken worden, dan blijkt inderdaad dat de woorden die het frequentst geproduceerd worden volgens tabel 30 ook het vroegst geproduceerd worden. Met 20 maanden wordt saafi door vijftien van de 24 kinderen (62,5%) geproduceerd. Datzelfde geldt voor didi. De woorden baab, be-slama, ana en hada worden met 20 maanden door meer kinderen niet dan wel geproduceerd (respectievelijk door 37,5%, 41,7%, 29,2% en 33,3%) . Met 28 maanden wordt saafi door 24 van de 28 kinderen (85,7%) geproduceerd en didi door twintig van de 28 kinderen (71,4%). De vier woorden die op een leeftijd van 20 maanden nog niet veel worden geproduceerd, worden wel vaak geuit met 28 maanden. Baab wordt dan door 75% van de kinderen geproduceerd, be-slama door 67,9%, ana door 78,6% en hada door 67,9%. Dezelfde soort cijfers zijn gevonden voor het Nederlandse deel van de woordenschat uit tabel 30. Zo wordt ‘auto’ door 66,7% van de kinderen van 20 maanden geproduceerd en ‘papa’ door 62,5%. Het woord ‘au’ wordt slechts door 37,5% van de kinderen van 20 maanden geproduceerd. Datzelfde geldt voor ‘boe’. Bij kinderen van 28 maanden wordt het woord ‘auto’ door 89,3% van de kinderen geproduceerd en ‘papa’ door 75,0%. Het woord ‘au’ wordt nu door een veel groter percentage kinderen geproduceerd, namelijk 67,9% en ‘boe’ door 60,7%. 119 7. Conclusie en discussie 7.1 Conclusie In dit hoofdstuk zal antwoord worden gegeven op de in hoofdstuk 1 gestelde onderzoeksvragen. De eerste vraag luidde: 1. Hoe verloopt de woordenschatontwikkeling van Marokkaans-Arabisch-sprekende kinderen in Nederland? Dit is onderzocht door alle woordscores voor de kinderen op te tellen, voor zowel het Marokkaans-Arabisch en Nederlands apart, als voor beide talen samen. De vraag zal beantwoord worden door de resultaten op de deelvragen samen te vatten en daar conclusies uit te trekken. • Hoe hangt de leeftijd van een kind samen met de woordenschatscore op de tweetalige Lexilijst Marokkaans-Arabisch/Nederlands en is er een verschil tussen jongens en meisjes? De woordscores van de kinderen nemen toe met de leeftijd. Dit geldt voor zowel het Marokkaans-Arabisch als het Nederlands. Dit is een te verwachten resultaat: naarmate kinderen ouder worden, neemt hun woordenschat toe. De gevonden correlaties waren significant, maar niet zo sterk. Dat betekent dat er tussen de kinderen veel variatie is. Slechts een klein deel van de variantie wordt verklaard door de leeftijd. Een opvallend punt is de sterke toename in woordscore tussen 22 en 23 maanden en tussen 27 en 28 maanden. Dit verschil was alleen significant voor het MarokkaansArabisch en, daarmee samenhangend, voor de Totaalwoordscore. Voor het Nederlands was dezelfde trend waar te nemen, maar de verschillen bereikten geen significantie. Misschien dat deze sprongen toe te schrijven zijn aan een woordenschatspurt. Zoals in paragraaf 2.5 wordt gemeld, vindt er soms een woordenschatspurt plaats als kinderen 50-100 woorden in hun vocabulaire hebben. Dit is het geval als ze ongeveer 2 jaar oud 120 zijn. Opmerkelijk genoeg is de Totaalwoordscore bij kinderen van 22 maanden gemiddeld 54,95. Dit zou ongeveer het aantal zijn waar men veronderstelt dat de woordenschatspurt begint. Sommige onderzoekers zijn van mening dat de woordenschatspurt vooral een toename in het aantal nomina inhoudt. Dat is onderzocht in paragraaf 6.2.1.1. Hieruit bleek dat er inderdaad een significant verschil is tussen het aantal geproduceerde nomina met 22 en met 23 maanden. De overige woordsoorten verschilden niet significant. De sterke toename wordt dus vooral verklaard door een stijging in het aantal geproduceerde nomina. De tweede sterke toename vindt plaats als er in totaal gemiddeld 95,27 woorden zijn verworven en per taal rond de 50 woorden. Dit zou toeval kunnen zijn, maar het is opmerkelijk dat het weer gaat om een aantal van 50 woorden. Deze toename kan niet verklaard worden door een stijging in het aantal geproduceerde nomina, maar door een toename van de verba en adjectiva. Tussen jongens en meisjes zijn geen significante verschillen gevonden. Dit is op twee manieren onderzocht. Allereerst is gekeken naar de gemiddelde scores in alle leeftijdsgroepen. Daar bleek geen significant verschil te bestaan. Vervolgens is ook gekeken naar de interactie tussen leeftijdsgroep en geslacht. Daar bleek ook geen verschil tussen jongens en meisjes te bestaan. Er is dus geen verschil tussen jongens en meisjes gevonden. Dat was bij de eentalige Nederlandse kinderen in de ‘normgroep’ wel het geval. • Hoe verhouden de resultaten zich tot die van de eentalige Nederlandse groep? In vergelijking met de eentalige Nederlandse groep scoren de Marokkaanse kinderen over het algemeen significant lager. Dit is zowel het geval als gekeken wordt naar de totaalscores als wanneer gekeken wordt naar conceptscores. Welke van de twee scores gebruikt zal worden bij de normering van de tweetalige Lexilijst is nog niet bekend. Bij eentalige Nederlandse kinderen is de score gebaseerd op het aantal concepten, maar bij die groep is het aantal concepten gelijk aan het aantal woorden. De tweetalige kinderen uit dit onderzoek kunnen één concept vaak door middel van twee woorden uitdrukken. Dan is het dus de vraag of je moet kijken naar het aantal woorden of het aantal concepten. 121 Ook Pearson et al. (1993) behandelen dit probleem. Als men het aantal klank-betekenis paren wil weten, dan moet naar de totaalscore worden gekeken. Als het gaat om het aantal gelexicaliseerde concepten, dan moet de conceptscore worden gebruikt. Pearson et al. zeggen echter dat woorden die door volwassenen als translation equivalents worden beschouwd, dit misschien voor het kind niet zijn. In dat geval is er dus voor de kinderen sprake van twee concepten en niet van één. Volterra & Taeschner (1978, in Pearson et al. (1993)) noemen een voorbeeld waarbij een kind het woord barco alleen gebruikt voor zeilboten en boat voor alle andere boten. Pearson et al. hebben daar in hun eigen data echter geen bewijs voor gevonden. Met een oudervragenlijst kan men niet nagaan of de referenten van de woordparen dezelfde zijn. Het zou goed zijn om daar in toekomstig onderzoek naar te kijken. Als inderdaad blijkt dat kinderen een onderscheid maken tussen wat door volwassenen als translation equivalents worden beschouwd, dan is het misschien beter om de normtabellen te baseren op totaalscores in plaats van op conceptscores. • Wat is het verband tussen de conceptscore van een kind en de totaalscore op de tweetalige Lexilijst Marokkaans-Arabisch/Nederlands en is er een verschil tussen jongens en meisjes? Het verschil tussen het aantal geproduceerde concepten en het totaal aantal geproduceerde woorden blijkt toe te nemen. Jonge kinderen drukken een concept meestal slechts in een van beide talen uit. Oudere kinderen kunnen dingen vaker in beide talen benoemen. Als kinderen ouder worden, dan worden ze in feite dus steeds meer tweetalig. Bij kinderen die weinig woorden zeggen is het aantal geproduceerde woorden ongeveer gelijk aan het aantal concepten. Ze hebben dus niet zo veel zogenaamde translation equivalents (Pearson et al., 1993). De meeste woorden worden ofwel in het Nederlands, ofwel in het Marokkaans-Arabisch geproduceerd. Toch zijn er wel doubletten gevonden. Volterra & Taeschner (1978, in Pearson et al., 1995) voorspelden dat in het vroegste stadium kinderen geen doubletten produceren, maar bij de kinderen in dit onderzoek klopt dat dus niet. Ook de jongste kinderen kunnen al woorden in verschillende talen voor hetzelfde concept gebruiken. Zoals hierboven al gemeld, is het echter niet zeker of deze woorden voor de kinderen ook echt gelijk aan elkaar zijn. 122 De tweede hoofdvraag luidde als volgt: 2. Welke externe factoren zijn van invloed op de woordenschatscore van een kind op de tweetalige Lexilijst Marokkaans-Arabisch/Nederlands? Deze vraag zal stap voor stap beantwoord worden met behulp van de deelvragen. • Wat is de relatie tussen de woordenschatscore op de Lexilijst en het gevolgd hebben van Nederlandse lessen door de ouders? Er is een significante relatie gevonden tussen het gevolgd hebben van lessen Nederlands door de ouders en de woordenschatscore Nederlands. Als de ouders een goede kennis van het Nederlands hadden, dan werd een hogere woordscore Nederlands behaald. Dit resultaat was te verwachten. Als ouders zelf beter Nederlands spreken, dan zullen ze ook beter en vaker Nederlands tegen hun kinderen spreken. De kinderen zullen dan zelf ook beter Nederlands spreken en dat resulteert in hogere scores voor het Nederlands. • Wat is de relatie tussen woordenschatscore op de Lexilijst en moedertaal van de ouders? Er is alleen een significante relatie gevonden tussen de moedertaal van de vader en de woordenschatscore Marokkaans-Arabisch van het kind. De kinderen met vaders die Marokkaans-Arabisch/Nederlands als moedertaal hebben en de kinderen met vaders die Berbers/Arabisch als moedertaal spreken, bleken significant van elkaar te verschillen wat betreft woordscore Marokkaans-Arabisch. De kinderen van de Arabisch/Nederlands-sprekende groep behaalden lagere scores dan de Berbers/Arabische groep. De groep met als moedertaal Arabisch en Nederlands bestond overigens slechts uit acht vaders en de Berbers/Arabische groep uit twintig vaders. Daarom kunnen vraagtekens gesteld worden bij het resultaat. Een tweede bevinding was een verschil in woordscore Marokkaans-Arabisch tussen kinderen wier vader een ‘overige taal’ als moedertaal had en kinderen wier vader Berbers/Arabisch was. De woordscore van kinderen wier vader een ‘overige taal’ als moedertaal hadden, was veel lager. Ook hier gaat het om een klein aantal 123 proefpersonen, tot de groep ‘overig’ behoorden slechts drie vaders. Zij hadden kinderen die jonger dan gemiddeld waren, namelijk 20, 21 en 23 maanden oud. Waarschijnlijk zijn de verkregen resultaten dus niet zo van belang, omdat ze verkregen zijn met behulp van een klein aantal proefpersonen. Als toch een poging wordt gedaan om de resultaten te verklaren, dan zou aangevoerd kunnen worden dat vaders die als moedertaal Berbers en Arabisch hebben, meer Arabisch met hun kinderen spreken. Deze vaders hebben niet het Nederlands als moedertaal, dus die taal beheersen ze minder goed. Zoals uit onderzoek van Boumans (2002) blijkt vinden Berbers het vaak belangrijker dat hun kinderen goed Arabisch beheersen dan dat ze Berbers beheersen (zie paragraaf 4.3). Misschien dat ze hierdoor meer nadruk leggen op het Arabisch als ze met hun kinderen praten dan vaders die Marokkaans-Arabisch/Nederlands zijn opgevoed. Deze laatste vaders zullen ook vaak Nederlands met hun kinderen praten. De Berbers/Arabische vaders zullen hiertoe minder geneigd zijn, omdat ze het Nederlands zelf ook minder goed beheersen. Voor de lage scores van kinderen wier vader een ‘overige taal’ als moedertaal heeft kan de lagere Marokkaans-Arabische woordscore eenvoudiger verklaard worden. De vaders zullen het Marokkaans-Arabisch namelijk niet (goed) beheersen als het niet hun moedertaal is. De kinderen horen dan minder Marokkaans-Arabisch om zich heen en spreken deze taal dan minder goed. • Wat is de relatie tussen woordenschatscore op de Lexilijst en de taal die thuis hoofdzakelijk met het kind gesproken wordt? Er is geen relatie gevonden tussen thuistaal en woordenschatscore MarokkaansArabisch. Wel is er een relatie gevonden met woordenschatscore Nederlands. Er was een significant verschil tussen de groep met als belangrijkste thuistaal het Marokkaans-Arabisch en de groep tegen wie zowel het Nederlands als het MarokkaansArabisch wordt gesproken. De kinderen tegen wie thuis ook Nederlands werd gesproken behaalden een significant hogere woordscore Nederlands dan kinderen tegen wie voornamelijk Marokkaans-Arabisch werd gesproken. Een ander significant verschil is gevonden tussen de kinderen tegen wie de belangrijkste taal het Nederlands was en alle drie de overige groepen. De kinderen tegen wie vooral Nederlands werd gesproken behaalden een significant hogere score dan de overige kinderen. Aangezien het echter slechts om vier kinderen gaat, die allen tot de oudere 124 kinderen in het sample behoren, kan aan deze bevinding niet veel waarde worden gehecht. • Wat is de relatie tussen woordenschatscore op de Lexilijst en het hebben van oudere broers of zussen? Er is geen relatie gevonden tussen het hebben van oudere broers of zussen en de woordenschatscores op de Lexilijst. De gemiddelde scores die kinderen die enig kind waren, kinderen die een oudere broer of zus hadden, kinderen die twee broers of zussen hadden en kinderen die drie of meer broers of zussen hadden, bleken niet significant van elkaar te verschillen. De volgende hoofdvraag ging over de samenstelling van de woordenschat: 3. Hoe is het vocabulaire van de Marokkaans/Nederlandse kinderen in het onderzoek samengesteld? Hierbij is apart gekeken naar de woorden uit de verschillende rubrieken van de Lexilijst en de woordsoorten. De volgende deelvragen zijn daarbij aan de orde gekomen: • Hoe verloopt de ontwikkeling van het produceren van woorden uit de verschillende rubrieken op de tweetalige Lexilijst MarokkaansArabisch/Nederlands o voor het Marokkaans-Arabische deel van de Lexilijst? o voor het Nederlandse deel van de Lexilijst? Uit een vergelijking van de drie meest geproduceerde rubrieken in het Nederlands en in het Marokkaans-Arabisch blijkt dat er veel overeenkomsten te vinden zijn. Bij kinderen met een klein vocabulaire worden er vooral woorden geproduceerd uit de rubrieken ‘Spel’, ‘Eten en drinken’ en ‘Gezegden’. Ook uit het onderzoek van Schlichting (1996) naar de eerste 50 geproduceerde woorden van kinderen blijkt dat woorden uit deze categorieën veel geproduceerd worden. Wat opvalt, is dat er niet zo veel woorden uit de rubriek ‘Mensen’ geproduceerd worden. Dit is wel de vaakst geproduceerde categorie wat betreft het Nederlands voor 125 kinderen met een vocabulaire van 101-125 woorden. Bij het Marokkaans-Arabische deel van de woordenschat komt deze rubriek echter nergens in de top 3 voor. Dit is opvallend, omdat Schlichting (zie tabel 1) vier nomina meldt bij de eerste 50 woorden van haar proefpersonen die tot de rubriek ‘Mensen’ zouden behoren. Van deze vier woorden (mama, papa, oma en opa) staan er slechts twee op de Lexilijst, namelijk ‘papa’ en ‘oma’. Van deze woorden behoren ‘papa’ en het Arabische equivalent baba tot de meest geproduceerde woordjes (zie tabel 30). Voor ‘oma’ bestaan twee Arabische vertalingen, namelijk henna en zjedda. Beide woorden afzonderlijk behoren niet tot de meest geproduceerde woorden. Als de productie van beide woorden echter bij elkaar op wordt geteld, dan wordt de Arabische vertaling van ‘oma’ door 127 kinderen geproduceerd en behoort het wel tot de meest geproduceerde woordjes. Juist van een woord als ‘oma’ mag ook verwacht worden dat deze in het Marokkaans-Arabisch wordt geproduceerd, omdat de oma vaak tot de eerste generatie allochtonen in Nederland behoort, ofwel nog in Marokko woont. Een ander verschil tussen het Nederlandse en het Arabische deel van de woordenschat is de rubriek ‘Voertuigen’ die enkele keren in de top 3 voorkomt voor het Nederlands, maar niet voor het Arabisch. Verder worden er in het Arabisch vaker Kledingwoorden geproduceerd dan in het Nederlands. Ten slotte is een opvallend verschil het feit dat de rubriek ‘Kleine woordjes’ in het Marokkaans-Arabisch het vaakst geproduceerd wordt door kinderen uit de hoogste vocabulairegroep. Wat betreft het Nederlands is dat niet het geval. De rubriek ‘Kleine Woordjes’ neemt in de Nederlandse woordenschat pas de negende plek in. Het is opvallend dat deze rubriek in het Arabisch veel wordt geproduceerd, omdat deze woordjes behoren tot de Gesloten Klasse. Deze woorden zijn over het algemeen moeilijk voor kinderen. Schaerlaekens (2000) geeft in haar beschrijving van de twee- en meerwoordsfase ook aan dat kinderen vaak in telegramstijl praten, oftewel de functiewoorden weglaten (zie paragraaf 2.3). Misschien is dat in het Arabisch minder het geval. De minst geproduceerde categorie is in de meeste gevallen ‘Plaats en tijd’, voor zowel het Marokkaans-Arabisch als het Nederlands. Ook deze categorie bestaat uit functiewoorden, maar deze worden dus in beide talen weinig geproduceerd. In het Marokkaans-Arabisch wordt ook ‘Buiten’ en ‘Dieren’ weinig geproduceerd. Vooral dit laatste is opvallend. Schlichting (1996) meldt veel dierennamen in tabel 1. Ook in het Nederlands wordt de rubriek ‘Dieren’ overigens weinig geproduceerd. Misschien dat de dierennamen in de rubriek ‘Dieren’ toevallig allemaal moeilijke woorden waren voor de kinderen. In tabel 1 meldt Schlichting de volgende dierennamen 126 die geproduceerd worden door een derde van haar proefpersonen bij de eerste 50 woorden: ‘poes’, ‘paard’, ‘hond’, ‘eend’, ‘aap’. Van deze woorden stonden alleen ‘paard’ en ‘hond’ ook op de Lexilijst. Dit waren overigens niet de meest geproduceerde woorden uit de rubriek Dieren. Het vaakst werd het Arabische hoet (vis) geproduceerd, namelijk 80 keer. Vervolgens kwam het Arabische kelb, dat 78 keer werd geproduceerd en het Nederlandse equivalent ‘hond’. Even vaak als ‘hond’ werd ‘konijn’ geproduceerd (76 keer). Het woord ‘paard’ dat wel bij Schlichting voorkomt werd slechts 44 keer geproduceerd en het Arabische equivalent ‘awd’ slechts tien keer. • Hoe verloopt de ontwikkeling van het produceren van verschillende woordsoorten o voor het Marokkaans-Arabische deel van de Lexilijst? o voor het Nederlandse deel van de Lexilijst? Het aandeel van Verba, Gesloten Klasse woorden en Adjectiva van de totale woordenschat van de kinderen in het onderzoek neemt toe, naarmate de kinderen meer woorden kunnen produceren. Dat geldt voor zowel het Nederlands als het MarokkaansArabisch. Als de kinderen ouder worden, dan produceren ze dus meer van deze woordsoorten. De Nomina en Onomatopeeën & Routines vertonen een andere ontwikkeling. De woorden van de categorie Onomatopee & Routine vertonen een tegenovergesteld verband: naarmate de kinderen meer woorden produceren, daalt de proportie van deze woordsoort. Het aandeel Nomina in het totale vocabulaire neemt voor zowel het Nederlandse als het Arabische deel van de woordenschat eerst toe en vervolgens weer af. Het aantal woorden dat kinderen in totaal zeggen neemt toe met de leeftijd. Als het aantal woorden dat kinderen zeggen stijgt, dan wordt het lexicon ook gevarieerder. Zoals Bates et al. (1994) opmerken is de kwalitatieve variatie in lexicale stijl afhankelijk van de kwantitatieve variatie. In eerste instantie bestaat het grootste deel van het lexicon van kinderen uit Onomatopee & Routinewoorden en Nomina. Bij kinderen met een grotere woordenschat krijgen de overige woordsoorten een groter aandeel. Eenzelfde ontwikkeling is waargenomen door Kauschke & Hofmeister (2002). Zij hebben het vocabulaire van kinderen tot en met hun derde jaar onderzocht. Ook bij hen maakten in eerste instantie persoonlijk-sociale woorden en relationele woorden het 127 grootste deel van de woordenschat uit. Met 3;0 jaar is het lexicon uiteindelijk in balans: geen enkele woordsoort heeft een groter aandeel dan 25%. Kauschke & Hofmeister hebben kinderen geobserveerd van 13 maanden, 15 maanden, 21 maanden en 36 maanden oud. Zij concluderen dat nomina tot 21 maanden toenemen en vervolgens langzamer groeien. Datzelfde is waar te nemen in dit onderzoek. De verba nemen steeds meer toe (lineair) bij Kauschke & Hofmeister. Ook in dit onderzoek is dat het geval. De relationele woorden nemen eerst sterk af en dan wat langzamer. Deze woorden zijn ongeveer vergelijkbaar met Onomatopeeën & Routines in dit onderzoek. De ontwikkeling die door Kauschke & Hofmeister is beschreven is ook van toepassing op dit onderzoek: voor het Marokkaans-Arabisch neemt het aandeel van deze woordsoort af van 22,0% tot 13,1% en voor het Nederlands van 29,2% tot 13,0%. Ten slotte vindt er een late maar sterke toename plaats van het aantal functiewoorden bij Kauschke & Hofmeister. Ook die resultaten zijn vergelijkbaar met de resultaten uit het huidige onderzoek. De Gesloten Klasse vormt bij kinderen die 0-25 Arabische woorden produceren namelijk de kleinste woordklasse, maar bij kinderen die meer dan 150 woorden kennen is het de meest geproduceerde woordsoort. Deze woordsoort komt dus laat op gang. Volgens Gentner (1982, in Kauscke & Hofmeister, 2002) zouden kinderen beginnen met het produceren van nomina, gevolgd door relationele en expressieve woorden en vervolgens de verba. Dat blijkt dus niet het geval te zijn in dit onderzoek. De Onomatopeeën & Routines komen eerder dan de Nomina. Vanaf het begin wordt wel een groter deel van het totaal aantal Nomina geproduceerd, vergeleken met het aantal Verba. Dat geldt voor zowel het Nederlands als het Marokkaans-Arabisch. Wat dat betreft klopt de noun bias: vanaf het begin zijn de Nomina belangrijker dan de Verba in dit onderzoek. Het verschil tussen beide is echter voor het Marokkaans-Arabisch niet zo groot. Bij kinderen met een woordenschat van 101-125 woorden is het aantal geproduceerde Verba zelfs iets groter dan het aantal Nomina. Voor kinderen met een vocabulaire van meer dan 150 woorden is het aantal geproduceerde Verba duidelijk groter dan het aantal Nomina. Voor het Nederlands is dat niet het geval. Daar is het percentage Nomina altijd hoger dan het percentage Verba. Marokkaans-Arabische Verba worden duidelijk meer geproduceerd dan Nederlandse. Dit bleek ook bijvoorbeeld bij het uitrekenen van de verhoudingen: er worden 1,2 keer zo veel Arabische Verba als Nederlandse Verba geproduceerd. Ook bleken de totale gemiddelden van geproduceerde Arabische Verba en geproduceerde Nederlandse Verba significant van elkaar te verschillen, in het voordeel van het Marokkaans-Arabisch. 128 Dit kan verklaard worden door de eigenschappen van Marokkaans-Arabische verba. Deze staan op een relatief opvallende plaats in de uiting, namelijk vooraan. Ze vallen daarom meer op dan werkwoorden die in het midden van een uiting staan, zoals vaak bij Nederlandse werkwoorden het geval is. Verder is het Marokkaans-Arabisch een prodroptaal, waardoor relatief meer inhoudswoorden werkwoorden zijn. Ook worden Arabische werkwoorden regelmatig vervoegd. Deze bevatten informatie over persoon, geslacht, getal en tijd en zijn dus zeer belangrijk. In het Nederlands worden werkwoorden vervoegd voor persoon, getal en tijd. Er is een redelijk groot aantal werkwoorden dat onregelmatige vervoegingen kent. Nomina daarentegen zijn over het algemeen eenvoudiger te vervoegen en kennen minder uitzonderingen. Een ander verschil tussen Arabische en Nederlandse Verba is het gebruik in imperatieven. Deze worden vaak tegen kinderen gebruikt om instructies te geven. In het Nederlands zeggen ouders vaak: “Eet je bord leeg!” “Ga naar je bed toe!” In het Arabisch is het echter normaal om dergelijke zinnen door middel van één werkwoord uit te drukken: “Eten!” “Slapen!” Dit is een normale manier van uitdrukken, terwijl dat in het Nederlands onbeleefd klinkt (E-Rramdani, p.c.). In het Arabisch worden de uitingen dus slechts gevormd door één werkwoord, terwijl er in het Nederlands meerdere woorden worden gebruikt. Het werkwoord valt dus voor Arabische kinderen meer op dan voor Nederlandse kinderen. Uit onderzoek van Bornstein et al. (2004) waarin zeven verschillende talen met elkaar worden vergeleken, blijkt dat alleen bij Nederlandstalige en Franstalige kinderen het vocabulaire een grotere proportie werkwoorden en adjectiva dan gesloten klasse woorden bevat. Volgens de onderzoekers worden er dus minder van dergelijke woorden gebruikt in de taal gericht tegen het kind. In dit onderzoek was dit niet het geval. De kinderen produceerden zowel in het Nederlands als in het Marokkaans-Arabisch een grotere proportie Gesloten Klasse dan Verba en Adjectiva. Voor het Nederlands lagen de getallen van de Gesloten Klasse en de Verba echter dicht bij elkaar. Voor het Marokkaans-Arabisch was dat veel minder het geval. De proefpersonen van Bornstein et al. waren echter allen 20 maanden oud. In het huidige onderzoek waren de kinderen gemiddeld vier maanden ouder. Misschien dat dat verschil heeft gemaakt voor de resultaten. In beide onderzoeken is gebruik gemaakt van ouderrapportage. 129 De kinderen in dit onderzoek produceren relatief veel woorden uit de Gesloten Klasse in het Marokkaans-Arabisch. Deze woorden zijn voornamelijk afkomstig uit de rubriek ‘Kleine woordjes’. Zoals hiervoor is aangegeven blijkt de rubriek ‘Plaats en tijd’, die ook tot de Gesloten Klasse behoort, moeilijker te zijn. De woorden die in die rubriek staan zijn vrij abstract. Kinderen praten veel over het hier en nu. Daarom zijn woorden als ‘morgen’, ‘toen’ en ‘dan’ moeilijk voor ze. De woorden uit de rubriek ‘Kleine woordjes’ zijn minder abstract. Het is gemakkelijker om te benoemen wie of wat er met ‘ik’, ‘andere’ of ‘eentje’ wordt bedoeld. De ‘Kleine woordjes’ worden in het Arabisch zeer frequent gebruikt. Ze worden ook vaak los gebruikt, in eenwoordsuitingen. Daarom vallen ze op. Het is opvallend dat ook de persoonlijke voornaamwoorden uit deze rubriek veel geproduceerd worden door kinderen, hoewel het Marokkaans-Arabisch een pro-droptaal is. Het blijkt echter dat ouders in hun taal tegen kinderen deze persoonlijke voornaamwoorden wel gebruiken, terwijl ze deze in het volwassen taalgebruik weglaten (E-Rramdani, p.c.). Wat opviel was het feit dat de grafieken van de Nomina en die van de Onomatopee & Routine en de Gesloten Klasse elkaars spiegelbeeld leken te zijn. Dit was het geval als gekeken werd naar de leeftijd in maanden. Misschien dat woorden uit de Gesloten Klasse (en dan gaat het met name om de ‘Kleine woordjes’) fungeren als een vervanging van Nomina. Als kinderen niet precies weten hoe iets heet, dan noemen ze het ‘deze’ of ‘ook’ in plaats van het object daadwerkelijk te benoemen. Een kind kan bijvoorbeeld het zinnetje “ik wil snoep” ook uiten door te zeggen ‘deze’. Dit is een communicatieve strategie, vergelijkbaar met Clarks (1993) verklaring voor het veelvuldig voorkomen van overextensies (zie paragraaf 2.4). De grafiek voor de Gesloten Klasse in het Marokkaans-Arabisch is hoger dan die in het Nederlands, terwijl de grafiek voor de Nomina in het Arabisch lager is dan in het Nederlands. Dit klopt met bovengenoemde verklaring. Bovendien klopt dat met enkele negatieve correlaties die gevonden zijn tussen Nomina en Gesloten Klasse woorden in tabel 28 en 29. Voor het Marokkaans-Arabisch zijn in vier van de zeven leeftijdsgroepen negatieve correlaties gevonden tussen beide woordsoorten. Ook Onomatopeeën & Routines kunnen gebruikt worden om dingen te benoemen waar het kind het echte woord nog niet voor gevonden heeft. Zo kan het woord ‘miauw’ gebruikt worden in plaats van ‘kat’ of het woord ‘bah’ voor allerlei vieze dingen. Naarmate het kind meer Nomina kent, zal het dus ook minder van dergelijke woorden produceren. 130 Als wordt gekeken naar de grafieken van de Nomina en de Gesloten Klasse, dan kan geconcludeerd worden dat de taalvaardigheid van Marokkaanse kinderen in het Marokkaans-Arabisch dus lager is dan in het Nederlands. In het Nederlands worden namelijk meer Nomina geproduceerd. Dit kan door verschillende factoren komen. Alle kinderen wonen in Nederland, dus zij zullen over het algemeen veel Nederlands om zich heen horen. Zo kijken ze waarschijnlijk televisie, sommige kinderen horen het Nederlands op de kinderopvang en sommige kinderen hebben oudere broers of zussen die Nederlands spreken. In dit onderzoek bleek dit laatste overigens geen invloed te hebben. In de literatuur wordt de Gesloten Klasse juist beschouwd als een moeilijke woordsoort die laat geleerd wordt. Uit dit onderzoek blijkt dat echter niet. Misschien dat de ‘Kleine woordjes’ niet het juiste voorbeeld van woorden uit de Gesloten Klasse zijn. Ze blijken namelijk niet zo heel moeilijk voor de kinderen. De woorden uit de rubriek ‘Plaats en tijd’ zijn dat echter wel, dus misschien zijn dat de woorden die volgens de literatuur moeilijk zijn voor kinderen om te leren. Misschien dat er een onderscheid gemaakt kan worden dus de typische gesloten klasse woorden en de minder typische. Ook Gentner & Boroditsky (2001) hebben dit gedaan (zie paragraaf 2.7). In hun Divsion of Dominance hebben ze een continuüm weergegeven met aan de ene kant typische open klasse woorden en aan de andere kant typische gesloten klasse woorden. Typische gesloten klasse woorden zijn bijvoorbeeld lidwoorden, conjuncties en voorzetsels. Deze woorden krijgen geen nadruk in de zin en woorden vaak weggelaten door jonge kinderen. Er zijn echter ook gesloten klasse woorden die zich vormelijk op dezelfde manier gedragen als inhoudswoorden (Hengeveld, 1999). Dat geldt bijvoorbeeld voor het hulpwerkwoord ‘hebben’ in het volgende voorbeeld: (23) Carla heeft een auto gestolen. (Hengeveld, 1999) Het hulpwerkwoord draagt niet bij aan de betekenis van de zin, maar vervult een grammaticale rol. Het gedraagt zich echter als een lexicaal werkwoord. Datzelfde kan gezegd worden voor de pronomina ‘ik’, ‘jij’, en ‘hij’ uit de rubriek ‘Kleine woordjes’. Deze staan in de zin op dezelfde plaats als gewone nomina. Datzelfde geldt voor de woorden ‘andere’, ‘eentje’, ‘allemaal’ en ‘helemaal’. Kinderen zeggen bijvoorbeeld: “Ik wil eentje.” Dan wordt het woord ‘eentje’ bijvoorbeeld 131 gebruikt in plaats van het woord ‘snoepje’. Zoals gezegd kunnen ook de woorden ‘die’, ‘dat’ en ‘deze’ op vergelijkbare manier gebruikt worden door kinderen. Voor de woorden uit de rubriek ‘Plaats en tijd’ geldt dit niet. De woorden uit deze rubriek zijn echt abstract voor kinderen, omdat kinderen vooral over het hier en nu praten. • Welke verschillen en overeenkomsten zijn er tussen de eentalige Nederlandse groep en de Marokkaans-Arabisch/Nederlandse groep in de samenstelling van het vocabulaire en hoe kunnen deze verschillen verklaard worden? Er zijn weinig verschillen gevonden tussen de vroege woorden van de eentalige Nederlandse kinderen, zoals weergegeven in tabel 1 en de vroege woorden van tweetalige Marokkaanse kinderen (tabel 30). Bij beide groepen komen er veel woorden voor uit de categorie Onomatopee & Routine. Ook staan er veel Nomina in, met name etenswaren. Het eerste werkwoord komt eerder in het Marokaans-Arabisch dan in het Nederlands, als tabel 30 wordt vergeleken met de handleiding van de Lexilijst Nederlands (Schlichting & lutje Spelberg, 2002). De kinderen die tweetalig MarokkaansArabisch/Nederlands zijn, leren dus misschien eerder werkwoorden te produceren, omdat deze in het Arabisch makkelijker zijn dan in het Nederlands. Het eerste woord uit de Gesloten Klasse is voor de eentalige kinderen (opnieuw volgens de handleiding van de Lexilijst Nederlands) ‘die’. Dit woord komt als vijfde woord op de lijst voor en wordt door 83% van de kinderen geproduceerd. Het woord komt ook voor bij de tweetalige kinderen, maar dan in het Arabisch: hada. Het komt echter later dan bij de eentalige groep. Het woordje ‘die’ is misschien niet echt een duidelijk voorbeeld van een woord uit de Gesloten Klasse, zoals hiervoor al aangegeven. Nederlandse kinderen maken namelijk zeer veel gebruik van het woord en verwijzen ermee naar allerlei verschillende dingen waarvan zij misschien de naam nog niet kennen. Het zou dus ook beschouwd kunnen worden als een soort algemene term voor Nomina. Of het Arabische hada op dezelfde manier gebruikt wordt zou verder onderzocht moeten worden. Het volgende woord uit de Gesloten Klasse dat door de eentalige kinderen geproduceerd wordt is ‘uit’. Dit woord komt niet voor op de tweetalige Lexilijst. Bij de tweetalige kinderen wordt het woord ana (ik) ook veel geproduceerd. Dat is bij de eentalige kinderen niet het geval. 132 7.2 Discussie Een eerste opvallende bevinding was de sterke toename in woordenschatscore Marokkaans-Arabisch op twee momenten. De eerste sprong is toe te schrijven aan een toename van het aantal nomina en de tweede aan een toename van verba en adjectiva. Het is de vraag of er hier sprake is van een (dubbele) woordenschatspurt. Dat zal afhankelijk zijn van de gebruikte criteria. Misschien dat in een ander onderzoek gekeken kan worden of deze spurt ook gevonden wordt bij een groter aantal proefpersonen, of bij onderzoek naar tweetaligheid in een andere taal. De kinderen in dit onderzoek scoren lager dan de eentalige Nederlandse kinderen. Dat kan verschillende oorzaken hebben. Ten eerste kan de sociaal-economische klasse van de gezinnen een factor zijn. Misschien dat de proefpersonen uit dit onderzoek afkomstig zijn uit een lagere klasse dan de proefpersonen uit het onderzoek naar de Lexilijst Nederlands. Verder kunnen er verschillen zijn tussen het aantal woorden dat Nederlandse ouders rapporteren en het aantal dat Marokkaanse ouders rapporteren. Zo hebben Pan et al. (2004) gevonden dat blanke moeders een groter vocabulaire bij hun kind rapporteren dan zwarte of Spaanstalige moeders. Ook kunnen er verschillen zijn in het belang dat men in een cultuur hecht aan het vocabulaire (zie paragraaf 3.2). Een andere verklaring kan zijn dat kinderen die tweetalig opgroeien misschien iets achterliggen op eentalige kinderen. Omdat zij hun cognitieve bronnen moeten verdelen tussen twee talen, duurt het misschien in beide talen langer om woorden te verwerven. Het resultaat is dan een kleiner vocabulaire, ook als beide talen bij elkaar worden opgeteld. De vraag is dan echter of de tweetalige kinderen dit verschil later automatisch goedmaken, of dat er extra aandacht voor nodig is, bijvoorbeeld van school. Voor kinderen van deze leeftijd blijkt het van belang te zijn of hun ouders Nederlandse lessen hebben gehad. Als dat het geval is, dan hebben de kinderen ook een betere kennis van het Nederlands. Hiermee hangt samen de bevinding dat kinderen tegen wie thuis (ook) Nederlands wordt gesproken, een hogere woordscore Nederlands behalen. Onderzocht zou moeten worden of dit resultaat nog steeds gevonden wordt als kinderen de schoolleeftijd bereiken. Als dat zo is, dan is dat een extra argument voor de opinie dat mensen in Nederland Nederlands moeten leren. Hoe ouder kinderen worden, des te meer komen ze echter in contact met andere mensen dan hun ouders. Zo gaan ze misschien naar de kinderopvang, ze kijken meer televisie, ze gaan buiten spelen met andere kinderen et cetera. Op die manier horen ze ook het Nederlands om zich heen. Het is dus waarschijnlijk dat de kennis van het Nederlands van de ouders voor oudere 133 kinderen minder belangrijk is dan voor jongere kinderen. Dat zou onderzoek moeten uitwijzen. Gentner (1982, in Bornstein et al., 2004) noemt drie redenen voor het frequenter voorkomen van nomina dan verba. Ten eerste zouden nomina conceptueel eenvoudiger zijn dan verba. Dit is de al eerder genoemde natural partitions hypothesis (zie paragraaf 2.7). Kinderen zouden eenvoudiger concepten voor objecten kunnen leren, omdat deze perceptueel transparanter zijn dan acties. Ten tweede worden verschillen in het voorkomen van nomina en verba in het vocabulaire van kinderen verklaard door taalspecifieke structurele verschillen. Deze hebben invloed op de verwerving van woorden. Een derde reden heeft te maken met de input die kinderen krijgen. In veel culturen doen ouders taalspelletjes met hun kinderen. Daarbij wordt aan het kind gevraagd: “wat is dat?” Het kind gaat dan dingen om zich heen benoemen. Het is duidelijk dat op deze manier objecten worden benoemd en geen acties. Dit kan een verklaring zijn voor het feit dat nomina meer voorkomen. Ouders leggen daar de nadruk op als ze tegen hun kind praten. In dit onderzoek is vooral gekeken naar het tweede punt van Gentners redenering. Verba blijken in het Marokkaans-Arabisch vaker voor te komen dan in het Nederlands. Dit verschil kan verklaard worden door naar de karakteristieken van de taal te kijken. Toch zijn de nomina in beide talen bij jonge kinderen belangrijker. Deze verschijnen voor de verba. Dit zou verklaard kunnen worden door Gentners natural partitions hypothesis. Het derde punt dat Gentner noemt is interessant. Ik heb geen literatuur kunnen vinden over de manier waarop Marokkaans-Arabische ouders tegen hun kind spreken. Het zou interessant zijn om naar de input te kijken die Marokkaans-Arabische kinderen krijgen. Ook zou dan een vergelijking gemaakt kunnen worden met de input van tweetalige Marokkaanse kinderen in Nederland. Op die manier zou een betere conclusie kunnen worden getrokken wat betreft de aanwezigheid van een noun bias. 134 8. Referenties Appel, R. & A. Vermeer 2000 Tweede-taalverwerving en simultane taalverwerving. In: S. Gillis & A. Schaerlaekens (eds.) Kindertaalverwerving. Een handboek voor het Nederlands. Groningen: Martinus Nijhoff, 347-393. Barrett, M. 1995 Early Lexical Development. In: P. Fletcher & B. MacWhinney (eds.) The Handbook of Child Language. Oxford: Blackwell Publishers, chapter 13. Bates, E., I. Bretherton & L. Snyder 1988 From First Words to Grammar. Individual differences and dissociable mechanisms. Cambridge: University Press. Bates, E., V. Marchman, D. Thal et al. 1994 Developmental and stylistic variation in the composition of early vocabulary. Journal of Child Language, 21, 85-123. Bates, E., P.S. Dale & D. Thal 1995 Individual Differences and Their Implications for Theories of Language Development. In: P. Fletcher & B. MacWhinney (eds.) The Handbook of Child Language. Oxford: Blackwell Publishers. Benedict, H. 1979 Early lexical development: comprehension and production. Journal of Child Language, 6, 183-200. Bornstein, M.H., L.R. Cote et al. 2004 Cross-linguistic analysis of vocabulary in young children: Spanish, Dutch, French, Hebrew, Italian, Korean, and American English. Child Development, 75, 1115-1139. Boumans, L. 135 2002 “Temši morgen uit wella?” Marokkaans Arabisch. In: H. Bennis, G. Extra, P. Muysken & J. Nortier (eds.) Een buurt in beweging. Talen en Culturen in het Utrechtse Lombok en Transvaal. Amsterdam: Aksant, 263-283. Bowerman, M. 1978 The acquisition of word meaning: an investigation of some current conflicts. In: N. Waterson & C.E. Snow (eds.) The development of communication. New York: John Wiley and Sons, 263-287. Caselli, M.C., E. Bates, P. Casadio et al. 1995 A cross-linguistic study of early lexical development. Cognitive Development, 10, 159-199. Centraal Bureau voor de Statistiek http://www.cbs.nl/ Choi, S. & A. Gopnik 1995 Early acquisition of verbs in Korean: a cross-linguistic study. Journal of Child Language, 22, 497-529. Clark, E.V. 1973 What’s in a word? On the child’s acquisition of semantics in his first language. In: T.E. Moore (ed.) Cognitive development and the acquisition of language. New York: Academic Press, 65-110. Clark, E.V 1977 Strategies and the mapping problem in first language acquisition. In: J. Macnamara (ed.) Language learning and thought. New York: Academic Press, 147168. Clark, E.V. 1987 The principle of contrast: a constraint on language acquisition. In: B. MacWhinney (ed.) Mechanisms of language acquisition. Hillsdale, NJ: Erlbaum. Clark, E.V. 136 1993 The lexicon in acquisition. Cambridge: University Press. Dale, P.S. 1991 The validity of a parent report measure of vocabulary and syntax at 24 months. Journal of Speech and Hearing Research, 34, 565-571. De Houwer, A. 1995 Bilingual Language Acquisition. In: P. Fletcher & B. MacWhinney (eds.) The Handbook of Child Language. Oxford: Blackwell Publishers, chapter 8. De Ruiter, J.J. 1989 Young Moroccans in the Netherlands: an integral approach to their language situation and acquisition of Dutch. Proefschrift. Utrecht: Rijksuniversiteit Utrecht. Dromi, E. 1987 Early lexical development. Cambridge: University Press. El Aissati, A. 2002 Verandering en verankering. Taal en identiteit bij jonge Marokkanen. In: H. Bennis, G. Extra, P. Muysken & J. Nortier (eds.) Een buurt in beweging. Talen en Culturen in het Utrechtse Lombok en Transvaal. Amsterdam: Aksant, 251-262. Elbers, L. & A. van Loon-Vervoorn 2000 Lexicon en semantiek. In: S. Gillis & A. Schaerlaekens (eds.) Kindertaalverwerving. Een handboek voor het Nederlands. Groningen: Martinus Nijhoff, 185-224. Ennaji, M. 1985 Contrastive Syntax. English, Moroccan Arabic and Berber Complex Sentences. Würzburg: Königshausen und Neumann. E-rramdani, Y. 2003 Acquiring Tarifit-Berber by Children in the Netherlands and Morocco. Proefschrift. Tilburg: Universiteit van Tilburg. 137 Ethnologue: Languages of the world http://www.ethnologue.com/ Fenson, L., P. Dale, J.S. Reznick et al. 1993 The MacArthur Communicative Development Inventories : user’s guide and technical manual. San Diego: Singular Publishing Group. Fenson, L., P.S. Dale, J.S. Reznick et al. 1994 Variability in early communicative development. Monographs of the Society for Research in Child Development, 242, 59, 5. Ferguson, C.A. 1959 Diglossia. In: Word, 15, 325-340. Forkel, F. 1980 Die sprachliche Situation in Heutigen Marokko. PhD thesis, Universiteit van Hamburg. Ganger, J. & M.R. Brent 2004 Reexamining the vocabulary spurt. Developmental Psychology, 40, 621-632. Gentner, D. 1982 Why nouns are learned before verbs: linguistic relativity versus natural partitioning. In: S.A. Kuczaj (ed.) Language development, vol. 2: Language, thought, and culture. Hillsdale, NJ: Lawrence Erlbaum, 301-334. Gentner, D. 1988 Cognitive and linguistic determinism: object reference and relational reference. Paper presented at the Boston Child Language Conference, Boston, MA, November. Gentner, D. & L. Boroditsky 2001 Individuation, relativity, and early word learning. In: M. Bowerman & S.C. Levinson (eds.) Language acquisition and conceptual development. Cambridge University Press, 215-256. 138 Gleitman, L.R. 1994 Words, words, words… Philosophical Transactions: Biological Sciences, 346, 71-77. Goldfield, B.A. 2000 Nouns before verbs in comprehension vs. production: the view from pragmatics. Journal of Child Language, 27, 501-520. Goldfield, B.A. & J.S. Reznick 1990 Early lexical acquisition: rate, content, and the vocabulary spurt. Journal of Child Language, 17, 171-183. Gopnik, A. & S. Choi 1995 Names, relational words, and cognitive development in English- and Koreanspeakers: Nouns are not always learned before verbs. In: M. Tomasello & W. Merriman (eds.) Beyond names for things: Young children’s acquisition of verbs. Hillsdale, NJ: Erlbaum. Grabe, W. 1979 Morocco: Diglossia…triglossia? The language situation in Morocco. In: Working Papers in Applied Linguistics, 6, 11-21. Harrell, R.S. 1962 A Short Reference Grammar of Moroccan Arabic. Washington: Georgetown University Press. Harrell, R.S., M. Abu-Talib & W.S. Carroll 1965 A Basic Course in Moroccan Arabic. Washington: Georgetown University Press. Hengeveld, K. 1999 Woordsoorten en constituenten. In: R. Appel, A. Baker & P. Muysken (eds.) Taal en Taalwetenschap. Amsterdam: Universiteit van Amsterdam. Hoffmann, C. 139 1991 An Introduction to Bilingualism. New York: Longman Inc. Hoogsteder, M., M. Blumenthal & T. Yumusak 1999 Meertaligheid en spraak/taalmoeilijkheden bij kinderen. Voorstellen voor beleid en praktijk. Utrecht: Nederlands Centrum Buitenlanders. Ingram, D. 1989 First Language Acquisition. Method, Description, and Explanation. Cambridge: University Press. Jackson-Maldonado, D., D. Thal, V. Marchman, E. Bates & V. Gutierrez-Clellen 1993 Early lexical development in Spanish-speaking infants and toddlers. Journal of Child Language, 20, 523-549. Junker, D.A. & I.J. Stockman 2002 Expressive vocabulary of German-English bilingual toddlers. American Journal of Speech-Language Pathology, 11, 381-394. Kauschke, C. & C. Hofmeister 2002 Early lexical development in German: a study on vocabulary growth and vocabulary composition during the second and third year of life. Journal of Child Language, 29, 735-757. Kesler-Koppe, A. 2003 De Lexilijst, vertaald in drie Marokkaanse dialecten: een welkome aanvulling op het onderzoek naar taalontwikkeling, JGZ, 3, 45-48. Kim, M., K.K. McGregor & C.K. Thompson 2000 Early lexical development in English- and Korean-speaking children: languagegeneral and language-specific patterns. Journal of Child Language, 27, 225-254. Klee, T., D.K. Carson, W.J. Gavin et al. 1998 Concurrent and predictive validity of an early language screening program. Journal of Speech, Language, and Hearing Research, 41, 627-641. 140 Laghaout, M. 1995 L’espace dialectal marocain, sa structure actuelle et son évolution recente. Dialectologie et sciences humaines au Maroc. Rabat, Université Mohamed V, Faculté des Letters et des Sciences Humaines, 9-42. Lederer, A., L.R. Gleitman & H. Gleitman 1991 The informativeness of cross-situational and cross-sentential evidence for learning the meanings of verbs. Paper presented at the Boston University Conference on Language Development, Boston, October, 1991. Leonard, L.B., M. Newhoff & E.M. Fey 1980 Some instances of word usage in the absence of comprehension. Journal of Child Language, 7, 189-196. Maratsos, M. & G. Déak 1995 Hedgehogs, foxes and the acquisition of verb meaning. In: M. Tomasello & W. Merriman (eds.) Beyond Names for Things: Young Children’s Acquisition of Verbs. Hillsdale: Erlbaum. Narain, G. & L. Verhoeven 1994 Ontwikkeling van Tweetaligheid bij Allochtone Kleuters. Tilburg: Tilburg University Press. Nelson, K. 1973 Structure and strategy in learning to talk. Monographs of the Society for Research in Child Development, 38 (1-2, serial no. 149). Nelson, K. 1974 Concept, word and sentence: interrelations in acquisition and development. Psychological Review, 81, 267-285. Nelson, K. 1985 Making Sense: The Acquisition of Shared Meaning. New York: Academic Press. 141 Nelson, K. 1991 Concepts and meaning in language development. In: N. Krasnegor, D. Rumbaugh, R. Schiefelbusch & M. Studdert-Kennedy (eds.) Biological and Behavioral Determinants of Language Development. Hillsdale: Erlbaum. Nortier, J.M. 1989 Dutch and Moroccan Arabic in Contact: Code Switching among Moroccans in the Netherlands. PhD thesis. Amsterdam: Universiteit van Amsterdam. Pan, B.A., M.L. Rowe, E. Spier & C. Tamis-Lemonda 2004 Measuring productive vocabulary of toddlers in low-income families: concurrent and predictive validity of three sources of data. Journal of Child Language, 31, 587608. Patterson, J.L. 1998 Expressive vocabulary development and word combinations of Spanish-English bilingual toddlers. American Journal of Speech-Language Pathology, 7, 46-56. Pearson, B.Z., S.C Fernández & D.K. Oller 1993 Lexical development in bilingual infants and toddlers: comparison to monolingual norms. Language Learning, 43, 93-120. Pearson, B.Z., S. Fernández & D.K. Oller 1995 Cross-language synonyms in the lexicons of bilingual infants: one language or two? Journal of Child Language, 22, 345-368. Rescorla, L. 1989 The Language Development Survey: a screening tool for delayed language in toddlers. Journal of Speech and Hearing Disorders, 54, 587-599. Rescorla, L., M. Hadicke-Wiley & E. Escarce 1993 Epidemiological investigation of expressive language delay at age two. First Language, 13, 5-22. Reznick, J.S. & B.A.Goldfield 142 1992 Rapid change in lexical development in comprehension and production. Developmental Psychology, 28, 406-413. Romaine, S. 1989 Bilingualism. Oxford: Basil Blackwell. Sandhofer, C.M., L.B. Smith & J. Luo 2000 Counting nouns and verbs in the input: differential frequencies, different kinds of learning? Journal of Child Language, 27, 561-585. Schaerlaekens, A. 2000 De verwerving van het Nederlands: een blauwdruk. In: S. Gillis & A. Schaerlaekens (eds.) Kindertaalverwerving. Een handboek voor het Nederlands. Groningen: Martinus Nijhoff, 1-38. Schlesinger, I. 1982 Steps to Language – Toward a Theory of Native Language Acquisition. Hillsdale: Erlbaum Schlichting, J.E.P.T. 1996 Discovering syntax: an empirical study in Dutch language acquisition. Nijmegen University Press. Schlichting, L. 2001 Woordselectie in het onderwijs aan jonge kinderen. Toegepaste Taalwetenschap in Artikelen, 1, 111-121. Schlichting, J.E.P.T., M.C.M. van Eldik, H.C. lujte Spelberg, S.J. van der Meulen & B. van der Meulen 1995 Schlichting Test voor Taalproductie. Lisse: Swets Test Services. Schlichting, J.E.P.T. & H.C. lutje Spelberg 2002 Lexilijst Nederlands. Een instrument om de taalontwikkeling te onderzoeken bij Nederlandstalige kinderen van 15-27 maanden in het kader van vroegtijdige onderkenning. Lisse: Swets Test Publishers. 143 Schlichting, J.L. & H.C. lutje Spelberg 2004 Dutch early vocabulary development, as measured with a parent report checklist. Unpublished paper. Tardif, T. 1996 Nouns are not always learned before verbs: evidence from Mandarin speakers’ early vocabulary. Developmental Psychology, 32, 492-504. Tardif, T., M. Shatz & L. Naigles 1997 Caregiver speech and children’s use of nouns versus verbs : a comparison of English, Italian, and Mandarin. Journal of Child Language, 24, 535-565. Tardif, T., S.A. Gelman & F. Xu 1999 Putting the “Noun Bias” in context: a comparison of English and Mandarin. Child Development, 70, 620-635. Thomson, J.R. & R. Chapman 1977 Who is ‘Daddy’ revisited: the status of two-year-olds’ over-extended words in use and comprehension. Journal of Child Language, 4, 359-375. Tomasello, M., S. Mannle & L. Werdenschlag 1988 The effect of previously learned words on the child’s acquisition of words for similar referents. Journal of Child Language, 15, 505-515. Van der Meer, Ph. 1984 Omgaan met Marokkanen. Deventer: Van Loghum Slaterus . Van Kampen, J. & F. Wijnen 2000 Grammaticale taalontwikkeling. In: S. Gillis & A. Schaerlaekens (eds.) Kindertaalverwerving. Een handboek voor het Nederlands. Groningen: Martinus Nijhoff, 225-285. Volterra, V. & T. Taeschner 144 1978 The acquisition and development of language by bilingual children. Journal of Child Language, 5, 311-326. 145 Appendix 1 De eerste 50 geproduceerde woorden Figuur A 1.1 De eerste 50 geproduceerde woorden (Dromi, 1987) 146 Appendix 2 Woordenschatontwikkeling van Marokkaans-Arabischsprekende kinderen in Nederland Tabel A 2.1 Correlatie tussen leeftijd en woordenschatscore Marokkaans-Arabisch Correlations AantMaanden WoordscoreMA Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N AantMaanden 1 232 ,382** ,000 232 Woordscore MA ,382** ,000 232 1 232 **. Correlation is significant at the 0.01 level (2-tailed). Tabel A 2.2 Correlatie tussen leeftijd en woordenschatscore Nederlands Correlations AantMaanden WoordscoreNed Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N AantMaanden 1 232 ,210** ,001 232 Woordscore Ned ,210** ,001 232 1 232 **. Correlation is significant at the 0.01 level (2-tailed). Tabel A 2.3 Correlatie tussen leeftijd en totaalscore Correlations AantMaanden Totaalscore Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N AantMaanden 1 Totaalscore ,333** ,000 232 232 ,333** 1 ,000 232 232 **. Correlation is significant at the 0.01 level (2-tailed). 147 Tabel A 2.4 Correlatie tussen leeftijd en totaalwoordscore Correlations AantMaanden Totaalwoordscore Totaalwo ordscore ,334** ,000 232 232 ,334** 1 ,000 232 232 AantMaanden 1 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). Tabel A 2.5 Correlatie tussen leeftijd en conceptscore Correlations AantMaanden Conceptscore Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N AantMaanden 1 Conceptscore ,353** ,000 232 232 ,353** 1 ,000 232 232 **. Correlation is significant at the 0.01 level (2-tailed). Tabel A 2.6 Correlatie tussen woordscore Nederlands en woordscore Marokkaans-Arabisch Correlations WoordscoreNed WoordscoreMA Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Woordscore Ned 1 232 ,508** ,000 232 Woordscore MA ,508** ,000 232 1 232 **. Correlation is significant at the 0.01 level (2-tailed). Tabel A 2.7 Correlatie tussen woordscore Nederlands en woordscore Marokkaans-Arabish, gecontroleerd voor leeftijd Correlations Control Variables AantDagen WoordscoreMA WoordscoreNed Correlation Significance (2-tailed) df Correlation Significance (2-tailed) df Woordscore MA 1,000 . 0 ,471 ,000 227 Woordscore Ned ,471 ,000 227 1,000 . 0 148 Tabel A 2.8 T-toets: Verschil tussen woordscore Marokkaans-Arabisch met 22 en 23 maanden Independent Samples Test Levene's Test for Equality of Variances F WoordscoreMA Equal variances assumed Equal variances not assumed Sig. 11,963 t-test for Equality of Means t ,001 df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -2,216 41 ,032 -21,136 9,538 -40,398 -1,875 -2,177 25,246 ,039 -21,136 9,711 -41,127 -1,146 Tabel A 2.9 T-toets: Verschil tussen woordscore Marokkaans-Arabisch met 27 en 28 maanden Independent Samples Test Levene's Test for Equality of Variances F WoordscoreMA Equal variances assumed Equal variances not assumed Sig. 1,682 t-test for Equality of Means t ,200 df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -2,043 56 ,046 -24,560 12,022 -48,642 -,477 -2,029 52,260 ,048 -24,560 12,106 -48,849 -,271 Tabel A 2.10 T-toets: Verschil tussen totaalwoordscore met 27 en 28 maanden Independent Samples Test Levene's Test for Equality of Variances F Totaalwoordscore Equal variances assumed Equal variances not assumed 1,203 Sig. ,277 t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -2,385 56 ,020 -46,91190 19,66723 -86,31009 -7,51372 -2,356 47,507 ,023 -46,91190 19,91536 -86,96516 -6,85865 Tabel A 2.11 Gemiddeld aantal geproduceerde woordsoorten Marokkaans-Arabisch met 22 en 23 maanden Group Statistics Aantalnomina Aantalverba Aantaladjectiva Aantalgeslotenklasse Aantalonomatopeeroutine Aantalmaanden 22 23 22 23 22 23 22 23 22 23 N 22 21 22 21 22 21 22 21 22 21 Mean 12,1818 23,5238 2,9091 6,1905 1,9091 3,5714 3,7727 7,9524 3,9545 4,7143 Std. Deviation 8,95830 20,84615 2,30753 7,33225 2,38865 3,88035 4,09334 9,03591 2,08115 3,49489 Std. Error Mean 1,90992 4,54900 ,49197 1,60003 ,50926 ,84676 ,87270 1,97180 ,44370 ,76265 Tabel A 2.12 T-toets: Verschil in geproduceerde woordsoorten Marokkaans-Arabisch met 22 en 23 maanden 149 Independent Samples Test Levene's Test for Equality of Variances F Aantalnomina Aantalverba Aantaladjectiva Aantalgeslotenklasse Aantalonomatopeeroutine Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Sig. 15,078 ,000 7,746 ,008 7,302 ,010 4,697 ,036 6,223 ,017 t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -2,337 41 ,024 -11,34199 4,85341 -21,14365 -1,54033 -2,299 26,877 ,030 -11,34199 4,93368 -21,46723 -1,21675 -1,999 41 ,052 -3,28139 1,64156 -6,59658 ,03381 -1,960 23,758 ,062 -3,28139 1,67395 -6,73812 ,17535 -1,701 41 ,097 -1,66234 ,97756 -3,63655 ,31188 -1,682 32,976 ,102 -1,66234 ,98811 -3,67271 ,34803 -1,969 41 ,056 -4,17965 2,12266 -8,46646 ,10716 -1,938 27,595 ,063 -4,17965 2,15629 -8,59954 ,24023 -,871 41 ,389 -,75974 ,87237 -2,52152 1,00204 -,861 32,306 ,396 -,75974 ,88233 -2,55632 1,03684 Tabel A 2.13 Gemiddeld aantal geproduceerde woordsoorten Marokkaans-Arabisch met 27 en 28 maanden Group Statistics Aantalnomina Aantalverba Aantaladjectiva Aantalgeslotenklasse Aantalonomatopeeroutine Aantalmaanden 27 28 27 28 27 28 27 28 27 28 N 30 28 30 28 30 28 30 28 30 28 Mean 24,9667 36,1786 7,6000 11,7143 4,3667 7,3214 8,5667 12,8214 5,2000 7,1429 Std. Deviation 21,31453 23,93518 6,73949 8,20956 4,64226 5,42323 8,06304 10,62859 2,86958 4,56812 Std. Error Mean 3,89148 4,52332 1,23046 1,55146 ,84756 1,02489 1,47210 2,00861 ,52391 ,86329 Tabel A 2.14 T-toets: Verschil in geproduceerde woordsoorten Marokkaans-Arabisch met 27 en 28 maanden 150 Independent Samples Test Levene's Test for Equality of Variances F Aantalnomina Aantalverba Aantaladjectiva Aantalgeslotenklasse Aantalonomatopeeroutine Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed t-test for Equality of Means Sig. 1,689 t ,199 2,178 ,146 ,769 ,384 1,558 ,217 5,311 ,025 df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -1,887 56 ,064 -11,21190 5,94279 -23,11674 ,69293 -1,879 54,144 ,066 -11,21190 5,96692 -23,17413 ,75032 -2,092 56 ,041 -4,11429 1,96667 -8,05400 -,17457 -2,078 52,361 ,043 -4,11429 1,98016 -8,08713 -,14145 -2,234 56 ,030 -2,95476 1,32277 -5,60458 -,30494 -2,222 53,334 ,031 -2,95476 1,32995 -5,62191 -,28762 -1,725 56 ,090 -4,25476 2,46686 -9,19648 ,68696 -1,709 50,287 ,094 -4,25476 2,49031 -9,25598 ,74646 -1,953 56 ,056 -1,94286 ,99456 -3,93519 ,04948 -1,924 44,882 ,061 -1,94286 1,00983 -3,97691 ,09119 Tabel A 2.15 T-toets: Verschillen tussen jongens en meisjes in woordscore Marokkaans-Arabisch Independent Samples Test Levene's Test for Equality of Variances F WoordscoreMA Equal variances assumed Equal variances not assumed Sig. ,165 ,685 t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -,492 230 ,623 -2,523 5,131 -12,633 7,588 -,494 227,477 ,622 -2,523 5,111 -12,594 7,548 Tabel A 2.16 T-toets: Verschillen tussen jongens en meisjes in woordscore Nederlands Independent Samples Test Levene's Test for Equality of Variances F WoordscoreNed Equal variances assumed Equal variances not assumed ,038 Sig. ,845 t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper ,065 230 ,948 ,381 5,858 -11,162 11,924 ,065 217,160 ,949 ,381 5,899 -11,245 12,007 Tabel A 2.17 T-toets: Verschillen tussen jongens en meisjes in totaalwoordscore 151 Independent Samples Test Levene's Test for Equality of Variances F Totaalwoordscore Equal variances assumed Equal variances not assumed t-test for Equality of Means Sig. ,041 t ,840 df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -,224 230 ,823 -2,14191 9,54957 -20,95772 16,67391 -,223 218,262 ,824 -2,14191 9,60647 -21,07523 16,79142 Tabel A 2.18 T-toets: Verschillen tussen jongens en meisjes in totaalscore Independent Samples Test Levene's Test for Equality of Variances F Totaalscore Equal variances assumed Equal variances not assumed Sig. ,022 ,882 t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -,225 230 ,822 -2,275 10,117 -22,208 17,658 -,223 217,078 ,824 -2,275 10,187 -22,352 17,803 Tabel A 2.19 T-toets: Verschillen tussen jongens en meisjes in conceptscore Independent Samples Test Levene's Test for Equality of Variances F Conceptscore Equal variances assumed Equal variances not assumed Sig. ,691 ,407 t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -,625 230 ,533 -4,644 7,430 -19,283 9,995 -,626 226,177 ,532 -4,644 7,414 -19,254 9,966 Tabel A 2.20 Two-way ANOVA: Interactie-effecten ‘aantal maanden’ * ‘geslacht’ voor woordscore Marokkaans-Arabisch Tests of Between-Subjects Effects Dependent Variable: WoordscoreMA Source Corrected Model Intercept AantMaanden Geslacht AantMaanden * Geslacht Error Total Corrected Total Type III Sum of Squares 80074,840a 190972,293 72868,044 722,778 5574,192 269421,259 847703,000 349496,099 df 29 1 16 1 12 202 232 231 Mean Square 2761,201 190972,293 4554,253 722,778 464,516 1333,769 F 2,070 143,182 3,415 ,542 ,348 Sig. ,002 ,000 ,000 ,462 ,979 a. R Squared = ,229 (Adjusted R Squared = ,118) Tabel A 2.21 Two-way ANOVA: Interactie-effecten ‘aantal maanden’ * ‘geslacht’ voor woordscore Nederlands 152 Tests of Between-Subjects Effects Dependent Variable: WoordscoreNed Source Corrected Model Intercept AantMaanden Geslacht AantMaanden * Geslacht Error Total Corrected Total Type III Sum of Squares 73852,614a 181497,791 54896,116 40,750 20880,203 381248,244 932945,000 455100,858 df 29 1 16 1 12 202 232 231 Mean Square 2546,642 181497,791 3431,007 40,750 1740,017 1887,368 F 1,349 96,165 1,818 ,022 ,922 Sig. ,120 ,000 ,031 ,883 ,526 a. R Squared = ,162 (Adjusted R Squared = ,042) Tabel A 2.22 Two-way ANOVA: Interactie-effecten ‘aantal maanden’ * ‘geslacht’ voor totaalwoordscore Tests of Between-Subjects Effects Dependent Variable: Totaalwoordscore Source Corrected Model Intercept AantMaanden Geslacht AantMaanden * Geslacht Error Total Corrected Total Type III Sum of Squares 273213,498a 744819,647 242236,986 1106,765 33516,578 936258,847 3161362,000 1209472,345 df 29 1 16 1 12 202 232 231 Mean Square 9421,155 744819,647 15139,812 1106,765 2793,048 4634,945 F 2,033 160,697 3,266 ,239 ,603 Sig. ,002 ,000 ,000 ,626 ,839 a. R Squared = ,226 (Adjusted R Squared = ,115) 153 Appendix 3 De invloed van externe factoren op scores op de Lexilijst Tabel A 3.1 T-toets: Verschil in woordscore Nederlands tussen het wel of niet gevolgd hebben van lessen Nederlands door de moeder Independent Samples Test Levene's Test for Equality of Variances F WoordscoreNed Equal variances assumed Equal variances not assumed t-test for Equality of Means Sig. 3,901 t ,049 df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -2,730 230 ,007 -18,121 6,638 -31,199 -5,042 -3,122 127,502 ,002 -18,121 5,803 -29,604 -6,637 Tabel A 3.2 T-toets: Verschil in woordscore Nederlands tussen het wel of niet gevolgd hebben van lessen Nederlands door de vader Independent Samples Test Levene's Test for Equality of Variances F WoordscoreNed Equal variances assumed Equal variances not assumed t-test for Equality of Means Sig. 4,398 t ,037 df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -2,207 229 ,028 -17,276 7,828 -32,699 -1,853 -2,782 70,136 ,007 -17,276 6,211 -29,663 -4,890 Tabel A 3.3 One-way ANOVA: Relatie tussen moedertaal van de vader en woordscore Marokkaans-Arabisch ANOVA WoordscoreMA Between Groups Within Groups Total Sum of Squares 16209,887 333286,2 349496,1 df 4 227 231 Mean Square 4052,472 1468,221 F 2,760 Sig. ,029 154 Tabel A 3.4 Post Hoc test: Relatie tussen moedertaal van de vader en woordscore MarokkaansArabisch Multiple Comparisons Dependent Variable: WoordscoreMA LSD (I) Moedertaalvader Marokkaans Marokkaans/Nederlands Berbers/Marokkaans Overig (J) Moedertaalvader Marokkaans/Nederlands Berbers/Marokkaans Overig Marokkaans Berbers/Marokkaans Overig Marokkaans Marokkaans/Nederlands Overig Marokkaans Marokkaans/Nederlands Berbers/Marokkaans Mean Difference (I-J) 25,755 -13,895 43,422 -25,755 -39,650* 17,667 13,895 39,650* 57,317* -43,422 -17,667 -57,317* Std. Error 13,816 8,986 22,288 13,816 16,029 25,941 8,986 16,029 23,724 22,288 25,941 23,724 Sig. ,064 ,123 ,053 ,064 ,014 ,497 ,123 ,014 ,016 ,053 ,497 ,016 95% Confidence Interval Lower Bound Upper Bound -1,47 52,98 -31,60 3,81 -,50 87,34 -52,98 1,47 -71,24 -8,06 -33,45 68,78 -3,81 31,60 8,06 71,24 10,57 104,06 -87,34 ,50 -68,78 33,45 -104,06 -10,57 *. The mean difference is significant at the .05 level. Tabel A 3.5 One-way ANOVA: Relatie tussen thuistaal en woordenschatscore Nederlands ANOVA WoordscoreNed Between Groups Within Groups Total Sum of Squares 49003,509 406097,3 455100,9 df 4 227 231 Mean Square 12250,877 1788,975 F 6,848 Sig. ,000 155 Tabel A 3.6 Post Hoc test: Relatie tussen thuistaal en woordenschatscore Nederlands Multiple Comparisons Dependent Variable: WoordscoreNed LSD (I) Taaltegenkind Nederlands Marokkaans Marokkaans/Nederlands Berbers/Marokkaans (J) Taaltegenkind Marokkaans Marokkaans/Nederlands Berbers/Marokkaans Nederlands Marokkaans/Nederlands Berbers/Marokkaans Nederlands Marokkaans Berbers/Marokkaans Nederlands Marokkaans Marokkaans/Nederlands Mean Difference Std. Error (I-J) 73,236* 21,618 48,348* 21,459 75,333* 32,304 -73,236* 21,618 -24,888* 5,775 2,097 24,828 -48,348* 21,459 24,888* 5,775 26,985 24,690 -75,333* 32,304 -2,097 24,828 -26,985 24,690 Sig. ,001 ,025 ,021 ,001 ,000 ,933 ,025 ,000 ,276 ,021 ,933 ,276 95% Confidence Interval Lower Bound Upper Bound 30,64 115,83 6,06 90,63 11,68 138,99 -115,83 -30,64 -36,27 -13,51 -46,83 51,02 -90,63 -6,06 13,51 36,27 -21,66 75,64 -138,99 -11,68 -51,02 46,83 -75,64 21,66 *. The mean difference is significant at the .05 level. 156 Appendix 4 Samenstelling van het vocabulaire Tabel A 4.1 Correlaties tussen de woordsoorten voor het Marokkaans-Arabisch Correlations Percentage Nomina Percentage Verba Percentage Gesloten Klasse Percentage Adjectiva Percentage Onomatopee en Routine Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Percenta Percenta ge ge Onomato Gesloten pee en Percentage Percenta Percentage Klasse Routine Nomina ge Verba Adjectiva 1 ,853** ,834** ,880** ,752** ,000 ,000 ,000 ,000 232 232 232 232 232 ,853** 1 ,868** ,840** ,739** ,000 ,000 ,000 ,000 232 232 232 232 232 ,834** ,868** 1 ,818** ,719** ,000 ,000 ,000 ,000 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 232 232 232 ,880** ,000 232 ,752** ,000 232 ,840** ,000 232 ,739** ,000 232 ,818** ,000 232 ,719** ,000 232 232 1 232 ,703** ,000 232 232 ,703** ,000 232 1 232 **. Correlation is significant at the 0.01 level (2-tailed). Tabel A 4.2 Correlaties tussen de woordsoorten voor het Nederlands Correlations AantalnominaNed AantalverbaNed AantalgeslotenklasseNed AantalAdjectivaNed AantalonomatopeeNed Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Aantalno minaNed 1 232 ,885** ,000 232 ,864** ,000 232 ,916** ,000 232 ,791** ,000 232 Aantalverba Aantalgeslote Aantal Aantalonom Ned nklasseNed AdjectivaNed atopeeNed ,885** ,864** ,916** ,791** ,000 ,000 ,000 ,000 232 232 232 232 1 ,876** ,837** ,704** ,000 ,000 ,000 232 232 232 232 ,876** 1 ,820** ,742** ,000 ,000 ,000 232 232 232 232 ,837** ,820** 1 ,716** ,000 ,000 ,000 232 232 232 232 ,704** ,742** ,716** 1 ,000 ,000 ,000 232 232 232 232 **. Correlation is significant at the 0.01 level (2-tailed). 157 Tabel A 4.3 Gepaarde T-toets: Verschil tussen het aantal geproduceerde Verba in het MarokkaansArabisch en het Nederlands Paired Samples Test Paired Differences Mean Pair 1 Proportie Verba MA - Proportie Verba Ned ,02807 Std. Deviation Std. Error Mean ,19168 ,01258 95% Confidence Interval of the Difference Lower Upper ,00327 ,05287 t df 2,230 Sig. (2-tailed) 231 ,027 Tabel A 4.4 Gepaarde T-toets: Verschil tussen het aantal geproduceerde woorden uit de Gesloten Klasse in het Marokkaans-Arabisch en het Nederlands Paired Samples Test Paired Differences Mean Pair 1 Proportie Gesloten Klasse MA Proportie Gesloten Klasse Ned ,03649 Std. Deviation Std. Error Mean ,18890 ,01240 95% Confidence Interval of the Difference Lower Upper ,01205 ,06092 t df Sig. (2-tailed) 2,942 231 ,004 Tabel A 4.5 Gepaarde T-toets: Verschil tussen het aantal geproduceerde woorden van de categorie Onomatopee & Routine in het Marokkaans-Arabisch en het Nederlands Paired Samples Test Paired Differences Mean Pair 1 Proportie Onomatopee & Routine MA Proportie Onomatopee & Routine Ned -,04027 Std. Deviation Std. Error Mean ,22162 ,01455 95% Confidence Interval of the Difference Lower Upper -,06894 -,01160 t -2,768 df Sig. (2-tailed) 231 158 ,006