TAALWETENSCHAPPEN 1. Wat is fonetiek? 1.1. Inleiding Onderscheid tussen taal (systeem van conventionele tekens, waarmee de gebruikers van de taal ideeën kunnen communiceren. Het is iets abstracts dat gebruik maakt van een set van regels. Het is niet waarneembaar. Als je problemen hebt met dat regelsysteem in je hoofd, dan heb je een taalstoornis. De spraak functioneert nog, maar taal niet meer) en spraak (waarneembaar als een geheel van klanken, een klankreeks aan elkaar gekoppeld. De vertaling van de taal). De behandeling van spraakstoornissen is volledig anders. 'Fonetiek bestudeert de waarneembare manifestatie (verschijnsel) van menselijke taal (spraak) in relatie tot de verborgen structuur van het abstracte taalsysteem (de taal)' 1.2. De binnen- en buitenkant van taal Een taalteken is een waarneembare vorm met een niet-waarneembare betekenis, deze twee aspecten zijn met elkaar verbonden. Bv. koe = melk producerend herkauwend zoogdier. De koppeling van de vorm aan de betekenis is conventioneel, willekeurig, en één en dezelfde vorm kan in één taal volkomen verschillende betekenissen hebben. Bv. bijenwas, bonte was, hij was,... Fonetiek is de specialisatie binnen de taalwetenschap die zich bezighoudt met de uiterlijk waarneembare kant van de taaltekens. 'Een referent is een menselijk, levend, niet-levend of zelfs abstract object in de buitentalige werkelijkheid waarnaar wordt verwezen met één of meerdere betekenisdragende woorddelen.' Bv. 'De man verft de stoel' heeft twee referenten: een menselijk individu 'man' en een onbezield object 'stoel'. De relatie tussen die twee wordt uitgedrukt door 'verft'. Objecten worden met behulp van woorden geclassificeerd. Bv. toon een foto van een stoel, en een spreker van het Nederlands zal meteen weten dat het voorwerp een stoel is. Nochtans hebben niet alle stoelen dezelfde kenmerken (4 poten, armleuningen,...) en soms twijfelen we ook of iets wel echt een stoel is. Het lexicon van kenmerken is niet voor iedereen hetzelfde. De verzameling van eigenschappen op grond waarvan de taalgebruiker beslist of iets een stoel is, noemen we de (lexicale) betekenis van het woord 'stoel'. Dit is taal, en wordt bestudeerd in de linguïstiek/taalkunde. 1.3. Wat is taal? Taal is een communicatiemiddel, een abstract coderingssysteem. Een taal is een specifieke manifestatie van dat coderingssysteem, en leeft, verandert of verdwijnt. Het gaat over menselijke natuurlijke taal (MNT), dus geen dierlijke communicatie of kunstmatige taal. MNT komt op natuurlijke wijze tot stand, evolueert nog steeds, multi-interpretabel. Taal is een systeem van taaltekens. Men koppelt een klankreeks aan iets dat op zich niet waarneembaar is. Bv. 'vis', het beeld van die vis is alleen waarneembaar voor de persoon zelf, dus anderen kunnen niet zien dat die persoon aan die vis denkt. Kenmerken van de MNT: Arbitrair/willekeurig Koppelen van de niet-waarneembare betekenis en de waarneembare vorm, dit is willekeurig, en de klankreeks is anders in verschillende talen Uitzonderingen: onomatopeeën hebben een (gedeeltelijk) gemotiveerd verband tussen vorm en betekenis, bv. sommige vogelnamen (koekoek) Conventioneel (verbonden aan afspraken) Ingeburgerde woorden verandert men niet zomaar van betekenis. Als de context in het Nederlands is, volgt men de Nederlandse uitspraken. Taal behoort niet toe tot één individu, en betekenissen kunnen niet zomaar gewijzigd worden (zie fragment Alice in Wonderland) Productiviteit Het aantal woorden/zinnen dat gevormd en begrepen kan worden is theoretisch oneindig (Chomsky). Met een beperkt aantal elementen en een beperkt aantal regels, zijn er oneindig aantal mogelijkheden. Nieuwe producties van woorden zijn niet geheel vrij (rule-governed creativity) Kinderen worden geboren met het vermogen tot taalleren (LAD = Language Acquisition Device, algemene cognitieve vaardigheden) Dubbele geleedheid Ons taalsysteem kent twee niveaus Lager niveau: fonemisch. Fonemen zijn de kleinste betekenisonderscheidende elementen, ze hebben geen betekenis op dit niveau. Bv. foneem k. Het is een combinatie van klanken die leidt tot betekenisvolle gehelen, en een eindig aantal klanken wordt een oneindig aantal combinaties. Je kan echter niet zomaar alles combineren met alles, mensen die dit wel doen hebben een fonologische stoornis. Hoger niveau: morfemisch. Morfemen (kleinste woorden die niet meer zijn op te delen in kleinere stukjes met een zelfstandige betekenis) hebben wel een betekenis, als ze zelfstandig kunnen staan zijn het vrije morfemen. Bv. hand-je (eerste is een vrij morfeem, andere niet) Discrete karakter Fonemen zijn strikt van elkaar te scheiden, hoewel ze in de gesproken taal vloeiend in elkaar overgaan. Bv. 'lat' heeft 3 fonemen, maar klinkt als 1 klank. We zeggen niet l a t, dus de klanken zijn niet afgebakend maar continue. En toch kunnen we er elke keer de klanken uithalen. Bij onduidelijke uitspraak creëert de luisteraar geen nieuwe betekenis. Bv. mijn loat ligt in uw handen --> lat of lot, loat bestaat niet. Taalwetenschap is de beschrijving van taal op verschillende niveaus: Fonemen (mat ≠ kat) Morfemen (hand-en, hand-je, hand-druk) Woorden (handdruk) Zinnen (syntaxis) Tekst Het onderwerp is taal bij taalwetenschap, taalkunde, linguïstiek. De taak van een linguïst is het verborgen taalsysteem zichtbaar maken, in kaart brengen. Descriptief = beschrijven van fenomenen, prescriptief schrijft voor, vertelt ons hoe de taal gebruikt moet worden. Subdisciplines: Fonetiek: studie van klanken op concreet niveau Fonologie: klanken als abstracte entiteit, fonemen Morfologie: studie van morfemen Syntaxis/zinsleer: combinatie van morfemen tot grotere gehelen, zinsdelen/zinnen. Semantiek/betekenisleer: studie van de betekenissen van woorden Pragmatiek: gebruik van de taal (bv. ASS, geen abstractie kunnen maken bij een figuurlijke betekenis) Taalwetenschap is de studie van een geïsoleerd tekensysteem, los van gebruiker en maatschappij. Ruime betekenis: studie van taal in relatie tot andere fenomenen (bv. vergelijkingen tussen talen, ontwikkelingsgeschiedenis van taal etc.). Er zijn diverse studiedomeinen/subdomeinen in de linguïstiek: Sociolinguïstiek: hoe gebruikt men taal in sociale omstandigheden (bv. verschillende registers in verschillende situaties) Psycholinguïstiek: wat maakt de taal mogelijk, welke mentale processen komen daarbij kijken Neurolinguïstiek: studie van samenhang tussen het centraal zenuwstelsel (CZS) en taal 1.4. Wat is fonetiek? Taken van de fonetiek, met welke vragen houdt de fonetiek zich bezig: De primaire taak van de fonetiek is om aan te geven wat de verzameling is van alle mogelijke vormen van taaltekens. Het is een algemene eigenschap van menselijke taalbouwsels dat ze hiërarchisch gestructureerd zijn: klinkers & medeklinkers syllaben woorden/klankvormen. Er moet rekening gehouden worden met het sonoriteitsbeginsel. Verklaringen geven voor de bouwprincipes van de taaltekens Waarom zijn lettergrepen gestructureerd volgens het sonoriteitsbeginsel etc. Bestuderen van de functionele eigenschappen van de klankvorm van taal Taalstructuren zijn niet toevallig, maar zijn geëvolueerd om de communicatie optimaal efficiënt te laten verlopen: de structuren zijn gemakkelijk te produceren, te leren en te herkennen. Kortom: duidelijk maken wat de relatie is tussen de abstracte structuur van taal (bouwsels) en de manifestatie van deze structuren in fysiek waarneembare vormen zoals spraakgeluid. Domein van de fonetiek: spraak is niet hetzelfde als taal, klank is niet hetzelfde als een taalteken. 1.5. Het proces van spreken en verstaan Spraakketen (hoe meer naar boven, hoe centraler. Meer naar beneden = perifeer): 1. Bedoelen = gedachten, concepten 2. Formuleren = a.d.h.v. taaleenheden, zoals morfemen, woorden, zinsstructuren --> opgeslagen in het brein 3. Spreken = articulatorische fonetiek, bouw en werking van anatomische en fysiologische structuren en vorming van klinkers en medeklinkers 1 – 3: productie van de spraak. 4. Spraakgeluid/signaal = akoestische fonetiek, verstoringen door luchtdruk, spreken door beweging spraakorganen, opgevangen door het gehoor. Het is een fysisch verschijnsel, dus meetbaar. 5. Horen = auditieve fonetiek, luchtdrukverstoringen opvangen 6. Verstaan = in de geluidsstroom woorden herkennen 7. Begrijpen = hoorder achterhaalt gedachtenconcepten van de spreker 5 – 7: perceptie van spraak. Mentale taalstructuur (bedoelen en begrijpen): Centraal: in de geest van de taalgebruiker Niet-waarneembaar Studiedomein van taalpsychologie - cognitieve psychologie Fysiek spraakgeluid (spreken en horen): Perifeer: aan de buitenkant van het menselijk lichaam Waarneembaar door buitenstaanders Studiedomein van fonetiek 1.6. Voorwaarden voor communicatie Er moet tegelijkertijd aan deze twee voorwaarden worden voldaan: Geen van de deelprocessen gestoord Spreker en hoorder hebben toegang tot hetzelfde transmissiekanaal en dezelfde taalcode. 1.7. Het spraakgeluid Segmentele eigenschappen van spraakgeluid: Segmenten = geheel van klinkers en medeklinkers (tweeklanken worden vaak genoemd onder klinkers). De eigenschappen van deze segmenten zijn segmentele eigenschappen. Het verschil tussen klinkers is een segmenteel verschil, zoals ook het feit dat de stembanden bij de klank /b/ eerder gaan trillen dan bij een /p/. Co-articulatie (articulatie van een klank kan worden beïnvloed door de klanken die eraan vooraf gaan of er op volgen) bv. 'a' klinkt anders als er een l achter komt of als er een p achter komt. Assimilatie (gehele of gedeeltelijke gelijkwording van een medeklinker aan een andere medeklinker) bv. vaatdoek Prosodische eigenschappen: Alle eigenschappen in het spraakgeluid die niet zonder meer zijn af te leiden uit de opeenvolging van klinkers en medeklinkers. Bv. weten waar de klemtoon van de zin ligt, dit weten we door prosodie: zinsmelodie en ritmiek. Deze eigenschappen bepalen soms mee de betekenis. 1.8. Fonetiek en spraaktechnologie Fonetiek is een experimentele wetenschap. Dit betekent dat de foneticus ideeën toetst met behulp van experimenten. In een experiment beheerst de onderzoeker de werkelijkheid. Hij creëert een kunstmatige situatie waarin hij alle verschijnselen onder directe controle heeft, invloeden van buitenaf worden zo veel mogelijk geweerd. In zo’n experiment probeert de onderzoeker een causaal verband te vinden tussen verschillende verschijnselen. Bv. akoestische intensiteit (luidheid) van beklemtoonde klinker > onbeklemtoonde klinker? --> wordt getest door dezelfde spreker binnen dezelfde klankopeenvolging. Toepassingen onderzoek: Technologische toepassingen: telefoon, spraakherkenningssoftware, voorleessoftware, cochleaire implantaten,… 2. Eenheden in taal en spraak en versprekingen 2.1. Eenheden in de taalkundige hiërarchie Morfosyntactische hiërarchie: in de taalkunde analyseert men in termen van eenheden die op zich weer bestaan uit kleinere eenheden. De hiërarchie van kleine naar grote taaleenheden verloopt als volgt: Morfeem = kleinste taaleenheid met een eigen isoleerbare betekenis. Morfemen kunnen vaak als losse woorden gebruikt worden (vrij morfeem), maar zijn dat niet per se. Bv. deur-tje. 'Tje' heeft wel een eigen betekenis, maar kan niet los gebruikt worden (gebonden morfeem). Morfemen worden gecombineerd tot oneindig veel woorden, en woorden tot woordgroepen. Die worden op hun beurt gecombineerd tot zinnen en alinea’s. Klankvormelijke/fonemische hiërarchie: de kleinste klankvormelijke eenheid is een foneem (een klinker of medeklinker). Dit is de verzameling van alle mogelijke verschillende manieren om een bepaalde klank in een taal uit te spreken. /a/ omvat alle mogelijke uitspraakvarianten van [a]. Een concrete realisatie van een foneem is een allofoon. Het aantal fonemen is beperkt, het aantal allofonen is oneindig. Fonemen worden gecombineerd tot een syllabe (lettergreep/klankgreep). Binnen een syllabe gelden strenge ordeningsprincipes/klankopeenvolgingsregels (werp kan, wepr niet). Syllaben worden samengenomen tot voeten: reeksen syllaben waarvan de beklemtoonde sterker is dan de onbeklemtoonde. Voeten vormen prosodische woorden: woorden waarin de klemtoon belangrijk is, vallen vaak samen met morfosyntactische woorden. Zij worden samengenomen tot fonologische frases, die meestal hetzelfde zijn als morfosyntactische woordgroepen, en daaruit komen dan intonationele frases (meestal hetzelfde als zinnen) 2.2. Taalkundige vs. fonetische eenheden 2.3. Wat versprekingen ons kunnen leren De menselijke geest is een black box, we kunnen er niet in kijken. We hebben alleen toegang tot de output, die is waarneembaar. Fouten in die output (versprekingen) zorgen voor theoretische modellen over de black box. Taalkundige eenheden bestaan uitsluitend in de geest van de taalgebruiker. Dit wordt bestudeerd in de taalpsychologie. 2.4. Spraakproductie: plan vs. programma Een spreker begint met een ruw plan te maken van wat hij wil zeggen. De volgorde van de cruciale concepten ligt vast, maar er is in het planstadium nog geen keuze gemaakt voor specifieke woorden/klanken. De globale eigenschappen van de zinsmelodie en de accentplaatsing zijn wel in het plan opgenomen. Het ruwe plan wordt geconcretiseerd in een programma, reeksen van bewegingsinstructies die vanuit het brein verzonden moeten worden naar de spraakorganen. Ook hier is een werkingsprincipe: eerst inhoudswoorden, dan functiewoorden en dan individuele klanken (ze worden dan pas in detail gespecifieerd). We kunnen versprekingen onderverdelen in twee hoofdcategorieën: selectiefouten en programmafouten. 2.5. Selectiefouten Syncrasie/woordversmelting: men creëert een nieuw begrip zonder die intentie te hebben (neologismen) bv. krastische maatregelen. Verkeerde woordkeuze: binnen de kandidatengroep wordt de verkeerde mogelijkheid gekozen bv. in de week juni. Hier noemen we het juiste alternatief het doel van de verspreking, en de ten onrechte geselecteerde kandidaat noemen we de indringer. Malapropisme: er is een sterke klankvormelijke overeenkomst tussen doel en indringer zonder enige betekenisovereenkomst. Bv. in diabetische volgorde. Dit kan ook een opzettelijke/spontane verspreking zijn. 2.6. Programmafouten/detailfouten Bv. een bloemetje blengen: in plaats van de doelklank /r/ verschijnt de indringer /l/. Deze indringer heeft zijn oorsprong in de /l/ van het woord bloem. We onderscheiden versprekingen langs verschillende dimensies: Dimensie 1: grootte van de eenheid. Het betekenisvolle niveau (woord/morfeem bv. de president van de president) en het betekenisloze niveau (syllabe/foneem bv. een bloemetje blengen). Dimensie 2: resultaat van de verspreking. Insertie (toevoeging, er komt een element (klank, morfeem, woord) extra tegenover het doel bv. vier vlazen bloemen), deletie (weglating, er verdwijnt een element bv. over een spiraal speken), substitutie (vervanging, een combinatie van insertie en deletie bv. blengen), transpositie (verschuiving, hetzelfde element wordt op de ene plek weggelaten en op een andere plaats ingeschoven bv. vees of vlis), permutatie/spoonerisme (verwisseling, bv. het kij is geteerd). Dimensie 3: oorsprong/indringer-relatie bij verspreking. Anticipatie (de indringer verschijnt eerder dan zijn oorsprong bv. een luchte lunch) en perseveratie (de indringer verschijnt later dan zijn oorsprong bv. een bloem blengen). Wat programmafouten ons over de rol van taaleenheden bij spraak vertellen: anticipaties komen veel vaker voor dan preseveraties, omdat de aandacht van de spreker vooral gericht is op wat hij/zij wil zeggen. Anticipaties van klanken komen steeds minder vaak voor naarmate de afstand tussen oorsprong en doel groter is. De maximale afstand is daarbij zelden groter dan zeven lettergrepen. 2.7. Regelmaat van versprekingen Versprekingen zijn niet willekeurig. De indringer bij een selectiefout vertoont overeenkomsten met het doel in betekenis, woordsoort en klankvorm. Als we ons beperken tot fonologische versprekingen (programmafouten), dan observeren we de volgende regelmaten: Klankversprekingen hebben bijna altijd betrekking op de beklemtoonde syllaben. We zien zelden versprekingen die zich afspelen in onbeklemtoonde syllaben. Het programmeren van klanken binnen beklemtoonde syllaben kost dus meer moeite. Doelklank en indringer hebben meestal een sterke klankvormelijke overeenkomst. In de meest voorkomende klankversprekingen wijken doel en indringer in slechts 1 klankeigenschap van elkaar af. De meeste verwarringen bij medeklinkerversprekingen vinden we in het plaatskenmerk (labiaal, alveolair, velaar,…). Klankversprekingen treden eerder op naarmate de klankomgevingen van doel en oorsprong sterker op elkaar lijken. Bv. de koetsier poetst de postkoets. Een indringer behoudt zijn positie binnen de syllabe die hij zou hebben gehad in de oorsprong bv. een poos dennen – een doop sennen. Versprekingen zijn meestal welgevormd (volgens het sonoriteitsbeginsel). Je kan anticiperen op het soort fouten dat te verwachten is, en sommige fouten komen zelden voor. Klankaanpassingsregels blijven van kracht bij versprekingen. 3. Bouw en werking van de spraakorganen 3.1. Inleiding De anatomische structuren die een rol spelen bij de productie van spraak kunnen in drie groepen worden onderverdeeld: het subglottale systeem (longen en onderste luchtwegen, functie = lucht naar buiten sturen), het glottale systeem (strottenhoofd/larynx en stembanden/glottis, functie = stemgeving) en het supraglottale systeem (mond-, neus- en keelholte, functie = realisatie van klanken en resonantie). 3.2. Het glottale systeem Boven op de luchtpijp bevindt zich de larynx. Het is relevant wegens de stemgeving, maar ook door het afsluiten van de luchtpijp met het strotklepje (epiglottis). De larynx is een doosje van kraakbeen dat hangt aan het tongbeen (hyoid). 3.3. De supraglottale structuren De supraglottale structuren omvatten alle onderdelen van de holten boven de glottis die een rol spelen bij de variatie van de mond-keelholte: Alveolen (tandkassen), de farynx (keelholte), het harde (palatum durum) en zachte gehemelte (palatum molle/velum), de huig (uvula), de kaak (mandibula), de lippen (labia), de tong (lingua), het tongbeen (hyoid). Door de mondkeelholte van vorm te veranderen kunnen we allerlei klanken maken. Verder kunnen we gebruik maken van de neusholte en deze als extra resonator inschakelen voor nasale klanken. Voor klinkers moeten de volgende parameters van de mondkeelholte worden gemanipuleerd: De tonghoogte: de afstand tong-gehemelte. De kaakhoogte: invloed op de tonghoogte. De stand van de lippen: open – gesloten, gespreid – gerond. De doorsnede van de farynx: groter bij de ie – kleiner bij de aa. De stand van het velum: hoog (neusholte afgesloten) – laag (neusholte vrij, voor nasalen) De positie van de larynx. 4. Productie van spraakklanken 4.1. Drie fases in het spraakproductieproces Bij de productie van spraakklanken worden drie fases onderscheiden: de initiatiefase, de fonatiefase en de articulatiefase. 4.2. De initiatiefase Alleen door een luchtstroom op gang te brengen kunnen we spraak produceren. Dat deel van het productieproces wordt de initiatiefase genoemd. Er zijn een aantal manieren, onderverdeeld in twee dimensies, om een luchtstroom in gang te zetten: Richting: de lucht wordt vanaf een meer inwendig gelegen plaats in het menselijk lichaam naar buiten gedreven (egressieve luchtstroom op basis van druk), of de lucht wordt van buiten naar binnen gezogen (ingressieve luchtstroom op basis van zuiging). Dit laatste wordt meestal niet gebruikt bij sprekers van het Nederlands. Plaats: het orgaan dat zorgt voor het naar buiten drijven of naar binnen zuigen van de lucht kan zich op verschillende plaatsen bevinden: de longen (pulmonische druk/zuiging), het strottenhoofd (glottale druk/zuiging), de mond (orale druk/zuiging), de slokdarm (oesofagale druk, alleen bij stembandloze sprekers). De meest gebruikelijke manier om een luchtstroom te initiëren is het leegdrukken van de longen: de pulmonisch egressieve initiatie. 4.3. De fonatiefase Bij normaal in- en uitademen passeert de luchtstroom ongehinderd het strottenhoofd. Daar bevindt zich een aanzienlijke ruimte tussen de stembanden, zodat daar geen luchtwervelingen of pulsaties kunnen optreden. Er is sprake van fonatie als een luchtstroom door trillende stembanden in korte pulsen wordt omgezet. De stembanden komen niet zomaar tot trilling, daarvoor is er een verschil in druk nodig tussen de holten boven en onder de stembanden: transglottale druk. Als dat drukverschil groot genoeg is, drukt de lucht vanuit de longen de stembanden van elkaar. De luchtstroom die dan door de smalle doorgang (glottis) wordt gestuurd ondergaat een versnelling, die als gevolg heeft dat de luchtdruk tussen de stembanden lager wordt. Dit is het Bernouilli-effect. Door die lager wordende luchtdruk worden de stembanden weer tegen elkaar gezogen. Dit proces herhaalt zich zolang het transglottale drukverschil groot genoeg is. Bij fluisteren wordt specifiek gebruik gemaakt van de glottis. De stembanden worden bij dat type spraak in een specifieke stand gezet, waardoor de glottis de vorm van een omgekeerde Y krijgt: er is een kleine opening tussen de arytenoïden. Dit is de fluisterdriehoek. 4.4. Articulatie van klinkers en medeklinkers Hier worden de luchtdrukverstoringen die gegenereerd worden in de initiatiefase en al dan niet omgezet worden in luchtdrukpulsen tijdens het fonatieproces, getransformeerd tot klanken: klinkers en medeklinkers. Die omzetting vindt plaats door de supraglottale holten een specifieke vorm te geven. Deze klanken worden onderverdeeld in 2 of 3 klassen: klinkers en medeklinkers (en diftongen). Klinkers Klinkers worden zonder obstakel in de mondkeelholte gerealiseerd. In die holte is dan sprake van een laminaire luchtstroming, een luchtstroom waarbij de luchtdeeltjes zonder wervelingen 1 enkele richting opstromen. De luchtdrukpulsjes die als gevolg van stemgeving vanuit het strottenhoofd worden afgevuurd, worden vervormd door de resonantiekamer waarin ze terechtkomen (mondkeelholte/neusholte). Die mondkeelholte kan allerlei vormen aannemen door articulatoren in verschillende standen te brengen. Kritische parameters in die configuratie zijn: De grootte van de constrictie die de twee buizen scheidt. Dit bewerkstelligt de tong. De plaats van de constrictie, ook hier is de rol van de tong cruciaal. De vorm van de lippen: als deze gestulpt zijn, wordt het buizenstelsel als geheel langer. Bijschakeling van de neusholte aan het buizenstelsel door middel van opening van het velum. De positie van de tong varieert bij de realisatie van de verschillende klinkers. Hoewel de positie van de hele tong verandert, kiest men gewoonlijk voor 1 specifieke locatie om de tongpositie te karakteriseren: de positie van de maximale constrictie, gemaakt langs de horizontale as (voor-achter). Daarbij wordt ook de mate van constrictie aangegeven: de verticale as (hoog-laag). Er wordt ook aangegeven of de klinker met geronde of gespreide lippen wordt uitgesproken. Diftongen Tweeklanken/diftongen worden gekenmerkt door het feit dat zij twee doelposities kennen: de beginpositie en de eindpositie van de klank. Ze bestaan in transcriptie uit twee klanksegmenten. Medeklinkers Het belangrijkste onderscheid tussen medeklinkers en klinkers is dat bij medeklinkers de luchtstroom ergens in de mondkeelholte stuit op een obstructie, gaande van volledige afsluiting tot vernauwing. De mate van vernauwing noemen we de articulatiewijze, en de plaats van de vernauwing is de articulatieplaats. Obstruenten: plosieven & fricatieven. Sonoranten: liquidae, semivocalen en nasalen. Approximanten: liquidae & semivocalen. Elke locatie aan de bovenkant van de mondkeelholte (behalve de bovenlip) vormt een passieve articulator, en de lippen, ondertanden en tong de actieve articulator. Plosieven/occlusieven/plofklanken: bij de realisatie van plofklank /b/ is de mond door de lippen afgesloten. Omdat de vorm van het mondkeelkanaal tijdens de afsluiting niet verandert, neemt de druk in de mondholte snel toe. Na korte tijd is er zoveel lucht door de glottis heen de mondkeelholte ingestroomd, dat de druk boven en onder de glottis in evenwicht komt. Dan stokt de luchtstroom bij gebrek aan drukverschil. Op of kort voor dat moment houden de stembanden op met trillen. Als de spreker de tijd van stembandtrilling wil verlengen, is dit mogelijk door: Het vergroten van de mondholte door bv. de wangen te bollen. Het laten dalen van de larynx. Lucht laten ontsnappen uit de mondholte: de release. Bij een /b/ zet de stemgeving al voor de release in. Als we de explosie van de plofklank als referentietijdstip 0 nemen, dan definiëren we de VOT (Voice Onset Time) als het tijdsverloop tussen de ruisexplosie en de inzet van de stembandtrilling. Negatieve VOT/voice lead is kenmerken voor stemhebbende plofklanken in het Nederlands. Een VOT van 0 ms of meer (voice lag) is het kenmerk van een Nederlandse stemloze plofklank. Bij de plosieven kunnen we dus twee dimensies onderscheiden: de plaats van constrictie (vorm en lengte van de voorste holte) en stemgeving. Fricatieven: komen tot stand door lucht via een vernauwing in het mondkeelkanaal te persen. Als er voldoende lucht door die vernauwing wordt gestuwd, ontstaan er chaotische luchtwervelingen (turbulentie) die wij als ruis waarnemen. Bij klinkers volgen de luchtdeeltjes maar een enkele richting (laminaire luchtstroom), bij fricatieven gaan ze in allerlei richtingen (turbulente luchtstroom). We moeten dus bij de fricatieven twee dimensies onderscheiden: de plaats van de constrictie en het stemhebbend/stemloosonderscheid. Liquidae: er is geringe vernauwing in de mondholte en de luchtstroom blijft vloeien. Door de geringe belemmering lijken liquidae in een aantal opzichten op klinkers. Doordat het mond-keelkanaal echter minder geopend is, zijn ze minder luid. Bij de /l/ stroomt de lucht ongehinderd langs een of beide zijkanten van de tong naar buiten. De realisatie van de /r/ is variabel. Het onderscheid tussen de varianten wordt langs drie dimensies gemaakt: De articulator: tongpunt vs. huig. Onderbroken (vibrant) vs. niet onderbroken (continuant). Bij de onderbroken variant is er een of meerdere keren contact tussen articulatoren. Bij de continuante versie van de /r/ vindt geen contact tussen articulatoren plaats: de luchtstroom wordt niet onderbroken, dit is een approximant. Daarbij worden twee varianten onderscheiden: de alveolaire approximant en de uvulaire approximant. Het aantal contactmomenten tussen tongpunt en tandkassen: 1 of meer. Nasalen: worden gerealiseerd met een gesloten mondkanaal. Bij alle nasalen is het velum geopend, zodat er achter in de mond een verbinding is tussen keel- en neusholte, waardoor de neusholte als resonator kan fungeren. Halfklinkers: klinkers waarbij de tong het gehemelte zo dicht nadert dat er net geen sprake meer is van volkomen ongehinderde luchtstroom. De doorgang is echter nog ruim genoeg om het ontstaan van geruis te vermijden. Affricaten: plofklanken gevolgd door een homorgane fricatief (een fricatief met dezelfde articulatieplaats als de plofklank) bv. /ts/ 4.5. Nasaliteit Nasalisering houdt in dat de neusholte wordt bijgeschakeld als resonantieholte door het velum te laten zakken. De luchttrillingen kunnen dan ook de neusholte binnendringen. Het velum is bij een nasale klank geopend en bij een orale klank gesloten. Maar bij orale klanken is het velum lang niet altijd stevig dicht gedrukt. Er is een rangorde te geven van velumstanden bij diverse soorten spraakklanken: 1. Stemloze plosieven 2. Stemhebbende plosieven 3. Stemloze fricatieven Maximaal gesloten velum 4. Stemhebbende fricatieven 5. Gesloten (hoge) klinkers 6. Open (lage) klinkers 7. Nasalen Maximaal geopend velum 5. Spraak op papier 5.1. Inleiding Spraak is vluchtig. Het geluid is maar heel even beschikbaar en daarna is het voor altijd weg. Toch heeft het nog lang geduurd voordat de mens een systeem bedacht om de vluchtige spraak vast te leggen op een permanent medium. Latere schriftsystemen zijn gebaseerd op steeds kleinere taaleenheden. De oudste schriftsoorten bedienen zich van tekens of tekeningen, die hele zinnen of woorden voorstellen. De symbolen in moderne alfabetische schriften hebben juist betrekking op klanken. 5.2. Geschiedenis van schriftsoorten De oudste schriftsoorten gaan terug tot zo’n 3500 jaar v.C.: de Proto-Sumerische pictogrammen. In de ontwikkeling sindsdien onderscheiden we 5 stadia: Beeldverhaal: dit stadium kunnen we strikt genomen nog niet beschouwen als schrift (weergave op een permanente informatiedrager zoals papier van een gesproken taaluiting). Pictogrammen zijn een voorstelling van een situatie die mogelijk te beschrijven valt met een hele zin. Beeldschrift: men kiest ervoor om ieder woord in een zin voor te stellen met een apart plaatje (logogram). Door de plaatjes in verschillende volgorden te tekenen, kan men gebruik maken van woordvolgorde. Het is belangrijk ons te realiseren dat de plaatjes in het beeldschrift iconisch zijn (we kunnen aan het logogram zien wat erdoor wordt voorgesteld) Een beeldschrift en een beeldverhaal zijn in belangrijke mate taalonafhankelijk, maar de Schijf van Phaistos is toch tot op de dag van vandaag niet ontcijferd. Voorbeelden van zulke woordschriften komen we vandaag nog tegen in het Chinese schrift. Een woordschrift eist van de gebruiker dat deze vele duizenden tekens beheerst. Woordschrift: de stap van logogram naar fonogram wordt gezet als het iconische teken voor woord A ook gebruikt wordt om een woord B met een totaal andere betekenis te representeren als dat woord B hetzelfde klinkt als woord A (bv. bij). De grafische tekens stellen niet langer betekenissen voor, maar klanken. Syllabeschrift: hier schrijft men tekens niet per woord maar per syllabe. Een syllabeschrift heeft het voordeel dat er minder verschillende symbolen geleerd moeten worden. Bv. het spijkerschrift en Japans. Alfabetisch schrift: elke klinker of medeklinker wordt voorgesteld door een eigen symbool, een letter. De gebruiker moet maar een heel klein aantal tekens met hun bijbehorende klankwaarde leren. Niet-alfabetische schriften zijn in de menselijke culturen op verschillende plaatsen ontstaan. Voor zover we weten is het alfabetisch schrift maar één keer in de geschiedenis van de mensheid bedacht. Toen de Grieken met het Foenicisch schrift probeerden te schrijven (gebaseerd op syllaben), merkten ze dat ze geen belangrijke klinkerverschillen konden weergeven. Ze kwamen tot het besef dat syllaben bestaan uit klinkers en medeklinkers. We zien dat in de ontwikkeling van het schrift de eenheden steeds kleiner gekozen werden totdat men uitkwam op het niveau van de kleinste taaleenheden: de klinker en medeklinker. Deze ontwikkeling weerspiegelt het taalbewustwordingsproces bij kinderen. Aanvankelijk zijn zinnen ondeelbaar, dan ontwikkelen kinderen het inzicht dat zinnen kunnen worden opgedeeld in woorden, syllaben en klanken. De ontstaansgeschiedenis van de soort herhaalt zich zo in de ontwikkeling van het jong. Fylogenese (afstammingsgeschiedenis) is dus herkenbaar in de ontogenese (ontstaanswijze, het kind). 5.3. Beginselen van conventionele spelling Het principe achter een alfabetische spelling is dat iedere wezenlijk verschillende klank, ieder foneem, wordt weergegeven met een eigen, uniek symbool. Vaak echter heeft een taal meer dan 26 fonemen, zodat het traditionele alfabet met zijn 26 lettertekens tekortschiet. In zulke gevallen is een eenvoudige en gebruikelijke oplossing om sommige fonemen weer te geven met een vaste combinatie van twee of meer letters die in diezelfde volgorde nooit als twee aparte fonemen voor kunnen komen. Zulke spellingen heten fonologische spellingen (in zo’n talen kunnen we gemakkelijk foutloos leren schrijven). De Nederlandse spelling kunnen we gebruiken als voorbeeld van een abstracter soort spelling, die ook wel morfo-fonologische spelling wordt genoemd. De spelling van het Nederlands is gebaseerd op 5 grondbeginselen: Fonologisch beginsel: iedere klank stellen we voor met een eigen, unieke letter of met een eigen, unieke vaste combinatie van letters. Daarbij nemen we als norm de uitspraak van los uitgesproken woorden door een algemeen sprekende Nederlander. Dit wordt aangevuld met afspraken/regels, bv. lange klinker wordt kort geschreven na een open syllabe, korte klinker krijgt medeklinkerverdubbeling in een gesloten syllabe,… Gelijkvormigheidsprincipe: stammorfemen spellen we altijd met dezelfde reeks letters, ongeacht de uitspraak (hond, web,…). Gelijkvormige spelling van verschillend uitgesproken varianten van hetzelfde stammorfeem, leidt tot betere woordherkenning (hond – honden). Analogieprincipe: regelt voor achtervoegsels wat het gelijkvormigheidsbeginsel doet voor stammen. Volgens dit beginsel spellen we hetzelfde affix altijd op dezelfde manier, ook al wordt dat achtervoegsel in verschillende woorden verschillend/helemaal niet uitgesproken. Ook bij werkwoorden geldt dit: branden klinkt hetzelfde als brandden, maar wordt anders geschreven. Etymologisch beginsel: spellingsverschillen die vroeger correspondeerden met uitspraakverschillen worden in de moderne spelling overeind gehouden, ook al zijn de verschillen in uitspraak verdwenen. Vooral vele vreemde woorden behouden hun authentieke spelling (computer). Verenigbaarheidseis: de vorige principes mogen we alleen toepassen voor zover de spelling terugleesbaar is (bij het hardop lezen leidt het zonder problemen tot de juiste uitspraak). We zouden bv. nooit de verkleinwoorduitgang kunnen spellen volgens het analogiebeginsel, want dan krijg je vistje, broktje, pijptje,… en die woorden zijn niet terugleesbaar als visje, brokje, pijpje. Woorden zoals huiz kunnen we wel nog lezen, omdat een /z/ op het einde van een woord altijd als /s/ wordt uitgesproken. Regels 2 – 5 zijn allemaal morfemische principes. Dit houdt in dat morfemen altijd op dezelfde manier gespeld worden, ongeacht de uitspraak, en dat we woorden sneller kunnen herkennen en meer inzicht hebben in de structuur van de zin. 5.4. Fonetisch schrift Er zijn enkele redenen waarom conventionele spellingen tekortschieten: - Gelijkvormigheid, analogie en etymologie doorbreken consequente toepassing van het fonologisch beginsel. - Het fonologisch beginsel is zelf ook niet nauwkeurig genoeg om alle hoorbare verschillen in uitspraak weer te geven. - Er zijn te weinig verschillende lettertekens om alle spraakklanken mee weer te geven. - Klemtoon, accentuering, frasering en zinsmelodie worden niet systematisch weergegeven in het schrift. Het doel van het fonetisch schrift is de codering van de klankwaarde van een taal. Er is nood aan een systeem dat spraak direct en correct weergeeft. De vormen van notaties waarmee geëxperimenteerd is, kan men onderbrengen in twee typen: Analfabetische notaties Elke klank wordt weergegeven door een reeks van symbolen die alle kenmerken van de klank weergeeft. Dit is te vergelijken met symbolen uit de chemie. Deze soorten systemen zijn in de praktijk niet echt bruikbaar. Alfabetische notaties Iedere spraakklank wordt voorgesteld door één symbool. We maken hier een onderscheid tussen iconische en Romeinse notaties. Iconische notaties: een symbool geeft de stand of actie van de spraakorganen weer. Verwante spraakklanken worden weergegeven door verwante symbolen zonder dat er een symbool-klankrelatie is. Hoe meer de klanken op elkaar lijken, hoe meer gelijkheid tussen de symbolen. Bv. het systeem van Bell (Visible Speech). Romeinse notaties: de relatie tussen symbool en klank is arbitrair. Het Romeinse alfabet is met 26 lettertekens ontoereikend om daarmee alle mogelijke verschillende klanken in de talen van de wereld weer te geven. In de praktijk wordt dit opgelost op verschillende manieren: - Naast kleine letters ook hoofdletters gebruiken ([r][R]) - Omkeringen van letters ([]) - Ook Griekse en Cyrillische symbolen gebruiken ([][]) - Koppelen van symbolen ([][][]) - Diacritische tekens gebruiken voor het aanbrengen van klanknuances (dwarsstreepje, cedille, accentjes etc.) 5.5. Twee typen transcriptie Globale/fonemische transcriptie Tussen /…/, want we zijn hier niet geïnteresseerd in de precieze realisatie van de klank. Een open klinker a, wordt dus altijd getranscribeerd als /a/, ook al wordt hij misschien meer achteraan de mond uitgesproken als een []. Gedetailleerde/fonetische transcriptie Tussen […], want er kan allofonische variatie weergegeven worden. De graad van detail kan hier verschillen afhankelijk van de doelstelling. Deze transcriptie geeft indicaties over de uitspraak van woorden die nooit eerder gehoord werden. De tekens zijn dan ook taalonafhankelijk, van elk symbool is vastgelegd hoe de klank gearticuleerd moet worden. Het IPA (International Phonetic Alphabet) is een organisatie die het fonetisch schrift ontwikkelde en onderhoudt. 5.6. IPA in de praktijk Er zijn geen richtlijnen over de keuze tussen globaal of gedetailleerd. In de logopedie gebruikt men veelal transcriptie bij articulatieproblemen, dus daar is nood aan gedetailleerde transcriptie. Het IPA is een geheel van symbolen om klanken van een taal schriftelijk weer te geven. Het is gebaseerd op het Romeinse alfabet, met toevoeging van Griekse letters en diacritische tekens. 5.7. Afspraken fonetische transcriptie - Vergeet de spelling, schrijf zoals het hoort. - Leer de fonetische tekens en verzorg ze. - Alles wordt aan elkaar geschreven. - Leestekens binnen de haken zijn diacritische tekens - Gebruik geen hoofdletters binnen de haken - Een klank heeft één teken, ook tweeklanken. Foneem klank voorbeeld schriftbeeld Teken voorbeeld betekenis 6. Golfvormen en segmentatie van spraakklanken 6.1. Golfvormen De ons omringende lucht bestaat uit kleine luchtdeeltjes die voortdurend in beweging zijn. Ze botsen tegen elkaar en tegen voorwerpen. De druk die ze hierdoor uitoefenen op een voorwerp is atmosferische luchtdruk, en wordt uitgedrukt in Pascal (1 Newton/m²) of bar (100000 N/m²). De gemiddelde luchtdruk is 1013 hPa (hectopascal). De luchtdruk wordt beïnvloed door de temperatuur. Spraak, en geluid in het algemeen, bestaat uit een snelle opeenvolging van kleine verstoringen van de luchtdruk. Door de bewegingen van de spraakorganen worden de luchtdeeltjes afwisselend dichter op elkaar gedrukt (verdichtingen) en uit elkaar getrokken (verdunningen). De daaruit resulterende drukvariaties planten zich vanaf de geluidsbron voort in alle richtingen, daarbij steeds zwakker wordend met de afstand. De luchtdrukverstoringen worden door ons trommelvlies opgevangen en omgezet in zenuwimpulsen die naar de hersenen worden gestuurd. Wanneer een luchtdeeltje in beweging wordt gebracht, en er zich verder geen specifieke belemmeringen voordoen, dan voert dat deeltje een sinusvormige beweging uit. Dat zien we als we een gewichtje aan een veer hangen en naar beneden trekken. Zonder luchtweerstand zou het gewichtje dezelfde beweging eindeloos blijven uitvoeren; het golfpatroon herhaalt zich dan periodiek. De tijd die nodig is voor één complete herhaling van het golfpatroon heet de periode T. De frequentie F is het aantal periodes T in 1 seconde, en wordt uitgedrukt in Hz. F = 1/T. De snelheid waarmee het bewegingspatroon zich voortplant in de ruimte, de geluidssnelheid, bedraagt 340m/s. Sinusvormige variaties van de luchtdruk nemen we met het gehoor waar als een zuivere toon. Met de menselijke spraakorganen kunnen we een zuivere toon maken door te fluiten. Hoe korter de periode/hoe groter de frequentie, des te hoger is de toonhoogte die het oor aan de sinus toekent. Dus als de frequentie hoger wordt, dan wordt de toonhoogte ook hoger. De grootte van de bewegingen van luchtdeeltjes, en daarmee van de geluidsdruk, wordt de amplitude genoemd, uitgedrukt in dB. Hoe groter de amplitude, des te luider klinkt de sinus/golf. Dit is luidheid en intensiteit (I). Gemiddeld bedraagt de intensiteit van spraak ongeveer 60 dB. In de meeste gevallen is het patroon van luchtdrukvariaties ingewikkelder dan de vloeiende sinusbewegingen. In spraak is die ingewikkeldheid het gevolg van de abrupte en/of chaotische manier waarop de luchtdeeltjes in beweging worden gezet. Bv. klinkers: luchtdeeltjes krijgen forse, korte klappen door de trillende stembanden, fricatieven: luchtdeeltjes worden in een turbulente beweging gezet. Spraakklanken hebben daarom altijd een andere vorm dan enkelvoudige sinussen. Periodieke luchtdrukverstoringen zijn tonaal (hebben een duidelijke toonhoogte). De luchtdrukvariaties worden door een microfoon omgezet in elektrische spanningswisselingen, die we zichtbaar kunnen maken op een oscilloscoop. Zo’n registratie noemen we oscillogram of golfvorm. Er zijn periodieke (de golfvorm herhaalt zich steeds) en niet-periodieke signalen (bv. ruissignalen, signalen geproduceerd voor fricatieven). Niet-periodieke luchtdrukvariaties zijn wild, turbulent en daarom onvoorspelbaar. Ze hebben geen herhalende golfvorm en geen duidelijke toonhoogte (atonaal). 6.2. Segmentatie Wanneer we naar spraak luisteren, kunnen we de afzonderlijke segmenten waaruit de woorden bestaan, gemakkelijk benoemen. Het is nog niet zo makkelijk om de grenzen tussen die klanken in het spraaksignaal terug te vinden. Het spraaksignaal kunnen we op verschillende manieren afbeelden, waaronder het oscillogram. Het probleem is dat spraakklanken niet discreet zijn, ze zijn niet van elkaar gescheiden. Bij het afgrenzen van klanken gaan we daarom liever niet op het gehoor te werk, maar op het oog. Segmentatie van spraak is een voorwaarde om te kunnen vaststellen hoe lang de spraakklanken duren. 6.3. Segmentatie van de spraak Hoe kunnen in de golfvorm brede fonetische klassen worden onderscheiden? We onderscheiden bij oscillogrammen 7 signaalkenmerken die gebruikt kunnen worden bij de segmentatie: Periodiek signaal: de periodiciteit wordt veroorzaakt door het trillen van de stembanden. Het gaat dan om een stemhebbende klank. Lokaal maximum: wanneer de amplitude van het signaal een lokaal maximum vertoont (hoog vergeleken met de amplitude van de omliggende klanken) dan hebben we waarschijnlijk met een klinker te maken. Stil interval: stilte vinden we in de gesloten fase van een plosief, het weerspiegelt de tijd waarin de mond gesloten is, en drukopbouw in de mond plaatsvindt. Bij de stemhebbende plosieven wordt de tijd waarin de mond gesloten is, gevuld met stemhebbend ‘gemurmel’/prevoicing. Deze is zichtbaar als een periodiek signaal met een lage amplitude. Ruis: signaal zonder zigzagpatroon: stemloze fricatieven, ruis met een periodiek signaal levert een wazig zigzagpatroon op. Dit zijn stemhebbende fricatieven. Fricatieven hebben een kleinere amplitude dan klinkers. Door turbulentie in de mondholte creëer je stemhebbende en stemloze fricatieven. Is die turbulentie in de glottis, dan krijg je gefluister of aspiratie. Explosie: een zeer kort stukje ruis, dat ontstaat als gevolg van de release bij de productie van een plofklank. De lengte van de explosie is kort/geheel afwezig bij de stemhebbende, en langer bij de stemloze plosieven. Amplitudeverandering: als in een periodiek signaal de amplitude zich plotseling wijzigt, kan dat samenhangen met de overgang naar een andere klank. Er zijn kleinere veranderingen tussen klinkers en nasalen of liquida, en grotere veranderingen tussen klinkers en plosieven of fricatieven. Verandering in fijnstructuur van de golfvorm: wijst op een gewijzigde samenstelling van het spraakgeluid, als gevolg van een verandering in de vorm van de mondkeelholte. 6.4. Klanken visueel herkennen Klinkers: periodiek zigzagpatroon, relatief grote amplitude, duur tussen 50 (sjwa) & 300 (lange klinkers) ms. Stemloze plofklanken: de amplitude van de voorafgaande klinker neemt vrij abrupt af, daarna volgt een stil interval (< 100 ms) en een korte ruisexplosie. De steminzet (VOT) is positief, omdat de stem na de explosie inzet. Stemhebbende plofklanken: de amplitude van de voorafgaande klinker daalt minder abrupt. De VOT is negatief, en het stille interval is gevuld door een gladde, sinusachtige golf met een geringe amplitude. De ruisexplosie heeft een geringe of geen amplitude. Geaspireerde (stemloze) plofklanken: de inzet van de stembandtrilling (VOT) na een stemloze plofklank wordt uitgesteld tot veel later na de ruisexplosie. Het interval tussen de ruisexplosie en de steminzet wordt opgevuld met een stemloze (gefluisterde) variant van de volgende klank. Hier is sprake van een positieve VOT. Klanken met een negatieve VOT zijn altijd stemhebbend. Stemloze fricatieven: bestaat uit een ruissignaal, zonder periodiciteit. De amplitude is geringer dan die van de omringende klinkers. Stemhebbende fricatieven: bestaat uit een ruissignaal, gesuperponeerd (liggend bovenop) op een periodiek signaal. Dit levert een wazige zigzag op. Nasalen: periodiek zigzagpatroon, met een nagenoeg constante amplitude die kleiner is dan bij klinkers. Liquidae [l][r]: periodiek zigzagpatroon, met zeker bij de [l] constante amplitude (daarom moeilijk te onderscheiden van nasalen). [r] ken verschillende allofone variaties. Halfklinkers/approximanten: een periodiek zigzagpatroon, met een amplitude die vanuit een voorafgaande klinker vaak langzaam daalt, en naar de volgende klinker toe weer langzaam stijgt. [ɦ]: een periodiek zigzagpatroon met een geringere amplitude dan de omringende klinkers. De klinker na de [ɦ] neemt relatief langzaam toe in amplitude. Glottislag: enkele langzame, onregelmatig gespatieerde zigzaggen, soms met kort stil interval. 7. Spectra en formanten 7.1. Spectra De golfvorm van spraakgeluid lijkt bijna nooit op die van de enkelvoudige sinus, meestal is het een zeer complex golfpatroon. Het opvallendst bij dergelijke spraakgolven is wel de periodiciteit die zich bij de stemhebbende klanken voordoet en het gebrek aan enige periodiciteit bij stemloze spraakklanken. Blijkbaar zorgt de stembandtrilling voor de herhalingen in het patroon. Als we die ingewikkelde golfvormen willen beschrijven, staan we voor een probleem. Kwalitatieve beschrijvingscategoriëen zijn niet geschikt voor de beschrijving. Het blijkt mogelijk iedere ingewikkelde golf te analyseren als een stelsel van meerdere tegelijkertijd klinkende sinusgolven, ieder met een eigen frequentie, amplitude en tijdsordening. Dit is de Fourieranalyse: het ontbinden van de geluidsgolf in zijn enkelvoudige sinusgolven. De afzonderlijke sinussen worden ieder gekenmerkt door drie eigenschappen: amplitude A in dB (hoorbaar als luidheid/intensiteit), frequentie F in Hz (hoorbaar als toonhoogte) en de fase (niet hoorbaar). Enkel de eerste 2 volstaan voor de beschrijving van complexe golfpatronen. Een grafiek met op de horizontale as de frequenties en op de verticale as de amplitudes, wordt een spectrum genoemd. De zaagtand heeft een glad aflopend spectrum: iedere hogere frequentiecomponent heeft een geringere amplitude dan zijn linkerbuur. De grondtoon (de sinusgolf met de laagste frequentie) is grondtoon F0. De andere sinussen hebben frequenties die hele veelvouden zijn van de grondfrequentie (boventonen/formanten). Grondtoon en boventoon samen noemt men harmonischen. De grondtoon is de eerste harmonische, de eerste boventoon de 2de,… Bij het vergelijken van spectra kijkt men gewoonlijk naar de toppen in het spectrum, de maxima, die goed zichtbaar worden als over het spectrum een omhullende lijn wordt getekend. De grondtoon wordt bepaald door de stembandtrilling. Kenmerkend hiervoor is dat de intensiteit van de afzonderlijke sinusgolven afneemt met 12 dB per octaaf. De formanten (Fn) worden bepaald door de stand van de mondkeelholte. Welke binnenkomende sinussen worden versterkt of verzwakt, hangt af van de vorm van de holte. Het bronspectrum en de overdrachtsfunctie (door de resonantieholten versterkte formanten/boventonen) samen, vormen het spectrum van een spraakklank. Dit is de bron-filtertheorie. Spraakgeluiden worden dus gerealiseerd door trilling van de stembanden en de resonantie van de mondkeelholte. Klinkers worden gewoonlijk beschreven op basis van de eerste 2 of 3 formanten. De klinkers kunnen op een spectrum van elkaar worden onderscheiden, met een oscillogram gaat dat niet. 7.2. De relatie tussen aanzetstuk en golfvorm Het aanzetstuk is in de akoestische fonetiek de benaming voor het stelsel van holten dat zich op weg naar buiten toe bevindt voorbij de producent van het brongeluid. Bij stemhebbende spraakklanken wordt het brongeluid geproduceerd in het strottenhoofd. Het aanzetstuk wordt dan gevormd door het stelsel van holten in keel, mond en neus. Bij de productie van stemloze fricatieven wordt het brongeluid opgewekt door luchtwervelingen bij een sterke vernauwing hogerop in het mondkeelkanaal. Daar wordt het aanzetstuk dan alleen gevormd door de holte(n) voorbij de plaats van de constrictie. De vorm van het aanzetstuk is sterk variabel en wordt bepaald door beweeglijke delen (tong, kaak, lippen, farynxwand). De vorm heeft ook invloed op de spectrale eigenschappen van het spraaksignaal. 7.3. Klinkers en formanten De 2-buis Bij de bestudering van de relatie tussen de vorm van het aanzetstuk en het akoestisch signaal van klinkers, wordt vaak met het eenvoudige dubbele Helmholtz-resonator model gewerkt. Dit zijn twee met elkaar verbonden resonatoren die de vorm van de mondholte bij de productie van klinkers benaderen. Het smalle verbindingsstuk tussen beide resonatoren correspondeert met de smalle doorgang tussen de tong en het gehemelte. De grootste resonator (V1) is dan de achterholte, en de resonator V2 functioneert als de voorholte. A2 stelt het effect van de lipvorm voor. Als we een geluidsbron (bv. een stemvork) in contact brengen met een enkele resonator (bv. de achterholte), zal de lucht in de resonator al dan niet gaan resoneren. Komt de toon van de geluidsbron overeen met de resonantiefrequentie van de resonator, dan treedt resonantie op. Dit manifesteert zich als een versterkte toon die via A uit de resonator treedt. Resonantie doet zich voor wanneer geluidsgolven die de bron heeft opgewekt, door de wanden van een holte zo worden gereflecteerd/teruggekaatst dat de heengaande en de gereflecteerde golf elkaar versterken. De resonantiefrequentie van een holte is afhankelijk van een aantal vormeigenschappen: - Geluidssnelheid (340 m/s) - Lengte van het tuitje (m) - Oppervlakte van de tuit (m²) - Volume van de holte (m³) We kunnen algemene regels afleiden: - De resonantiefrequentie neemt toe bij een kleiner wordend volume, en neemt af als het volume groter wordt. - De resonantiefrequentie neemt af als de tuitlengte toeneemt (en omgekeerd). - De resonantiefrequentie neemt af als de diameter van de tuit kleiner wordt (en omgekeerd). De gekoppelde resonatoren (voor- en achterholte) zijn verantwoordelijk voor twee resonantiefrequenties: F1 (eerste formant, resonantiefrequentie van de achterbuis V 1)en F2 (tweede formant, resonantiefrequentie van de voorbuis V2). Vier belangrijke factoren hebben effect op deze formantfrequenties: - De plaats van de constrictie: de tong zorgt meestal voor de locatie van de constrictie. Als deze naar achteren gaat, neemt V1 in omvang af en wordt V2 groter. - Mate van constrictie: als de tong een hogere stand inneemt, neemt A1 af en daardoor ook F1. - De doorsnede en de lengte van de voortuit: de lipconstructie zorgt voor deze variatie. Bij getuite lippen neemt L2 toe en F2 af. - Ronding van de voortuit: heeft een verlagend effectzowel op de F1 als op de F2, omdat door de ronding het hele pijpenstelsel wordt verlengd. De klinkerdriehoek representeert de gemiddelde formantfrequenties. Van 2-buis naar 2+1-buis: nasalisering van klinkers Gaten in het spectrum vormen een belangrijke cue bij het onderscheid tussen orale en genasaleerde klinkers. Die genasaleerde klinkers worden gerealiseerd met een open velumstand, waardoor de neusholte als resonator wordt bijgeschakeld. Dit complexe systeem bestaat uit twee buizen met elk een eigen formant: de orale buis en de nasale buis. Hoe opener het velum, hoe meer akoestische koppeling tussen beide buizen. De resonantiefrequenties van de neusholte hebben een dempend effect op de formanten van de orale holte, vooral als de formanten van beide dicht bij elkaar liggen en de akoestische koppeling groot is. De formanten van de neusholte functioneren als antiformanten, die de orale formanten wegdrukken. (foto: links is oraal, rechts is nasaal, F2 is onderdrukt bij de nasale a). 7.4. Medeklinkers Medeklinkers vormen een zeer heterogene groep klanken. Ze kunnen veel moeilijker beschreven worden met enkel F1 en F2 (tong- en lipstand). Aan het begin van een klankreeks onderscheiden we drie klankonderdelen/subfonen: a) Het deel dat correspondeert met de gesloten mond (voice bar). b) De geluidspuls die wordt voortgebracht bij het plotseling opengaan van de mond (de explosie). c) De verandering van het spectrum in de overgang tussen klinker en medeklinker. We maken een onderscheid tussen niet-stationaire (een klank die een in de tijd zeer wisselend karakter heeft) en stationaire klanken (relatief constante verschijningsvorm). Fricatieven De oscillogrammen van [f] en [s] vertonen de onvoorspelbare, niet-periodieke vorm die kenmerkend is voor ruissignalen. Het spectrum verschilt echter in o.a. de concentratie van energie. De ruisbron is afhankelijk van de plaats van de turbulentie. Er is sprake van twee ruisbronnen: de primaire ruisbron (ergens in de mondholte, achter de tanden) en de secundaire ruisbron (luchtstraal treft de tanden, genereert ruis met sterke amplitude). Het spectrum van alle fricatieven wordt dus bepaald door de aard van de turbulentie. Dit hangt af van de lengte van de primaire ruisbron/vernauwing, en de afstand tussen primaire en secundaire (tanden) ruisbron. Naarmate de plaats meer naar achter ligt, ligt ook de primaire ruisbron meer achteraan. Nasalen en lateralen De nasale en laterale medeklinkers hebben gemeenschappelijke kenmerken: - Stemhebbendheid. - Een formantstructuur die lijkt op die van klinkers. - Een relatief geringe amplitude. - Niet gevormd door een simpele 2-buis, maar door middel van een extra holte. Nasalen: de akoestische energie ontsnapt door de neus (en niet via de lippen) en de mondholte functioneert als zijtak van de pijp die een uitgang naar buiten heeft via de neus. Het effect van die zijtak is dat die elementen in het spectrum worden gedempt die overeenkomen met de resonantiefrequenties van de mondholte. De bijschakeling van de neusholte zorgt dus voor antiresonanties: dalen in het spectrum met weinig intensiteit. Lateralen: in de mondholte, tussen de tong en het gehemelte gevormd. Halfklinkers Halfklinkers worden gekleurd door de lipronding. Bij bv. de [w] is er een langere lipronding waardoor de lage frequenties meer intensiteit hebben. 8. Spectrale eigenschappen van niet-stationaire klanken 8.1. Analyse van niet-stationaire klanken Als gevolg van de continue verandering van de vorm van onze spraakorganen, is de spectrale samenstelling van het spraakgeluid geen moment constant of stationair. Veel spraakklanken worden echter als relatief stabiel beschouwd (bv. fricatieven, monoftongale klinkers). In zulke stabiele spraakklanken kunnen we een middenstuk aanwijzen waarin de spectrale samenstelling min of meer constant blijft. Bij de analyse is het voldoende om een spectrum te bepalen op 1 representatief tijdstip, ergens in het midden van de klank. Daarnaast zijn er echter spraakklanken die hun identiteit ontlenen aan een snelle verandering van spectrale samenstelling. Dit zijn niet-stationaire, dynamische klanken (bv. diftongen, profklanken). Diftongen: verglijding van de klinkerarticulatie binnen 1 syllabe. Voor de beschrijving zijn dan minstens 2 spectra nodig: 1 aan het begin van de verglijding en een tweede dat de toestand aan het einde weergeeft. Plofklanken: de mond maakt eerst een sluitingsgebaar dat een snelle spectrale verandering veroorzaakt, dan is er een moment van (bijna)-stilte, waarna er een explosie van ruisgeluid ontstaat, die op haar beurt wordt gevolgd door een snelle spectrale verandering bij de inzet van de volgende klinker. Voor de analyse van dit soort geluiden hebben we behoefte aan een grafische voorstelling die de veranderingen in het spectrum als functie van de tijd weergeeft. Er zijn drie manieren om het verloop van het spectrum weer te geven: de spectrale waterval, het spectrogram en de afbeelding van formantsporen. Spectrale waterval Dit soort spectrum geeft in drie dimensies voor verschillende tijdstippen afzonderlijke spectra weer. Bv. bij [bi] staat (a) voor de stemgeving, (b) voor de explosie en (c) de overgang/transitie in [bi]. Spectrogram Het spectrogram geeft drie dimensies weer: intensiteit (door middel van zwarting: hoe zwarter, hoe intenser), frequentie (0 tot 5 kHz) en tijd (in seconden). Het geeft de intensiteit van elke frequentie op een bepaald moment weer. De blauwe cirkels geven de 5 formanten van de klinker weer. Sonoranten worden weergegeven door regelmatig gespatieerde verticale strepen. Ze hebben 5 donkere, horizontale banden. F0 is de zwarting aan de onderrand, de formanten zijn F1, F2 etc. Als de energie minder geconcentreerd is zijn het fricatieven. De witte stukken zijn spreekopauzes of stemloze plofklanken. Hier zit geen energie/intensiteit. Formantsporen Dit zijn afbeeldingen van automatisch geschatte formantwaarden. Het voordeel is dat de formant niet met grijstinten wordt weergegeven, maar op de verticale as. Dat is dus nauwkeuriger te lezen. Het nadeel is dat de kans op fouten groot is. Daarom kan je best het formantspoor met een spectrogram vergelijken. 8.2. Classificatie In het oscillogram kan men redelijk betrouwbaar de grenzen van brede fonetische klassen bepalen. We kunnen echter niet weten welke klank het is, alleen de wijze van articulatie en de stemgeving. Klankidentificatie is wel mogelijk met een spectrogram met formantwaarden (klinkers), formantovergangen (medeklinkers) en ruisverdeling (medeklinkers). Klinkers Deze klanken worden geclassificeerd aan de hand van hun formantwaarden. Hoewel het spectrum tijdens het verloop van een klinker verandert, proberen we steeds 1 tijdstip te vinden waarop de formanten voor die klinker hun meest karakteristieke waarden aannemen. Er zijn vier criteria om dit meest representatieve tijdstip aan te wijzen: intensiteitsmaximum, F1-maximum, temporeel midden en de positie van de geringste variatie in het formantspoor. Tweeklanken In het Nederlands worden 3 echte tweeklanken onderscheiden: / Tweeklanken bestaan uit twee doelklanken, in de meeste gevallen zien we in een tweeklank alleen maar een verglijding (van beginklank naar eindklank) en geen interval waarin de formanten stabiele waarden hebben. Er zijn nog klanken die uit een sequentie van twee klanken bestaan, maar niet als echte tweeklanken worden gezien. Bv. en Bij deze onechte tweeklanken is te zien hoe de formanten enige tijd stabiel blijven en daarna vrij abrupt verglijden. Bij echte tweeklanken gebeurt die verglijding langzamerhand. Medeklinkers We proberen de klanken nader te classificeren, door gebruik te maken van twee informatiebronnen: het spectrum van een bepaald signaalfragment en het verloop van specifieke kenmerken van dat spectrum in de tijd (namelijk van de formanten). Plofklanken: zijn herkenbaar op basis van formantbuigingen (transities) en spectrale kleuring van de ruisexplosie. Er zijn twee transities mogelijk: een begintransitie (overgang van C naar V) en een eindtransitie (overgang van V naar C). Het traject van de F1 is voor alle CVC-reeksen van uiterst laag naar een hogere waarde voor de klinker en weer omlaag voor de volgende medeklinkers. Dit is voor alle CVC- combinaties dus vrijwel gelijk, er is weinig verschil te zien. F2-transities stellen ons wel in staat om de articulatieplaatsen uit elkaar te houden. Daarbij is wel een groot verschil te zien in het verloop afhankelijk van de articulatieplaats. Zeker zo belangrijk als de transities is de spectrale kleuring van de ruisexplosie. Er zijn 3 fases bij de productie van plofklanken: de stilte/stembandtrilling, de explosie en de overgang naar de volgende klinker. Fase A correspondeert met de obstructie en is moeilijk waar te nemen. Fase B correspondeert met de explosie en wordt bepaald door de resonantie van de voorste holte. De ruiskleuring is afhankelijk van de plaats van vernauwing. Bij [s] is er een hoogfrequente ruis, bij [f] is de ruis meer verdeeld over heel het spectrum. 9. Articulatie en fonetische processen 9.1. Articulatie In eerdere hoofdstukken zagen we hoe spraakklanken worden gerealiseerd en welke akoestische effecten daarbij worden teweeggebracht door de subprocessen initiatie, fonatie en articulatie. We zagen ook dat de akoestische effecten sterk beïnvloed worden door aangrenzende klanken. Spraakklanken worden echter niet alleen beïnvloed door hun onmiddellijke klankomgeving maar ook door andere externe factoren. Spraakklanken worden in een gesprek nooit geïsoleerd uitgesproken. Daardoor ondergaan ze de invloed van de klankcontext en externe factoren (bv. de stand van de articulatoren). Met de stand van de articulatoren wordt bedoeld: de belasting van de articulatoren en de vervorming van het spraakkanaal. Articulatoren compenseren afwijkingen van de gebruikelijke bewegingen. Bv. de globale taak is de sluiting van de lippen. De specifieke uitvoering daarvan kan op verschillende manieren (bv. onderkaak naar boven brengen) en met verschillende gekoppelde articulatoren (bv. actie van de lippen en kaak). 9.2. Coarticulatie Coarticulatie is een proces dat letterlijk betekent: het gezamenlijk articuleren. Klanken vloeien in elkaar over. De standen van de articulatieorganen veranderen niet sprongsgewijs van het ene segment naar het volgende, maar er is sprake van een geleidelijke, vloeiende overgang. Bij dit proces van onderlinge beïnvloeding van segmenten kan een aantal vragen worden gesteld: is de invloed taalspecifiek of eigen aan het spraakmechanisme? Dit is deels universeel en deels taalspecifiek. Hoe meer klinkers in een taal, hoe meer kans op misverstand tussen de klinkers en hoe minder coarticulatie. In welke richting gaat de invloed? Deze vraag is niet eenduidig te beantwoorden. Verschillende modellen worden naar voren geschoven. Bv. het Windowmodel waarbij er een tweezijdige beïnvloeding is tussen klanken. 9.3. Assimilatie Bij assimilatie wordt een spraakklank in minstens 1 distinctieve eigenschap gelijkgemaakt aan een buurklank, zonder dat die buurklank zelf in dat opzicht verandert. Bv. klapdeur. De /p/ verandert hier van stemloos naar stemhebbend, er is 1 distinctief kenmerkt veranderd. Het is daardoor een wezenlijk andere klank, een realisatie van een ander foneem, geworden. Dit is anders dan coarticulatie, waarbij er sporen zijn van de buurklank, maar geen ander foneem. Assimilatie komt enkel voor op de woord- of morfeemgrens, terwijl bij coarticulatie dit ook binnen morfemen/fonemen kan. Assimilatieprocessen delen we in volgens 3 criteria: richting van de beïnvloeding, afstand tussen de assimilerende klanken en de aard van het gewijzigde kenmerk. Beïnvloedingsrichting: enkel de geassimileerde klank wijzigt, de dominante niet. Er is altijd eenzijdige beïnvloeding. Bij anticipatie/regressieve assimilatie wordt de eerste klank beïnvloed, bij de perseveratie/progressieve assimilatie wordt de tweede klank beïnvloed door de eerste. Afstand tussen de assimilerende klanken: contactassimilatie heeft betrekking op onmiddellijk op elkaar volgende klanksegmenten. Bv. feestdag, herfstblad. Bij assimilatie op afstand zijn twee klanken betrokken die niet onmiddellijk op elkaar volgen. Klinkerharmonie is hier een voorbeeld van: een klinker past zich in 1 of meer distinctieve eigenschappen aan een andere klinker aan ondanks de aanwezigheid van een of meer tussenliggende medeklinkers. Aard van het distinctief kenmerk: assimilatieprocessen blijven voornamelijk beperkt tot 1 distinctief kenmerk. O.a. stemhebbendheid, articulatieplaats en nasaliteit. Assimilatie is in principe taalspecifiek (en coarticulatie slechts deels). Wat is de zin en de oorzaak van assimilatie? Het vergemakkelijkt het spreken. Het is namelijk moeilijk om bv. stembanden te doen trillen tussen 2 stemloze obstruenten in, en om te verspringen van articulatieplaats bij medeklinkers. Assimilatie heeft geen invloed op de luisteraar. Woorden blijven herkenbaar omdat slechts 1 kenmerk verandert. Assimilatie en coarticulatie komen samen voor. Verschillen tussen de twee: Assimilatie in het Nederlands is altijd contactassimilatie. We delen de verschijnselen in volgens twee criteria: naar beïnvloedingsrichting van assimilatie en naar het betrokken distinctieve kenmerk. 9.4. Secondaire articulatie Tot nu toe zijn we ervan uitgegaan dat klanken slechts met 1 articulatieplaats worden gerealiseerd. Het is echter ook mogelijk dat de obstructie zich op twee plaatsen in het aanzetstuk voordoet. De obstructie met de kleinste openingsgraad wordt de primaire articulatie genoemd, die met de grotere openingsgraad de secondaire articulatie. Er worden 6 typen secondaire articulatie onderscheiden: labialisatie [bwoot], labiodentalisatie, palatalisatie [wasje], velarisatie [n], faryngalisatie en laryngalisatie. 9.5. Reductie Wanneer de communicatieve omstandigheden geen hoge eisen stellen aan de akoestische definitie van het spraakgeluid, hebben sprekers de neiging om te bezuinigen in aantal en aard van de klanksegmenten. Klanken worden korter, lijken meer op elkaar of verdwijnen etc. Dit heet reductie. Volledig wegvallen van klanken (elisie) treffen we vooral aan bij medeklinkers in clusters. Bv. wist je en /h/ in de onbeklemtoonde syllaben. Ook klinkers kunnen lijden onder reductie. Volle klinkers verliezen wat van hun kleur en komen dichter bij elkaar te zitten. Ze tenderen in de richting van de neutrale klinker sjwa. De sjwa zelf kan volledig verdwijnen, zoals bij d’ ouwe tram. Relatief betekenisloze woorden (zoals eigenlijk en natuurlijk) zijn extreem gevoelig voor reductie. Ze worden sterk gereduceerd door reductieprocessen zoals weglaten van sonoranten op het einde van de lettergreep, verbleken van klinkers tot sjwa of weglaten, enkel produceren van beginmedeklinker, beklemtoonde klinker en slotmedeklinker. Het mechanisme dat hieraan ten grondslag ligt, is goed voorstelbaar. We nemen aan dat er een grondvorm is (canonieke/citatievorm), die alleen bij zorgvuldige uitspraak van losse woorden wordt gerealiseerd. Door bezuiniging in aard en aantal klanken lijken de klanken meer op elkaar, worden ze korter uitgesproken of verdwijnen ze. 9.6. Andere fonetische processen Andere fonetische processen komen zowel diachroon (door de tijd heen) en synchroon (in 1 relatief kort tijdsinterval) voor of als gevolg van een spraakstoornis. Voorbeelden: Debuccalisatie: verplaatsing van de mind naar de glottis. Het omgekeerde verschijnsel, buccalisatie, komt niet vaak voor. Lenitie: veel voorkomen proces, zowel diachroon, synchroon en als resultaat van een spraakstoornis. Het is een overkoepelende term voor processen als voicing, debuccalisatie en degeminatie. Voicing is het stemhebbend maken van stemloze medeklinkers, spirantisatie is de plofklank vervangen door een fricatief, en degeminatie is het verkorten van een dubbele medeklinker. Dit laatste is het tegenovergestelde van geminatie. Initial articulatory strenghtening: de beginmedeklinker is langer dan de eindmedeklinker. Bv. die pin vs. diep in. 10. Waarneming van spraak 10.1. Inleiding Spraakwaarneming is geluidswaarneming. De waarneming van spraak verloopt vooral via het gehoor. Akoestisch gezien is spraak, en geluid in het algemeen, niets anders dan kleine, snel op elkaar volgende, verstoringen van de luchtdruk. Zulke trillingen worden in ons oor omgezet in zenuwimpulsen, die onze hersenen vertellen dat er geluid klinkt. De waarneming gebeurt soms ook door visuele cues: dit is het McGurk Effect, een auditieve illusie. 10.2. Gevoeligheid van het gehoor Welke veranderingen in het fysisch signaal leiden tot welke verandering in gehoorsindruk? Dit is het gebied van de psychofysica en de psychoakoestiek. Er is echter geen een-op-eenrelatie tussen de eigenschappen in de drie domeinen. Zo is de waargenomen luidheid van een klank niet alleen afhankelijk van de intensiteit en spectrale helling, maar ook van de grondfrequentie, en zelfs van de tijdsduur. Hoorbaarheid van verschillen Het kleinst mogelijk toch hoorbaar verschil heet een verschildrempel/just noticeable difference. Dit JND wordt gedefinieerd als het kleinste verschil tussen twee paarsgewijs aangeboden geluiden op grond waarvan 75% van de luisteraars kan horen dat de twee geluiden niet identiek zijn. Grondfrequentie: om te kunnen horen dat er een toonhoogteverschil bestaat tussen twee spraakklanken, moet het verschil in grondfrequentie minstens 0,3 tot 2,5% bedragen. Intensiteit: het verschil moet minstens 1 dB zijn om gehoord te worden. Duur: er moet een duurverschil zijn van minstens 10%. Formantfrequentie: om te horen dat twee klinkers verschillen in timbre moet de frequentie van de F 1 minstens 14 Hz verschillen of die van de F2 minstens 1,5%. 10.3. Maskeringsverschijnselen De aanbieding van een toon maakt het oor ongevoelig voor naburige frequenties. We zeggen dan dat de ene toon de andere maskeert. Bij gelijktijdige maskering maakt een toon een andere toon die simultaan in het geluid aanwezig is, minder hoorbaar. Een lage toon maskeert een hogere toon sterker dan omgekeerd, en hoe meer de geluiden op elkaar lijken, hoe groter het maskeringseffect. Bij ongelijktijdige maskering beïnvloedt een eerdere klank de waarneembaarheid van de volgende klank of vice versa. Het gehoor kan korte tijd uitgeschakeld worden door krachtig geluid. Dit heet voorwaartse maskering/namaskering. Hoe meer geluiden op elkaar lijken, hoe krachtiger het effect. De duur van ongevoeligheid duurt ongeveer 200 ms. De voorwaartse maskering is een effectief wapen tegen galm/echo. 10.4. Waaraan herkennen we de diverse spraakklanken? Verschillen tussen klinker en medeklinker Klankkleur: klinkers hebben duidelijke formanten. Er zijn ook sonorante medeklinkers die een goed gemarkeerde formantstructuur hebben (/w/, /j/, /l/, /r/, /n/, /m/,…): daarbij moeten we dan rekening houden met andere kenmerken. Geluidssterkte < intensiteit: klinkers zijn luider dan medeklinkers. Toonhoogte < stemhebbend: stemhebbende klanken hebben een duidelijke toonhoogte. Toch zijn ook gefluisterde klanken te herkennen. Verschillen tussen klinkers Frequenties: tweeklanken herkennen we door een relatief langzame verandering van de richting van de formantfrequentie. Duur: er zijn korte en lange klinkers. Duur en frequentie worden tegelijk beoordeeld. Daardoor kan een zeer kort uitgesproken [a] toch als [] worden waargenomen en vice versa. Verschillen tussen medeklinkers Obstruenten (fricatieven en plosieven): bij de articulatie is er sprake van vernauwing of obstructie. Er wordt dan stilte en/of ruis waargenomen. In beide gevallen ontbreekt de formantstructuur die kenmerkend is voor klinkers. Blij plofklanken veroorzaakt de obstructie stilte. Als de explosie komt, veroorzaakt dat duidelijk waarneembare ruis die ongeveer 10 ms duurt. Deze klank is gekleurd (F2) op basis van de plaats van obstructie, en de ruis stimuleert verschillende delen van het basilair membraan afhankelijk van de plaats van obstructie. De formantstijging of –daling is hoorbaar, en ontstaat door beweging naar klinkerstand. De duur van de beweging van medeklinker naar klinker bedraagt 30 tot 100 ms. Vooral F2 verraadt de plaats van obstructie. Het verschil tussen stemhebbende en stemloze plofklanken wordt niet gehoord op basis van de toonhoogte/stembandtrilling, maar wel door de duur van de stilte. Bij stemloze plofklanken duurt dit langer dan bij stemhebbende. Dit wordt ook gehoord door de duur en intensiteit van de ruis (dus van de explosie) en de snelheid van formantverandering voor en na de stilte. Bij stemloze plofklanken gaat dat sneller. Het grootste verschil tussen plofklanken en fricatieven is dat het formantloze interval bij wrijfklanken wordt opgevuld met ruis. Er is ook geen duidelijke formantstructuur. De ruis is vergelijkbaar met die van stemloze plofklanken op het einde van de stilte, maar de ruis van de fricatieven duurt langer en de inzet is geleidelijker. Het onderscheid tussen stemhebbend en stemloos wordt niet gemaakt op basis van toonhoogte, maar op basis van duur en intensiteit van de ruis. Die is groter bij stemloze fricatieven. Sonoranten: bezitten wel zo’n formantstructuur, maar hun intensiteit is zwakker dan die van klinkers. Bij nasalen blijft tijdens de afsluiting in het mond-keelkanaal de doorgang naar de neusholte open, waardoor in het frequentiegebied tot 1000 Hz nog vrij veel intensiteit hoorbaar blijft. De nasalen /m/, /n/, en /õ/ hebben ongeveer hetzelfde neusgeluid, maar verschillen door de kleuring voor en na de mondsluiting (F2). De halfklinkers /w/ en /j/ hebben dezelfde formantstructuur als de echte klinkers /u/ en /i/, maar de medeklinkervarianten hebben een geringere intensiteit. Zij worden ook gekenmerkt door relatief trage formantveranderingen kort voor en kort na de vernauwing. De liquidae /l/ en /r/ lijken sterk op elkaar. Ze hebben beide een duidelijke formantstructuur, een geringere intensiteit dan echte klinkers (voornamelijk in de hogere formanten) en de formantveranderingen van liquidae naar klinkers en terug zijn duidelijk. Bij de /l/ lopen de F2 en de F3 tijdens de afsluiting vrij sterk uiteen om bij de overgang naar de volgende klinker weer naar elkaar toe te bewegen. De /r/ herkennen we vooral aan een verlaging van de F3. De /h/ lijkt sterk op de klinkers waaraan hij wordt vastgesproken, met vrijwel dezelfde formantstructuur, maar met geringere intensiteit. Het verschil tussen gefluisterde klinkers en /h/ is niet spectraal zichtbaar, maar er is wel een abrupte inzet bij de klinker. 10.5. De rol van de gesproken context De context helpt bij klankidentificatie. Er zijn drie soorten contextinformatie: Spectrale normering: de identificatie van losse klanken is makkelijker als vooraf een korte kennismakingszin wordt aangeboden. Temporele normering: de identificatie van lange en korte klanken in relatie tot de duur van de klanken die volgen op de te identificeren klank. Coarticulatie: individuele klinker zijn minder goed te identificeren dan de klinker in een CVC-structuur. Klanktransities geven meer informatie dan het spectraal midden van de klank. 10.6. Is spraak bijzonder? Spraakgeluiden worden op een andere manier verwerkt dan niet-spraakgeluiden. Hier bespreken we enige evidentie voor dit standpunt. Rechteroorvoordeel Spraakgeluiden worden sneller herkend als ze worden aangeboden via het rechteroor. Nietspraakgeluiden worden echter sneller herkend via het linkeroor. Dit komt omdat het rechteroor in verbinding staat met de linker hersenhelft. Categoriale waarneming In een identificatietaak moeten luisteraars bepalen of ze /ba/ of /da/ horen. Er worden 8 verschillende klanken aangeboden: de eerste is /ba/ en de laatste /da/. Daartussen gaan de klanken geleidelijk aan met discrete verschillen meer naar /da/ en minder naar /ba/. In een discriminatietaak worden paren gemaakt van steeds twee minimaal verschillende lettergrepen. Luisteraars moeten zeggen of ze wel of geen verschil kunnen horen tussen de lettergrepen van elk paar. Het blijkt dat luisteraars alleen goed kunnen horen dat die lettergrepen van elkaar verschillen als die eerder waren ingedeeld in verschillende categorieën /ba/ en /da/. Paren ingedeeld in dezelfde categorie zijn dus niet te onderscheiden. Andere modellen Cue trading: de kleur en de duur van de klinker bepalen het verschil tussen lang en kort. De kleur kan compenseren voor de duur (een kort uitgesproken klinker kan toch lang lijken door verandering van klankkleur). Motortheory/speech perception: waargenomen klanken worden geïdentificeerd op basis van articulatorische eigenschappen. 11. Herkenning van gesproken woorden (spraakketen: verstaan) 11.1. Inleiding: herkennen in het algemeen Verstaan is het herkennen van taaleenheden in het spraakgeluid in hun volgorde. Een morfeem is het kleinste teken in onze taal met vorm en betekenis. Het is cruciaal voor de interpretatie van spraak. Een zin is een aaneenschakeling van woorden/morfemen. We staan kort stil bij de principes van herkenning. We kunnen alleen objecten herkennen die we kennen. Woordherkenning impliceert dat het woord in het mentale lexicon zit. Herkennen kan op basis van partiële informatie, niet alle informatie moet er zijn om een woord te herkennen. De context helpt/stuurt de herkenning. 11.2. Modellen voor woordherkenning De gemiddelde spreker van het Nederlands kent 50000 woorden, dit betekent dat hij die woorden passief herkent. De gemiddelde spreekduur van een woord is ongeveer 500 ms. Woordherkenning is dus vliegensvlug een woord selecteren uit de woordenschat. Geschreven woorden worden herkend door spaties, aanbieding van het volledige woord en de mogelijkheid tot terugkijken. Gesproken woorden lopen in elkaar over (assimilatie & coarticulatie) bv. I scream of ice cream? Het woord wordt sequentieel aangeboden. Het is een vluchtige presentatie, want 1 syllabe duurt ongeveer 250 ms. Geluid van een kwartseconde blijft even in het auditief geheugen. Om al deze redenen moet woordherkenning eigenlijk starten voordat het woord volledig is uitgesproken. We maken modellen om een idee te kunnen vormen over hoe iets werkt. We kennen de input (geluid dat oor binnenkomt) en de output (reproductie van klank) van het herkenningssysteem, en met deze psycholinguïstische modellen proberen we aan te geven hoe de relatie tussen deze twee ligt. Het logogenmodel De hersenen bevatten herkenningseenheden (logogenen). Elk logogen herkent 1 specifiek woord, dus de mens bevat ongeveer 50000 logogenen. Elk binnenkomend woord wordt tegelijkertijd aan elk logogen voorgelegd. Daarom behoort dit model tot de klasse van parallelle verwerkende systemen. Een logogen bevat interne specificatie van de woordvorm (fonemen, grafemen, braille,…) en semantische en syntactische kenmerken (woordsoort, betekenis,…). Elk logogen bevat ook een graadmeter die op ieder moment aangeeft wat het activatieniveau van het logogen is. Als er spraakgeluid binnenkomt, dan lopen de niveaus op van alle herkenningseenheden die in het geluid iets horen dat past bij hun interne specificatie. Als we het begin van het woord kat horen, dan zal voor alle logogenen die als eerste klank een [k] hebben, het activatieniveau oplopen, niet alleen dat van kat. Bij het voortschrijden van het woord daalt het activatieniveau van de logogenen die niet passen. Het logogenmodel bevat ook een vuurdrempel. Als het activatieniveau van het logogen meer dan deze kritische waarde uitstijgt boven dat van zijn naaste concurrenten, vuurt het logogen. Op dat moment wordt het woord dat in het logogen gespecifieerd is, herkend en komt alle informatie die in het logogen ligt opgeslagen, beschikbaar. Als een logogen vuurt, dan dalen de actieniveaus van alle concurrenten onmiddellijk naar hun rustpositie. Het actieniveau van het gevuurde logogen daalt ook, maar veel langzamer. Op die manier krijgen woorden die nog maar kort geleden gehoord zijn, een voorsprong op de andere woorden. Woorden die we in ons leven vaak of maar net gehoord hebben, de hoogfrequente woorden, hebben een voorsprong op laagfrequente woorden. Ze worden dus sneller herkend. Elk logogen ontvangt informatie van 2 kanten. We onderscheiden 2 informatiestromen: bottom-up informatie (zintuiglijke informatie, het spraakgeluid zelf) en top-down informatie (kennis van taal en de wereld). Beide informatiestromen beïnvloeden het activatieniveau van de logogenen. Het logogenmodel laat ons ten slotte begrijpen hoe we ook langere woorden succesvol kunnen herkennen, ook al moeten de laatste klanken nog binnenkomen en zijn de beginklanken al uit ons auditief geheugen vervaagd. De spraakklanken dragen niet rechtstreeks bij tot de herkenning van woorden, zij verhogen slechts de activatie van een aantal herkenningseenheden. Daarna hebben ze hun werk gedaan en kunnen ze probleemloos vergeten worden. Het model sluit niet uit dat woorden ook herkend kunnen worden op basis van fragmentarische informatie. Een voor de hand liggend woord kan al aan zijn drempel komen als pas 1 of 2 klanken van dat woord zijn gehoord. Er zijn echter ook nadelen aan het logogenmodel: het model is tamelijk onspecifiek. Het vertelt ons niet precies op welk punt in de tijd, na het horen van hoeveel spraakgeluid, de luisteraar het woord zal herkennen. Het is ook inefficiënt. De logogenen reageren alleen op passende, positieve informatie, waardoor de activatieniveaus alleen maar kunnen stijgen en zolang er niet gevuurd is, nooit kunnen dalen. Het cohortmodel Woordherkenning verloopt hier in 3 fasen. Prelexicale activatiefase: in deze fase worden alle woorden geactiveerd. Het begincohort wordt geactiveerd. Alle woorden waarvan de beginklanken overeenkomen met het in de eerste 200 ms gehoord spraakgeluid, worden actief. Alle andere woorden gaan terug in de ruststand. Het begincohort wordt geactiveerd op basis van positieve (passende) informatie en zintuiglijke informatie (bottom-up). Lexicale selectiefase: bij meer binnenkomende informatie worden inadequate cohorten stelselmatig geïnactiveerd. Dit werkt op basis van negatieve (niet-passende) informatie. Indien er geen concurrenten zijn, wordt het woord provisorisch herkend. Postlexicale verificatie- en integratiefase: in deze fase wordt nagegaan of het voorlopig herkende woord de correcte oplossing is. Dit werkt op basis van semantische en syntactische context (top-down). Bij fouten moet het systeem herstel doorvoeren. Het uniekheidspunt (UP) is het vroegste punt waarop een woord herkent wordt. Dit punt ligt vaak voor het einde van het woord, waardoor het woord al herkend is voor het beëindigd is. Vooral bij langere woorden gebeurt dit, ze zijn makkelijker te herkennen dan korte. Ze bevatten een grotere lexicale redundantie. Het aangepaste cohortmodel Het oorspronkelijke model had 2 problemen: enerzijds dat het faalt als het eerste foneem onduidelijk is. Na de aanpassing konden kandidaten ook later worden toegevoegd. De activatie was niet meer alles of niets, maar gradueel. Het eerste model kon ook de frequentie-effecten niet verklaren. Daarom is in het aangepaste model deactivatie moeilijker voor hoogfrequente dan voor laagfrequente woorden. Het Neighborhood Activation Model Woordherkenning is het product van twee informatiestromen: stimulusinformatie (bottom-up) en de structuur van het mentale lexicon (top-down). Dit model is enkel gericht op herkenning van losse, monosyllabische woorden. Naburige woorden in het mentale lexicon worden sneller verward. Het lexicon is opgebouwd uit neighborhoods/buurten. Dit is de groep van woorden in het mentale lexicon die op een bepaald punt in het herkenningsproces concurrenten zijn van het stimuluswoord. Woorden binnen 1 neighborhood zijn in hoge mate met elkaar verwarbaar, omdat ze sterk op elkaar lijken. Een neighborhood bestaat uit alle woorden in het lexicon die in 1 enkele klank verschillen van het stimuluswoord. Een verschil kan bestaan uit een klankinsertie (toevoeging), -deletie (weglating) of – substitutie (vervanging). Korte stimuluswoorden hebben veel meer buren, dus een grotere neighborhood. Hoeveel buren een woord heeft, valt op voorhand echter niet te zeggen. Dat hangt mede af van de geluidskwaliteit van de stimulus en de luisteromstandigheden. Het NAM stelt dat de woordherkenning meer tijd en moeite kost naarmate er meer en aantrekkelijker alternatieven in de race zijn. De aantrekkelijkheid wordt bepaald door de mate van gelijkheid en door de gebruiksfrequentie. Het Trace-model Dit model is gebaseerd op het idee van een neutraal netwerk. Dit is een computersimulatie van architectuur van het menselijke centrale zenuwstelsel. Zo’n neutraal netwerk bevat rijen cellen op drie niveaus en associatiebanen (verbindingen tussen de cellen). Voor ieder distinctief kenmerk is er een gespecialiseerde kenmerkdetector, fonemen worden geactiveerd bij een geheel van distinctive features (dus bij een foneem), en dan zijn er nog woorden. De information flow bestaat uit top-down en bottomup informatie, en binnen de lagen is er laterale inhibitie (de activatie van een herkenningscel leidt tot onderdrukking of blokkering van een concurrerende herkenningscel die ernaast ligt). 11.3. Woordherkenningstaken Modellen moeten getoetst kunnen worden. Het bewijs voor deze modellen wordt gezocht in herkenningstaken. We proberen vragen te beantwoorden: wanneer wordt een woord herkend en hoe zien we het verschil tussen moeilijke en makkelijke herkenning? Er zijn enkele experimentele technieken die in de praktijk van het onderzoek bij dit type vragen gebruikt worden. Daarbij maken we een onderscheid tussen off-line en on-line herkenningstaken. Bij off-line taken krijgt de proefpersoon gelegenheid na te denken over wat hij gehoord heeft. Zijn taak is dan op te schrijven of te zeggen welk woord hij denkt gehoord te hebben. We kunnen zo vaststellen wat een proefpersoon denkt gehoord te hebben en of de herkenning juist of fout is, maar niet wanneer er iets herkend is. Bij on-line herkenningstaken zijn we niet alleen geïnteresseerd in de uitkomst van het herkenningsproces, maar vooral in de voortgang van het proces. We vragen de proefpersoon beslissingen te nemen over wat hij hoort, zonder dat we hem expliciet vragen welk woord hij herkend heeft. Hij kan alleen antwoorden op het moment dat hij een woord herkent heeft. Zo komen we op een indirecte manier achter het herkenningsmoment. Lexicale decisie Bij deze taak hoort de proefpersoon klankreeksen die soms wel en soms niet bestaande woorden in zijn taal vormen. Hij heeft twee drukknoppen voor zich, en moet zo snel mogelijk op de ene knop drukken als de klankreeks een bestaand woord vormt, en zo snel mogelijk op de andere als het geen woord is. Er wordt een tijdmeting gestart, die stopt zodra de proefpersoon op een van de knoppen drukt. De proefpersoon kan pas weten of de klankreeks een bestaand woord is, als hij dat woord herkend heeft. Hoe sneller de proefpersoon correct beslist, des te gemakkelijker werd dat woord dus herkend. Zo wordt dus vastgesteld dat de beslissingstijden op hoogfrequente woorden korter zijn dan die op laagfrequente woorden. Deze taak biedt evidentie voor het frequentie-effect en het neighborhood-effect. Detectie-/monitortaken De proefpersoon krijgt de opdracht om zo snel mogelijk op een knop te drukken als hij een bepaalde vooraf gespecifieerde klank hoort. Proefpersonen zijn pas bereid op te knop te drukken als zij het woord waarin de doelklank zit, in zijn geheel herkend hebben. Proefpersonen horen echte woorden en nonsenswoorden. We zien bij echte woorden dat het langer duurt voor ze afdrukken als de doelklank aan het einde van het woord zit. Bij nonsenswoorden maakt dat geen verschil. Op deze manier heeft men kunnen vaststellen dat het herkenningsmoment van woorden niet valt aan het einde van de klankreeks, maar op het punt binnen de klankreeks waar het woord voor het eerst uniek onderscheiden is van de rest van het lexicon (het UP), en dat het herkenningspunt verder naar voren schuift naarmate een woord voorspelbaarder is gegeven zijn voorafgaande context. Cross-modal priming Wanneer een woordherkenningseenheid (logogen) W verhoogd actief is, worden ook alle herkenningseenheden van woorden die met W verwant zijn, verhoogd actief. Dit wordt spreiding van activatie genoemd. Bij het horen van bv. kapitein worden ook schip en anker actief. Omdat een herkend woord nog lang nadat het gevuurd heeft, verhoogd actief blijft, kunnen de meegeactiveerde woorden zo gemakkelijk herkend worden als ze in het latere zinsverband inderdaad ter sprake komen. Dit wordt priming genoemd. In de vroege fasen van het herkenningsproces zijn echter meerdere herkenningskandidaten tegelijkertijd actief. Stel, je hoort . Via spreiding van activatie zijn niet alleen woorden die verwant zijn met kapitein verhoogd actief, maar ook de woorden die verwant zijn met andere nog mogelijke herkenningskandidaten, zoals bank en geld wegens kapitaal. Als de volgende klank binnenkomt, dooft de activatie van de andere actieve concurrenten uit. We voorspellen dus dat het woord geld gemakkelijker herkend wordt voordat de // gehoord is, dan daarna. Deze stelling kunnen we toetsen door een proefpersoon 2 dingen tegelijk te laten doen. Hij voert een visuele lexicale decisietaak uit, terwijl hij luistert naar spraak. Hij zal sneller beslissen dat geld een correct woord is als hij op dat moment de nog niet gehoord heeft. Een fractie van een seconde later, als kapitaal niet meer actief is, is het priming effect voor geld verdwenen. Informatie uit de auditieve modus wordt hier gebruikt om een taak in de visuele modus beter uit te voeren. Daarom wordt hier gesproken van een crossmodale techniek. Zo kunnen we nagaan welke woorden in de diverse fasen van het herkenningsproces als herkenningskandidaten door de luisteraar overwogen worden. Woordaanvultaak (gating) Een proefpersoon hoort een klein stukje van een woord, en moet dan raden van welk woord hij een stukje heeft gehoord. De eerste keer lukt dat bijna nooit. Daarna krijgt de luisteraar een wat groter stukje van hetzelfde woord, en mag hij nog eens proberen. Dit wordt herhaald tot de proefpersoon het woord herkent. De luisteraar kan het hele woord al aanvullen als hij slechts de geluidsinformatie tot aan het UP gehoord heeft. Eyetracking Het registreren van oogbewegingen is een interessant alternatief voor op een knop drukken (wat men in het echte leven bijna nooit doet). De proefpersoon luistert naar spraak en kijkt tegelijkertijd naar een beeldscherm. Op het scherm ziet hij plaatjes van bv. vier voorwerpen. Drie van de voorwerpen hebben als woord gedeeltelijk overlappende klankreeksen, bv. bank, bal en bas. Bank is het doelwoord, bal is een hoogfrequente afleider en bas een laagfrequente. Het vierde woord is ongerelateerd, bv. tijger. De proefpersoon moet zo snel mogelijk, zonder fouten te maken, het plaatje aanwijzen waarvan hij de naam hoort: bank. De plaatjes worden zichtbaar op het moment dat de beginklank van het gesproken woord hoorbaar is. De proefpersoon richt zijn blik niet op de ongerelateerde afleider, en kijkt meer naar de hoogfrequente afleider dan naar de laagfrequente. Zijn ogen verspringen zodra het klankverschil hem in staat stelt tot beslissen.