taalwetenschappen

advertisement
TAALWETENSCHAPPEN
1. Wat is fonetiek?
1.1. Inleiding
Onderscheid tussen taal (systeem van conventionele tekens, waarmee de gebruikers van de taal ideeën
kunnen communiceren. Het is iets abstracts dat gebruik maakt van een set van regels. Het is niet
waarneembaar. Als je problemen hebt met dat regelsysteem in je hoofd, dan heb je een taalstoornis. De
spraak functioneert nog, maar taal niet meer) en spraak (waarneembaar als een geheel van klanken, een
klankreeks aan elkaar gekoppeld. De vertaling van de taal). De behandeling van spraakstoornissen is
volledig anders.
'Fonetiek bestudeert de waarneembare manifestatie (verschijnsel) van menselijke taal (spraak) in relatie
tot de verborgen structuur van het abstracte taalsysteem (de taal)'
1.2. De binnen- en buitenkant van taal
Een taalteken is een waarneembare vorm met een niet-waarneembare betekenis, deze twee aspecten
zijn met elkaar verbonden. Bv. koe = melk producerend herkauwend zoogdier. De koppeling van de vorm
aan de betekenis is conventioneel, willekeurig, en één en dezelfde vorm kan in één taal volkomen
verschillende betekenissen hebben. Bv. bijenwas, bonte was, hij was,...
Fonetiek is de specialisatie binnen de taalwetenschap die zich bezighoudt met de uiterlijk waarneembare
kant van de taaltekens.
'Een referent is een menselijk, levend, niet-levend of zelfs abstract object in de buitentalige werkelijkheid
waarnaar wordt verwezen met één of meerdere betekenisdragende woorddelen.' Bv. 'De man verft de
stoel' heeft twee referenten: een menselijk individu 'man' en een onbezield object 'stoel'. De relatie
tussen die twee wordt uitgedrukt door 'verft'.
Objecten worden met behulp van woorden geclassificeerd. Bv. toon een foto van een stoel, en een
spreker van het Nederlands zal meteen weten dat het voorwerp een stoel is. Nochtans hebben niet alle
stoelen dezelfde kenmerken (4 poten, armleuningen,...) en soms twijfelen we ook of iets wel echt een
stoel is. Het lexicon van kenmerken is niet voor iedereen hetzelfde. De verzameling van eigenschappen
op grond waarvan de taalgebruiker beslist of iets een stoel is, noemen we de (lexicale) betekenis van het
woord 'stoel'. Dit is taal, en wordt bestudeerd in de linguïstiek/taalkunde.
1.3. Wat is taal?
Taal is een communicatiemiddel, een abstract coderingssysteem. Een taal is een specifieke manifestatie
van dat coderingssysteem, en leeft, verandert of verdwijnt. Het gaat over menselijke natuurlijke taal
(MNT), dus geen dierlijke communicatie of kunstmatige taal. MNT komt op natuurlijke wijze tot stand,
evolueert nog steeds, multi-interpretabel.
Taal is een systeem van taaltekens. Men koppelt een klankreeks aan iets dat op zich niet waarneembaar
is. Bv. 'vis', het beeld van die vis is alleen waarneembaar voor de persoon zelf, dus anderen kunnen niet
zien dat die persoon aan die vis denkt.
Kenmerken van de MNT:

Arbitrair/willekeurig
Koppelen van de niet-waarneembare betekenis en de waarneembare vorm, dit is willekeurig, en de
klankreeks is anders in verschillende talen
Uitzonderingen: onomatopeeën hebben een (gedeeltelijk) gemotiveerd verband tussen vorm en
betekenis, bv. sommige vogelnamen (koekoek)

Conventioneel (verbonden aan afspraken)
Ingeburgerde woorden verandert men niet zomaar van betekenis. Als de context in het Nederlands is,
volgt men de Nederlandse uitspraken.
Taal behoort niet toe tot één individu, en betekenissen kunnen niet zomaar gewijzigd worden (zie
fragment Alice in Wonderland)

Productiviteit
Het aantal woorden/zinnen dat gevormd en begrepen kan worden is theoretisch oneindig (Chomsky).
Met een beperkt aantal elementen en een beperkt aantal regels, zijn er oneindig aantal mogelijkheden.
Nieuwe producties van woorden zijn niet geheel vrij (rule-governed creativity)
Kinderen worden geboren met het vermogen tot taalleren (LAD = Language Acquisition Device,
algemene cognitieve vaardigheden)

Dubbele geleedheid
Ons taalsysteem kent twee niveaus
Lager niveau: fonemisch. Fonemen zijn de kleinste betekenisonderscheidende elementen, ze hebben
geen betekenis op dit niveau. Bv. foneem k. Het is een combinatie van klanken die leidt tot
betekenisvolle gehelen, en een eindig aantal klanken wordt een oneindig aantal combinaties. Je kan
echter niet zomaar alles combineren met alles, mensen die dit wel doen hebben een fonologische
stoornis.
Hoger niveau: morfemisch. Morfemen (kleinste woorden die niet meer zijn op te delen in kleinere stukjes
met een zelfstandige betekenis) hebben wel een betekenis, als ze zelfstandig kunnen staan zijn het vrije
morfemen. Bv. hand-je (eerste is een vrij morfeem, andere niet)

Discrete karakter
Fonemen zijn strikt van elkaar te scheiden, hoewel ze in de gesproken taal vloeiend in elkaar overgaan.
Bv. 'lat' heeft 3 fonemen, maar klinkt als 1 klank. We zeggen niet l a t, dus de klanken zijn niet
afgebakend maar continue. En toch kunnen we er elke keer de klanken uithalen.
Bij onduidelijke uitspraak creëert de luisteraar geen nieuwe betekenis. Bv. mijn loat ligt in uw handen -->
lat of lot, loat bestaat niet.
Taalwetenschap is de beschrijving van taal op verschillende niveaus:





Fonemen (mat ≠ kat)
Morfemen (hand-en, hand-je, hand-druk)
Woorden (handdruk)
Zinnen (syntaxis)
Tekst
Het onderwerp is taal bij taalwetenschap, taalkunde, linguïstiek. De taak van een linguïst is het verborgen
taalsysteem zichtbaar maken, in kaart brengen. Descriptief = beschrijven van fenomenen, prescriptief
schrijft voor, vertelt ons hoe de taal gebruikt moet worden.
Subdisciplines:






Fonetiek: studie van klanken op concreet niveau
Fonologie: klanken als abstracte entiteit, fonemen
Morfologie: studie van morfemen
Syntaxis/zinsleer: combinatie van morfemen tot grotere gehelen, zinsdelen/zinnen.
Semantiek/betekenisleer: studie van de betekenissen van woorden
Pragmatiek: gebruik van de taal (bv. ASS, geen abstractie kunnen maken bij een figuurlijke
betekenis)
Taalwetenschap is de studie van een geïsoleerd tekensysteem, los van gebruiker en maatschappij. Ruime
betekenis: studie van taal in relatie tot andere fenomenen (bv. vergelijkingen tussen talen,
ontwikkelingsgeschiedenis van taal etc.). Er zijn diverse studiedomeinen/subdomeinen in de linguïstiek:



Sociolinguïstiek: hoe gebruikt men taal in sociale omstandigheden (bv. verschillende registers in
verschillende situaties)
Psycholinguïstiek: wat maakt de taal mogelijk, welke mentale processen komen daarbij kijken
Neurolinguïstiek: studie van samenhang tussen het centraal zenuwstelsel (CZS) en taal
1.4. Wat is fonetiek?
Taken van de fonetiek, met welke vragen houdt de fonetiek zich bezig:

De primaire taak van de fonetiek is om aan te geven wat de verzameling is van alle mogelijke
vormen van taaltekens.
Het is een algemene eigenschap van menselijke taalbouwsels dat ze hiërarchisch gestructureerd zijn:
klinkers & medeklinkers  syllaben  woorden/klankvormen. Er moet rekening gehouden worden met
het sonoriteitsbeginsel.

Verklaringen geven voor de bouwprincipes van de taaltekens
Waarom zijn lettergrepen gestructureerd volgens het sonoriteitsbeginsel etc.

Bestuderen van de functionele eigenschappen van de klankvorm van taal
Taalstructuren zijn niet toevallig, maar zijn geëvolueerd om de communicatie optimaal efficiënt te laten
verlopen: de structuren zijn gemakkelijk te produceren, te leren en te herkennen.

Kortom: duidelijk maken wat de relatie is tussen de abstracte structuur van taal (bouwsels) en de
manifestatie van deze structuren in fysiek waarneembare vormen zoals spraakgeluid.
Domein van de fonetiek: spraak is niet hetzelfde als taal, klank is niet hetzelfde als een taalteken.
1.5. Het proces van spreken en verstaan
Spraakketen (hoe meer naar boven, hoe centraler. Meer naar beneden = perifeer):
1. Bedoelen = gedachten, concepten
2. Formuleren = a.d.h.v. taaleenheden, zoals
morfemen, woorden, zinsstructuren -->
opgeslagen in het brein
3. Spreken = articulatorische fonetiek, bouw en
werking van anatomische en fysiologische
structuren en vorming van klinkers en
medeklinkers
1 – 3: productie van de spraak.
4. Spraakgeluid/signaal = akoestische fonetiek, verstoringen door luchtdruk, spreken door beweging
spraakorganen, opgevangen door het gehoor. Het is een fysisch verschijnsel, dus meetbaar.
5. Horen = auditieve fonetiek, luchtdrukverstoringen opvangen
6. Verstaan = in de geluidsstroom woorden herkennen
7. Begrijpen = hoorder achterhaalt gedachtenconcepten van de spreker
5 – 7: perceptie van spraak.
Mentale taalstructuur (bedoelen en begrijpen):



Centraal: in de geest van de taalgebruiker
Niet-waarneembaar
Studiedomein van taalpsychologie - cognitieve psychologie
Fysiek spraakgeluid (spreken en horen):



Perifeer: aan de buitenkant van het menselijk lichaam
Waarneembaar door buitenstaanders
Studiedomein van fonetiek
1.6. Voorwaarden voor communicatie
Er moet tegelijkertijd aan deze twee voorwaarden worden voldaan:


Geen van de deelprocessen gestoord
Spreker en hoorder hebben toegang tot hetzelfde transmissiekanaal en dezelfde taalcode.
1.7. Het spraakgeluid

Segmentele eigenschappen van spraakgeluid:
Segmenten = geheel van klinkers en medeklinkers (tweeklanken worden vaak genoemd onder klinkers).
De eigenschappen van deze segmenten zijn segmentele eigenschappen. Het verschil tussen klinkers is
een segmenteel verschil, zoals ook het feit dat de stembanden bij de klank /b/ eerder gaan trillen dan bij
een /p/.
Co-articulatie (articulatie van een klank kan worden beïnvloed door de klanken die eraan vooraf gaan of
er op volgen) bv. 'a' klinkt anders als er een l achter komt of als er een p achter komt.
Assimilatie (gehele of gedeeltelijke gelijkwording van een medeklinker aan een andere medeklinker) bv.
vaatdoek

Prosodische eigenschappen:
Alle eigenschappen in het spraakgeluid die niet zonder meer zijn af te leiden uit de opeenvolging van
klinkers en medeklinkers. Bv. weten waar de klemtoon van de zin ligt, dit weten we door prosodie:
zinsmelodie en ritmiek. Deze eigenschappen bepalen soms mee de betekenis.
1.8. Fonetiek en spraaktechnologie
Fonetiek is een experimentele wetenschap. Dit betekent dat de foneticus ideeën toetst met behulp van
experimenten. In een experiment beheerst de onderzoeker de werkelijkheid. Hij creëert een kunstmatige
situatie waarin hij alle verschijnselen onder directe controle heeft, invloeden van buitenaf worden zo
veel mogelijk geweerd. In zo’n experiment probeert de onderzoeker een causaal verband te vinden
tussen verschillende verschijnselen. Bv. akoestische intensiteit (luidheid) van beklemtoonde klinker >
onbeklemtoonde klinker? --> wordt getest door dezelfde spreker binnen dezelfde klankopeenvolging.

Toepassingen onderzoek:
Technologische toepassingen: telefoon, spraakherkenningssoftware, voorleessoftware, cochleaire
implantaten,…
2. Eenheden in taal en spraak en versprekingen
2.1. Eenheden in de taalkundige hiërarchie
Morfosyntactische hiërarchie: in de taalkunde analyseert men in termen van eenheden die op zich weer
bestaan uit kleinere eenheden. De hiërarchie van kleine naar grote taaleenheden verloopt als volgt:
Morfeem = kleinste taaleenheid met een eigen isoleerbare betekenis. Morfemen kunnen vaak als losse woorden
gebruikt worden (vrij morfeem), maar zijn dat niet per se. Bv. deur-tje. 'Tje' heeft wel een eigen betekenis, maar
kan niet los gebruikt worden (gebonden morfeem). Morfemen worden gecombineerd tot oneindig veel woorden,
en woorden tot woordgroepen. Die worden op hun beurt gecombineerd tot zinnen en alinea’s.
Klankvormelijke/fonemische hiërarchie: de kleinste klankvormelijke eenheid is een foneem (een klinker of
medeklinker). Dit is de verzameling van alle mogelijke verschillende manieren om een bepaalde klank in een taal
uit te spreken. /a/ omvat alle mogelijke uitspraakvarianten van [a]. Een concrete realisatie van een foneem is een
allofoon. Het aantal fonemen is beperkt, het aantal allofonen is oneindig.
Fonemen worden gecombineerd tot een syllabe (lettergreep/klankgreep). Binnen een syllabe gelden strenge
ordeningsprincipes/klankopeenvolgingsregels (werp kan, wepr niet). Syllaben worden samengenomen tot voeten:
reeksen syllaben waarvan de beklemtoonde sterker is dan de onbeklemtoonde. Voeten vormen prosodische
woorden: woorden waarin de klemtoon belangrijk is, vallen vaak samen met morfosyntactische woorden. Zij
worden samengenomen tot fonologische frases, die meestal hetzelfde zijn als morfosyntactische woordgroepen,
en daaruit komen dan intonationele frases (meestal hetzelfde als zinnen)
2.2. Taalkundige vs. fonetische eenheden
2.3. Wat versprekingen ons kunnen leren
De menselijke geest is een black box, we kunnen er niet in kijken. We hebben alleen toegang tot de
output, die is waarneembaar. Fouten in die output (versprekingen) zorgen voor theoretische modellen
over de black box.
Taalkundige eenheden bestaan uitsluitend in de geest van de taalgebruiker. Dit wordt bestudeerd in de
taalpsychologie.
2.4. Spraakproductie: plan vs. programma
Een spreker begint met een ruw plan te maken van wat hij wil zeggen. De volgorde van de cruciale
concepten ligt vast, maar er is in het planstadium nog geen keuze gemaakt voor specifieke
woorden/klanken. De globale eigenschappen van de zinsmelodie en de accentplaatsing zijn wel in het
plan opgenomen.
Het ruwe plan wordt geconcretiseerd in een programma, reeksen van bewegingsinstructies die vanuit
het brein verzonden moeten worden naar de spraakorganen. Ook hier is een werkingsprincipe: eerst
inhoudswoorden, dan functiewoorden en dan individuele klanken (ze worden dan pas in detail
gespecifieerd).
We kunnen versprekingen onderverdelen in twee hoofdcategorieën: selectiefouten en
programmafouten.
2.5. Selectiefouten
Syncrasie/woordversmelting: men creëert een nieuw begrip zonder die intentie te hebben (neologismen)
bv. krastische maatregelen.
Verkeerde woordkeuze: binnen de kandidatengroep wordt de verkeerde mogelijkheid gekozen bv. in de
week juni. Hier noemen we het juiste alternatief het doel van de verspreking, en de ten onrechte
geselecteerde kandidaat noemen we de indringer.
Malapropisme: er is een sterke klankvormelijke overeenkomst tussen doel en indringer zonder enige
betekenisovereenkomst. Bv. in diabetische volgorde. Dit kan ook een opzettelijke/spontane verspreking
zijn.
2.6. Programmafouten/detailfouten
Bv. een bloemetje blengen: in plaats van de doelklank /r/ verschijnt de indringer /l/. Deze indringer heeft
zijn oorsprong in de /l/ van het woord bloem. We onderscheiden versprekingen langs verschillende
dimensies:
Dimensie 1: grootte van de eenheid. Het betekenisvolle niveau (woord/morfeem bv. de president van de
president) en het betekenisloze niveau (syllabe/foneem bv. een bloemetje blengen).
Dimensie 2: resultaat van de verspreking. Insertie (toevoeging, er komt een element (klank, morfeem,
woord) extra tegenover het doel bv. vier vlazen bloemen), deletie (weglating, er verdwijnt een element
bv. over een spiraal speken), substitutie (vervanging, een combinatie van insertie en deletie bv. blengen),
transpositie (verschuiving, hetzelfde element wordt op de ene plek weggelaten en op een andere plaats
ingeschoven bv. vees of vlis), permutatie/spoonerisme (verwisseling, bv. het kij is geteerd).
Dimensie 3: oorsprong/indringer-relatie bij verspreking. Anticipatie (de indringer verschijnt eerder dan
zijn oorsprong bv. een luchte lunch) en perseveratie (de indringer verschijnt later dan zijn oorsprong bv.
een bloem blengen).
Wat programmafouten ons over de rol van taaleenheden bij spraak vertellen: anticipaties komen veel
vaker voor dan preseveraties, omdat de aandacht van de spreker vooral gericht is op wat hij/zij wil
zeggen. Anticipaties van klanken komen steeds minder vaak voor naarmate de afstand tussen oorsprong
en doel groter is. De maximale afstand is daarbij zelden groter dan zeven lettergrepen.
2.7. Regelmaat van versprekingen
Versprekingen zijn niet willekeurig. De indringer bij een selectiefout vertoont overeenkomsten met het
doel in betekenis, woordsoort en klankvorm. Als we ons beperken tot fonologische versprekingen
(programmafouten), dan observeren we de volgende regelmaten:
Klankversprekingen hebben bijna altijd betrekking op de beklemtoonde syllaben. We zien zelden
versprekingen die zich afspelen in onbeklemtoonde syllaben. Het programmeren van klanken binnen
beklemtoonde syllaben kost dus meer moeite.
Doelklank en indringer hebben meestal een sterke klankvormelijke overeenkomst. In de meest
voorkomende klankversprekingen wijken doel en indringer in slechts 1 klankeigenschap van elkaar af. De
meeste verwarringen bij medeklinkerversprekingen vinden we in het plaatskenmerk (labiaal, alveolair,
velaar,…).
Klankversprekingen treden eerder op naarmate de klankomgevingen van doel en oorsprong sterker op
elkaar lijken. Bv. de koetsier poetst de postkoets.
Een indringer behoudt zijn positie binnen de syllabe die hij zou hebben gehad in de oorsprong bv. een
poos dennen – een doop sennen.
Versprekingen zijn meestal welgevormd (volgens het sonoriteitsbeginsel). Je kan anticiperen op het
soort fouten dat te verwachten is, en sommige fouten komen zelden voor.
Klankaanpassingsregels blijven van kracht bij versprekingen.
3. Bouw en werking van de spraakorganen
3.1. Inleiding
De anatomische structuren die een rol spelen bij de productie van spraak kunnen in drie groepen worden
onderverdeeld: het subglottale systeem (longen en onderste luchtwegen, functie = lucht naar buiten
sturen), het glottale systeem (strottenhoofd/larynx en stembanden/glottis, functie = stemgeving) en het
supraglottale systeem (mond-, neus- en keelholte, functie = realisatie van klanken en resonantie).
3.2. Het glottale systeem
Boven op de luchtpijp bevindt zich de larynx. Het is relevant wegens de stemgeving, maar ook door het
afsluiten van de luchtpijp met het strotklepje (epiglottis). De larynx is een doosje van kraakbeen dat
hangt aan het tongbeen (hyoid).
3.3. De supraglottale structuren
De supraglottale structuren omvatten alle onderdelen van de holten boven de glottis die een rol spelen
bij de variatie van de mond-keelholte:
Alveolen (tandkassen), de farynx (keelholte), het
harde (palatum durum) en zachte gehemelte (palatum
molle/velum), de huig (uvula), de kaak (mandibula),
de lippen (labia), de tong (lingua), het tongbeen
(hyoid).
Door de mondkeelholte van vorm te veranderen
kunnen we allerlei klanken maken. Verder kunnen we
gebruik maken van de neusholte en deze als extra
resonator inschakelen voor nasale klanken. Voor
klinkers moeten de volgende parameters van de
mondkeelholte worden gemanipuleerd:
De tonghoogte: de afstand tong-gehemelte.
De kaakhoogte: invloed op de tonghoogte.
De stand van de lippen: open – gesloten, gespreid – gerond.
De doorsnede van de farynx: groter bij de ie – kleiner bij de aa.
De stand van het velum: hoog (neusholte afgesloten) – laag (neusholte vrij, voor nasalen)
De positie van de larynx.
4. Productie van spraakklanken
4.1. Drie fases in het spraakproductieproces
Bij de productie van spraakklanken worden drie fases onderscheiden: de initiatiefase, de fonatiefase en
de articulatiefase.
4.2. De initiatiefase
Alleen door een luchtstroom op gang te brengen kunnen we spraak produceren. Dat deel van het
productieproces wordt de initiatiefase genoemd. Er zijn een aantal manieren, onderverdeeld in twee
dimensies, om een luchtstroom in gang te zetten:
Richting: de lucht wordt vanaf een meer inwendig gelegen plaats in het menselijk lichaam naar buiten
gedreven (egressieve luchtstroom op basis van druk), of de lucht wordt van buiten naar binnen gezogen
(ingressieve luchtstroom op basis van zuiging). Dit laatste wordt meestal niet gebruikt bij sprekers van
het Nederlands.
Plaats: het orgaan dat zorgt voor het naar buiten drijven of naar binnen zuigen van de lucht kan zich op
verschillende plaatsen bevinden: de longen (pulmonische druk/zuiging), het strottenhoofd (glottale
druk/zuiging), de mond (orale druk/zuiging), de slokdarm (oesofagale druk, alleen bij stembandloze
sprekers).
De meest gebruikelijke manier om een luchtstroom te initiëren is het leegdrukken van de longen: de
pulmonisch egressieve initiatie.
4.3. De fonatiefase
Bij normaal in- en uitademen passeert de luchtstroom ongehinderd het strottenhoofd. Daar bevindt zich
een aanzienlijke ruimte tussen de stembanden, zodat daar geen luchtwervelingen of pulsaties kunnen
optreden. Er is sprake van fonatie als een luchtstroom door trillende stembanden in korte pulsen wordt
omgezet. De stembanden komen niet zomaar tot trilling, daarvoor is er een verschil in druk nodig tussen
de holten boven en onder de stembanden: transglottale druk. Als dat drukverschil groot genoeg is, drukt
de lucht vanuit de longen de stembanden van elkaar. De luchtstroom die dan door de smalle doorgang
(glottis) wordt gestuurd ondergaat een versnelling, die als gevolg heeft dat de luchtdruk tussen de
stembanden lager wordt. Dit is het Bernouilli-effect. Door die lager wordende luchtdruk worden de
stembanden weer tegen elkaar gezogen. Dit proces herhaalt zich zolang het transglottale drukverschil
groot genoeg is.
Bij fluisteren wordt specifiek gebruik
gemaakt van de glottis. De
stembanden worden bij dat type
spraak in een specifieke stand gezet,
waardoor de glottis de vorm van een
omgekeerde Y krijgt: er is een kleine
opening tussen de arytenoïden. Dit
is de fluisterdriehoek.
4.4. Articulatie van klinkers en medeklinkers
Hier worden de luchtdrukverstoringen die gegenereerd worden in de initiatiefase en al dan niet omgezet
worden in luchtdrukpulsen tijdens het fonatieproces, getransformeerd tot klanken: klinkers en
medeklinkers. Die omzetting vindt plaats door de supraglottale holten een specifieke vorm te geven.
Deze klanken worden onderverdeeld in 2 of 3 klassen: klinkers en medeklinkers (en diftongen).

Klinkers
Klinkers worden zonder obstakel in de
mondkeelholte gerealiseerd. In die holte is dan
sprake van een laminaire luchtstroming, een
luchtstroom waarbij de luchtdeeltjes zonder
wervelingen 1 enkele richting opstromen. De
luchtdrukpulsjes die als gevolg van stemgeving
vanuit het strottenhoofd worden afgevuurd,
worden vervormd door de resonantiekamer
waarin ze terechtkomen
(mondkeelholte/neusholte). Die mondkeelholte
kan allerlei vormen aannemen door articulatoren
in verschillende standen te brengen. Kritische
parameters in die configuratie zijn:
De grootte van de constrictie die de twee buizen
scheidt. Dit bewerkstelligt de tong.
De plaats van de constrictie, ook hier is de rol van de tong cruciaal.
De vorm van de lippen: als deze gestulpt zijn, wordt het buizenstelsel als geheel langer.
Bijschakeling van de neusholte aan het buizenstelsel door middel van opening van het velum.
De positie van de tong varieert bij de realisatie van de verschillende klinkers. Hoewel de positie van de
hele tong verandert, kiest men gewoonlijk voor 1 specifieke locatie om de tongpositie te karakteriseren:
de positie van de maximale constrictie, gemaakt langs de horizontale as (voor-achter). Daarbij wordt
ook de mate van constrictie aangegeven: de verticale as (hoog-laag). Er wordt ook aangegeven of de
klinker met geronde of gespreide lippen wordt uitgesproken.

Diftongen
Tweeklanken/diftongen worden gekenmerkt
door het feit dat zij twee doelposities
kennen: de beginpositie en de eindpositie
van de klank. Ze bestaan in transcriptie uit
twee klanksegmenten.

Medeklinkers
Het belangrijkste
onderscheid tussen
medeklinkers en klinkers
is dat bij medeklinkers de
luchtstroom ergens in de
mondkeelholte stuit op
een obstructie, gaande
van volledige afsluiting
tot vernauwing. De mate
van vernauwing noemen
we de articulatiewijze, en
de plaats van de
vernauwing is de
articulatieplaats.
Obstruenten: plosieven &
fricatieven.
Sonoranten: liquidae,
semivocalen en nasalen.
Approximanten: liquidae & semivocalen.
Elke locatie aan de bovenkant van de mondkeelholte (behalve de bovenlip) vormt een passieve
articulator, en de lippen, ondertanden en tong de actieve articulator.
Plosieven/occlusieven/plofklanken: bij de realisatie van plofklank /b/ is de mond door de lippen
afgesloten. Omdat de vorm van het mondkeelkanaal tijdens de afsluiting niet verandert, neemt de druk
in de mondholte snel toe. Na korte tijd is er zoveel lucht door de glottis heen de mondkeelholte
ingestroomd, dat de druk boven en onder de glottis in evenwicht komt. Dan stokt de luchtstroom bij
gebrek aan drukverschil. Op of kort voor dat moment houden de stembanden op met trillen.
Als de spreker de tijd van stembandtrilling wil verlengen, is dit mogelijk door:
Het vergroten van de mondholte door bv. de wangen te bollen.
Het laten dalen van de larynx.
Lucht laten ontsnappen uit de mondholte: de release.
Bij een /b/ zet de stemgeving al voor de release in. Als we de explosie van de plofklank als
referentietijdstip 0 nemen, dan definiëren we de VOT (Voice Onset Time) als het tijdsverloop tussen de
ruisexplosie en de inzet van de stembandtrilling. Negatieve VOT/voice lead is kenmerken voor
stemhebbende plofklanken in het Nederlands. Een VOT van 0 ms of meer (voice lag) is het kenmerk van
een Nederlandse stemloze plofklank.
Bij de plosieven kunnen we dus twee dimensies onderscheiden: de plaats van constrictie (vorm en
lengte van de voorste holte) en stemgeving.
Fricatieven: komen tot stand door lucht via een vernauwing in het mondkeelkanaal te persen. Als er
voldoende lucht door die vernauwing wordt gestuwd, ontstaan er chaotische luchtwervelingen
(turbulentie) die wij als ruis waarnemen. Bij klinkers volgen de luchtdeeltjes maar een enkele richting
(laminaire luchtstroom), bij fricatieven gaan ze in allerlei richtingen (turbulente luchtstroom). We
moeten dus bij de fricatieven twee dimensies onderscheiden: de plaats van de constrictie en het
stemhebbend/stemloosonderscheid.
Liquidae: er is geringe vernauwing in de mondholte en de luchtstroom blijft vloeien. Door de geringe
belemmering lijken liquidae in een aantal opzichten op klinkers. Doordat het mond-keelkanaal echter
minder geopend is, zijn ze minder luid. Bij de /l/ stroomt de lucht ongehinderd langs een of beide
zijkanten van de tong naar buiten. De realisatie van de /r/ is variabel. Het onderscheid tussen de
varianten wordt langs drie dimensies gemaakt:
De articulator: tongpunt vs. huig.
Onderbroken (vibrant) vs. niet onderbroken (continuant). Bij de onderbroken variant is er een of
meerdere keren contact tussen articulatoren. Bij de continuante versie van de /r/ vindt geen contact
tussen articulatoren plaats: de luchtstroom wordt niet onderbroken, dit is een approximant. Daarbij
worden twee varianten onderscheiden: de alveolaire approximant en de uvulaire approximant.
Het aantal contactmomenten tussen tongpunt en tandkassen: 1 of meer.
Nasalen: worden gerealiseerd met een gesloten mondkanaal. Bij alle nasalen is het velum geopend,
zodat er achter in de mond een verbinding is tussen keel- en neusholte, waardoor de neusholte als
resonator kan fungeren.
Halfklinkers: klinkers waarbij de tong het gehemelte zo dicht nadert dat er net geen sprake meer is van
volkomen ongehinderde luchtstroom. De doorgang is echter nog ruim genoeg om het ontstaan van
geruis te vermijden.
Affricaten: plofklanken gevolgd door een homorgane fricatief (een fricatief met dezelfde articulatieplaats
als de plofklank) bv. /ts/
4.5. Nasaliteit
Nasalisering houdt in dat de neusholte wordt bijgeschakeld als resonantieholte door het velum te laten
zakken. De luchttrillingen kunnen dan ook de neusholte binnendringen. Het velum is bij een nasale klank
geopend en bij een orale klank gesloten. Maar bij orale klanken is het velum lang niet altijd stevig dicht
gedrukt. Er is een rangorde te geven van velumstanden bij diverse soorten spraakklanken:
1. Stemloze plosieven
2. Stemhebbende plosieven
3. Stemloze fricatieven
Maximaal gesloten velum
4. Stemhebbende fricatieven
5. Gesloten (hoge) klinkers
6. Open (lage) klinkers
7. Nasalen
Maximaal geopend velum
5. Spraak op papier
5.1. Inleiding
Spraak is vluchtig. Het geluid is maar heel even beschikbaar en daarna is het voor altijd weg. Toch heeft
het nog lang geduurd voordat de mens een systeem bedacht om de vluchtige spraak vast te leggen op
een permanent medium. Latere schriftsystemen zijn gebaseerd op steeds kleinere taaleenheden. De
oudste schriftsoorten bedienen zich van tekens of tekeningen, die hele zinnen of woorden voorstellen.
De symbolen in moderne alfabetische schriften hebben juist betrekking op klanken.
5.2. Geschiedenis van schriftsoorten
De oudste schriftsoorten gaan terug tot zo’n 3500 jaar v.C.: de Proto-Sumerische pictogrammen. In de
ontwikkeling sindsdien onderscheiden we 5 stadia:
Beeldverhaal: dit stadium kunnen we strikt genomen nog niet beschouwen als schrift (weergave op een
permanente informatiedrager zoals papier van een gesproken taaluiting). Pictogrammen zijn een
voorstelling van een situatie die mogelijk te beschrijven valt met een hele zin.
Beeldschrift: men kiest ervoor om ieder woord in een zin voor te stellen met een apart plaatje
(logogram). Door de plaatjes in verschillende volgorden te tekenen, kan men gebruik maken van
woordvolgorde. Het is belangrijk ons te realiseren dat de plaatjes in het beeldschrift iconisch zijn (we
kunnen aan het logogram zien wat erdoor wordt voorgesteld)
Een beeldschrift en een beeldverhaal zijn in belangrijke mate taalonafhankelijk, maar de Schijf van
Phaistos is toch tot op de dag van vandaag niet ontcijferd. Voorbeelden van zulke woordschriften komen
we vandaag nog tegen in het Chinese schrift. Een woordschrift eist van de gebruiker dat deze vele
duizenden tekens beheerst.
Woordschrift: de stap van logogram naar fonogram wordt gezet als het iconische teken voor woord A
ook gebruikt wordt om een woord B met een totaal andere betekenis te representeren als dat woord B
hetzelfde klinkt als woord A (bv. bij). De grafische tekens stellen niet langer betekenissen voor, maar
klanken.
Syllabeschrift: hier schrijft men tekens niet per woord maar per syllabe. Een syllabeschrift heeft het
voordeel dat er minder verschillende symbolen geleerd moeten worden. Bv. het spijkerschrift en Japans.
Alfabetisch schrift: elke klinker of medeklinker wordt voorgesteld door een eigen symbool, een letter.
De gebruiker moet maar een heel klein aantal tekens met hun bijbehorende klankwaarde leren.
Niet-alfabetische schriften zijn in de menselijke culturen op verschillende plaatsen ontstaan. Voor zover
we weten is het alfabetisch schrift maar één keer in de geschiedenis van de mensheid bedacht. Toen de
Grieken met het Foenicisch schrift probeerden te schrijven (gebaseerd op syllaben), merkten ze dat ze
geen belangrijke klinkerverschillen konden weergeven. Ze kwamen tot het besef dat syllaben bestaan uit
klinkers en medeklinkers.
We zien dat in de ontwikkeling van het schrift de eenheden steeds kleiner gekozen werden totdat men
uitkwam op het niveau van de kleinste taaleenheden: de klinker en medeklinker. Deze ontwikkeling
weerspiegelt het taalbewustwordingsproces bij kinderen. Aanvankelijk zijn zinnen ondeelbaar, dan
ontwikkelen kinderen het inzicht dat zinnen kunnen worden opgedeeld in woorden, syllaben en klanken.
De ontstaansgeschiedenis van de soort herhaalt zich zo in de ontwikkeling van het jong. Fylogenese
(afstammingsgeschiedenis) is dus herkenbaar in de ontogenese (ontstaanswijze, het kind).
5.3. Beginselen van conventionele spelling
Het principe achter een alfabetische spelling is dat iedere wezenlijk verschillende klank, ieder foneem,
wordt weergegeven met een eigen, uniek symbool. Vaak echter heeft een taal meer dan 26 fonemen,
zodat het traditionele alfabet met zijn 26 lettertekens tekortschiet. In zulke gevallen is een eenvoudige
en gebruikelijke oplossing om sommige fonemen weer te geven met een vaste combinatie van twee of
meer letters die in diezelfde volgorde nooit als twee aparte fonemen voor kunnen komen. Zulke
spellingen heten fonologische spellingen (in zo’n talen kunnen we gemakkelijk foutloos leren schrijven).
De Nederlandse spelling kunnen we gebruiken als voorbeeld van een abstracter soort spelling, die ook
wel morfo-fonologische spelling wordt genoemd. De spelling van het Nederlands is gebaseerd op 5
grondbeginselen:
Fonologisch beginsel: iedere klank stellen we voor met een eigen, unieke letter of met een eigen, unieke
vaste combinatie van letters. Daarbij nemen we als norm de uitspraak van los uitgesproken woorden
door een algemeen sprekende Nederlander. Dit wordt aangevuld met afspraken/regels, bv. lange klinker
wordt kort geschreven na een open syllabe, korte klinker krijgt medeklinkerverdubbeling in een gesloten
syllabe,…
Gelijkvormigheidsprincipe: stammorfemen spellen we altijd met dezelfde reeks letters, ongeacht de
uitspraak (hond, web,…). Gelijkvormige spelling van verschillend uitgesproken varianten van hetzelfde
stammorfeem, leidt tot betere woordherkenning (hond – honden).
Analogieprincipe: regelt voor achtervoegsels wat het gelijkvormigheidsbeginsel doet voor stammen.
Volgens dit beginsel spellen we hetzelfde affix altijd op dezelfde manier, ook al wordt dat achtervoegsel
in verschillende woorden verschillend/helemaal niet uitgesproken. Ook bij werkwoorden geldt dit:
branden klinkt hetzelfde als brandden, maar wordt anders geschreven.
Etymologisch beginsel: spellingsverschillen die vroeger correspondeerden met uitspraakverschillen
worden in de moderne spelling overeind gehouden, ook al zijn de verschillen in uitspraak verdwenen.
Vooral vele vreemde woorden behouden hun authentieke spelling (computer).
Verenigbaarheidseis: de vorige principes mogen we alleen toepassen voor zover de spelling
terugleesbaar is (bij het hardop lezen leidt het zonder problemen tot de juiste uitspraak). We zouden bv.
nooit de verkleinwoorduitgang kunnen spellen volgens het analogiebeginsel, want dan krijg je vistje,
broktje, pijptje,… en die woorden zijn niet terugleesbaar als visje, brokje, pijpje. Woorden zoals huiz
kunnen we wel nog lezen, omdat een /z/ op het einde van een woord altijd als /s/ wordt uitgesproken.
Regels 2 – 5 zijn allemaal morfemische principes. Dit houdt in dat morfemen altijd op dezelfde manier
gespeld worden, ongeacht de uitspraak, en dat we woorden sneller kunnen herkennen en meer inzicht
hebben in de structuur van de zin.
5.4. Fonetisch schrift
Er zijn enkele redenen waarom conventionele spellingen tekortschieten:
- Gelijkvormigheid, analogie en etymologie doorbreken consequente toepassing van het fonologisch
beginsel.
- Het fonologisch beginsel is zelf ook niet nauwkeurig genoeg om alle hoorbare verschillen in uitspraak
weer te geven.
- Er zijn te weinig verschillende lettertekens om alle spraakklanken mee weer te geven.
- Klemtoon, accentuering, frasering en zinsmelodie worden niet systematisch weergegeven in het
schrift.
Het doel van het fonetisch schrift is de codering van de klankwaarde van een taal. Er is nood aan een
systeem dat spraak direct en correct weergeeft.
De vormen van notaties waarmee geëxperimenteerd is, kan men onderbrengen in twee typen:

Analfabetische notaties
Elke klank wordt weergegeven door een reeks van symbolen die alle kenmerken van de klank weergeeft.
Dit is te vergelijken met symbolen uit de chemie. Deze soorten systemen zijn in de praktijk niet echt
bruikbaar.

Alfabetische notaties
Iedere spraakklank wordt voorgesteld door één symbool. We maken hier een onderscheid tussen
iconische en Romeinse notaties.
Iconische notaties: een symbool geeft de stand of actie van de spraakorganen weer. Verwante
spraakklanken worden weergegeven door verwante symbolen zonder dat er een symbool-klankrelatie is.
Hoe meer de klanken op elkaar lijken, hoe meer gelijkheid tussen de symbolen. Bv. het systeem van Bell
(Visible Speech).
Romeinse notaties: de relatie tussen symbool en klank is arbitrair. Het Romeinse alfabet is met 26
lettertekens ontoereikend om daarmee alle mogelijke verschillende klanken in de talen van de wereld
weer te geven. In de praktijk wordt dit opgelost op verschillende manieren:
- Naast kleine letters ook hoofdletters gebruiken ([r][R])
- Omkeringen van letters ([])
- Ook Griekse en Cyrillische symbolen gebruiken ([][])
- Koppelen van symbolen ([][][])
- Diacritische tekens gebruiken voor het aanbrengen van klanknuances (dwarsstreepje, cedille, accentjes
etc.)
5.5. Twee typen transcriptie

Globale/fonemische transcriptie
Tussen /…/, want we zijn hier niet geïnteresseerd in de precieze realisatie van de klank. Een open klinker
a, wordt dus altijd getranscribeerd als /a/, ook al wordt hij misschien meer achteraan de mond
uitgesproken als een [].

Gedetailleerde/fonetische transcriptie
Tussen […], want er kan allofonische variatie weergegeven worden. De graad van detail kan hier
verschillen afhankelijk van de doelstelling. Deze transcriptie geeft indicaties over de uitspraak van
woorden die nooit eerder gehoord werden. De tekens zijn dan ook taalonafhankelijk, van elk symbool is
vastgelegd hoe de klank gearticuleerd moet worden. Het IPA (International Phonetic Alphabet) is een
organisatie die het fonetisch schrift ontwikkelde en onderhoudt.
5.6. IPA in de praktijk
Er zijn geen richtlijnen over de keuze tussen globaal of gedetailleerd. In de logopedie gebruikt men veelal
transcriptie bij articulatieproblemen, dus daar is nood aan gedetailleerde transcriptie.
Het IPA is een geheel van symbolen om klanken van een taal schriftelijk weer te geven. Het is gebaseerd
op het Romeinse alfabet, met toevoeging van Griekse letters en diacritische tekens.
5.7. Afspraken fonetische transcriptie
- Vergeet de spelling, schrijf zoals het hoort.
- Leer de fonetische tekens en verzorg ze.
- Alles wordt aan elkaar geschreven.
- Leestekens binnen de haken zijn diacritische tekens
- Gebruik geen hoofdletters binnen de haken
- Een klank heeft één teken, ook tweeklanken.
Foneem
klank
voorbeeld
schriftbeeld














































































































































































Teken
voorbeeld












































betekenis













6. Golfvormen en segmentatie van spraakklanken
6.1. Golfvormen
De ons omringende lucht bestaat uit kleine
luchtdeeltjes die voortdurend in beweging zijn. Ze
botsen tegen elkaar en tegen voorwerpen. De druk
die ze hierdoor uitoefenen op een voorwerp is
atmosferische luchtdruk, en wordt uitgedrukt in
Pascal (1 Newton/m²) of bar (100000 N/m²). De
gemiddelde luchtdruk is 1013 hPa (hectopascal).
De luchtdruk wordt beïnvloed door de
temperatuur.
Spraak, en geluid in het algemeen, bestaat uit een snelle opeenvolging van kleine verstoringen van de
luchtdruk. Door de bewegingen van de spraakorganen worden de luchtdeeltjes afwisselend dichter op
elkaar gedrukt (verdichtingen) en uit elkaar getrokken (verdunningen). De daaruit resulterende
drukvariaties planten zich vanaf de geluidsbron voort in alle richtingen, daarbij steeds zwakker wordend
met de afstand. De luchtdrukverstoringen worden door ons trommelvlies opgevangen en omgezet in
zenuwimpulsen die naar de hersenen worden gestuurd.
Wanneer een luchtdeeltje in beweging wordt gebracht, en er zich verder geen specifieke belemmeringen
voordoen, dan voert dat deeltje een sinusvormige beweging uit. Dat zien we als we een gewichtje aan
een veer hangen en naar beneden trekken. Zonder luchtweerstand zou het gewichtje dezelfde beweging
eindeloos blijven uitvoeren; het golfpatroon herhaalt zich dan periodiek. De tijd die nodig is voor één
complete herhaling van het golfpatroon heet de periode T. De frequentie F is het aantal periodes T in 1
seconde, en wordt uitgedrukt in Hz. F = 1/T. De snelheid waarmee het bewegingspatroon zich voortplant
in de ruimte, de geluidssnelheid, bedraagt 340m/s.
Sinusvormige variaties van de luchtdruk nemen we met het gehoor waar als een zuivere toon. Met de
menselijke spraakorganen kunnen we een zuivere toon maken door te fluiten. Hoe korter de
periode/hoe groter de frequentie, des te hoger is de toonhoogte die het oor aan de sinus toekent. Dus
als de frequentie hoger wordt, dan wordt de toonhoogte ook hoger. De grootte van de bewegingen van
luchtdeeltjes, en daarmee van de geluidsdruk, wordt de amplitude genoemd, uitgedrukt in dB. Hoe
groter de amplitude, des te luider klinkt de sinus/golf. Dit is luidheid en intensiteit (I). Gemiddeld
bedraagt de intensiteit van spraak ongeveer 60 dB.
In de meeste gevallen is het patroon van luchtdrukvariaties ingewikkelder dan de vloeiende
sinusbewegingen. In spraak is die ingewikkeldheid het gevolg van de abrupte en/of chaotische manier
waarop de luchtdeeltjes in beweging worden gezet. Bv. klinkers: luchtdeeltjes krijgen forse, korte
klappen door de trillende stembanden, fricatieven: luchtdeeltjes worden in een turbulente beweging
gezet. Spraakklanken hebben daarom altijd een andere vorm dan enkelvoudige sinussen. Periodieke
luchtdrukverstoringen zijn tonaal (hebben een duidelijke toonhoogte). De luchtdrukvariaties worden
door een microfoon omgezet in elektrische spanningswisselingen, die we zichtbaar kunnen maken op
een oscilloscoop. Zo’n registratie noemen we oscillogram of golfvorm.
Er zijn periodieke (de golfvorm herhaalt zich steeds) en niet-periodieke signalen (bv. ruissignalen,
signalen geproduceerd voor fricatieven). Niet-periodieke luchtdrukvariaties zijn wild, turbulent en
daarom onvoorspelbaar. Ze hebben geen herhalende golfvorm en geen duidelijke toonhoogte (atonaal).
6.2. Segmentatie
Wanneer we naar spraak luisteren, kunnen we de
afzonderlijke segmenten waaruit de woorden
bestaan, gemakkelijk benoemen. Het is nog niet zo
makkelijk om de grenzen tussen die klanken in het
spraaksignaal terug te vinden. Het spraaksignaal
kunnen we op verschillende manieren afbeelden,
waaronder het oscillogram. Het probleem is dat
spraakklanken niet discreet zijn, ze zijn niet van
elkaar gescheiden. Bij het afgrenzen van klanken
gaan we daarom liever niet op het gehoor te werk,
maar op het oog. Segmentatie van spraak is een voorwaarde om te kunnen vaststellen hoe lang de
spraakklanken duren.
6.3. Segmentatie van de spraak
Hoe kunnen in de golfvorm brede fonetische klassen
worden onderscheiden? We onderscheiden bij
oscillogrammen 7 signaalkenmerken die gebruikt
kunnen worden bij de segmentatie:
Periodiek signaal: de periodiciteit wordt veroorzaakt
door het trillen van de stembanden. Het gaat dan om
een stemhebbende klank.
Lokaal maximum: wanneer de amplitude van het signaal een lokaal maximum vertoont (hoog vergeleken
met de amplitude van de omliggende klanken) dan hebben we waarschijnlijk met een klinker te maken.
Stil interval: stilte vinden we in de gesloten fase van een
plosief, het weerspiegelt de tijd waarin de mond gesloten
is, en drukopbouw in de mond plaatsvindt. Bij de
stemhebbende plosieven wordt de tijd waarin de mond
gesloten is, gevuld met stemhebbend
‘gemurmel’/prevoicing. Deze is zichtbaar als een
periodiek signaal met een lage amplitude.
Ruis: signaal zonder zigzagpatroon: stemloze fricatieven,
ruis met een periodiek signaal levert een wazig
zigzagpatroon op. Dit zijn stemhebbende fricatieven. Fricatieven hebben een kleinere amplitude dan
klinkers. Door turbulentie in de mondholte creëer je stemhebbende en stemloze fricatieven. Is die
turbulentie in de glottis, dan krijg je gefluister of aspiratie.
Explosie: een zeer kort stukje ruis, dat ontstaat als gevolg van de release bij de productie van een
plofklank. De lengte van de explosie is kort/geheel afwezig bij de stemhebbende, en langer bij de
stemloze plosieven.
Amplitudeverandering: als in een periodiek signaal de
amplitude zich plotseling wijzigt, kan dat samenhangen met
de overgang naar een andere klank. Er zijn kleinere
veranderingen tussen klinkers en nasalen of liquida, en
grotere veranderingen tussen klinkers en plosieven of
fricatieven.
Verandering in fijnstructuur van de golfvorm: wijst
op een gewijzigde samenstelling van het
spraakgeluid, als gevolg van een verandering in de
vorm van de mondkeelholte.
6.4. Klanken visueel herkennen
Klinkers: periodiek zigzagpatroon, relatief grote
amplitude, duur tussen 50 (sjwa) & 300 (lange
klinkers) ms.
Stemloze plofklanken: de amplitude van de voorafgaande klinker neemt vrij abrupt af, daarna volgt een
stil interval (< 100 ms) en een korte ruisexplosie. De steminzet (VOT) is positief, omdat de stem na de
explosie inzet.
Stemhebbende plofklanken: de amplitude van de voorafgaande klinker daalt minder abrupt. De VOT is
negatief, en het stille interval is gevuld door een gladde, sinusachtige golf met een geringe amplitude. De
ruisexplosie heeft een geringe of geen amplitude.
Geaspireerde (stemloze) plofklanken: de inzet van de stembandtrilling (VOT) na een stemloze plofklank
wordt uitgesteld tot veel later na de ruisexplosie. Het interval tussen de ruisexplosie en de steminzet
wordt opgevuld met een stemloze (gefluisterde) variant van de volgende klank. Hier is sprake van een
positieve VOT. Klanken met een negatieve VOT zijn altijd stemhebbend.
Stemloze fricatieven: bestaat uit een ruissignaal, zonder periodiciteit. De amplitude is geringer dan die
van de omringende klinkers.
Stemhebbende fricatieven: bestaat uit een ruissignaal, gesuperponeerd (liggend bovenop) op een
periodiek signaal. Dit levert een wazige zigzag op.
Nasalen: periodiek zigzagpatroon, met een nagenoeg
constante amplitude die kleiner is dan bij klinkers.
Liquidae [l][r]: periodiek zigzagpatroon, met zeker bij de [l]
constante amplitude (daarom moeilijk te onderscheiden van
nasalen). [r] ken verschillende allofone variaties.
Halfklinkers/approximanten: een periodiek zigzagpatroon,
met een amplitude die vanuit een voorafgaande klinker vaak langzaam daalt, en naar de volgende klinker
toe weer langzaam stijgt.
[ɦ]: een periodiek zigzagpatroon met een geringere amplitude dan de omringende klinkers. De klinker na
de [ɦ] neemt relatief langzaam toe in amplitude.
Glottislag: enkele langzame, onregelmatig gespatieerde zigzaggen, soms met kort stil interval.
7. Spectra en formanten
7.1. Spectra
De golfvorm van spraakgeluid lijkt bijna nooit op die van de
enkelvoudige sinus, meestal is het een zeer complex
golfpatroon. Het opvallendst bij dergelijke spraakgolven is
wel de periodiciteit die zich bij de stemhebbende klanken
voordoet en het gebrek aan enige periodiciteit bij stemloze
spraakklanken. Blijkbaar zorgt de stembandtrilling voor de
herhalingen in het patroon. Als we die ingewikkelde
golfvormen willen beschrijven, staan we voor een probleem.
Kwalitatieve beschrijvingscategoriëen zijn niet geschikt voor
de beschrijving. Het blijkt mogelijk iedere ingewikkelde golf
te analyseren als een stelsel van meerdere tegelijkertijd
klinkende sinusgolven, ieder met een eigen frequentie,
amplitude en tijdsordening. Dit is de Fourieranalyse: het
ontbinden van de geluidsgolf in zijn enkelvoudige sinusgolven. De afzonderlijke sinussen worden ieder
gekenmerkt door drie eigenschappen: amplitude A in dB (hoorbaar als luidheid/intensiteit), frequentie F
in Hz (hoorbaar als toonhoogte) en de fase  (niet hoorbaar). Enkel de eerste 2 volstaan voor de
beschrijving van complexe golfpatronen. Een grafiek met op de
horizontale as de frequenties en op de verticale as de amplitudes,
wordt een spectrum genoemd. De zaagtand heeft een glad
aflopend spectrum: iedere hogere frequentiecomponent heeft
een geringere amplitude dan zijn linkerbuur. De grondtoon (de
sinusgolf met de laagste frequentie) is grondtoon F0. De andere
sinussen hebben frequenties die hele veelvouden zijn van de
grondfrequentie (boventonen/formanten). Grondtoon en
boventoon samen noemt men harmonischen. De grondtoon is de
eerste harmonische, de eerste boventoon de 2de,… Bij het
vergelijken van spectra kijkt men gewoonlijk naar de toppen in het spectrum, de maxima, die goed
zichtbaar worden als over het spectrum een omhullende lijn wordt getekend.
De grondtoon wordt bepaald door de stembandtrilling. Kenmerkend hiervoor
is dat de intensiteit van de afzonderlijke sinusgolven afneemt met 12 dB per
octaaf. De formanten (Fn) worden bepaald door de stand van de
mondkeelholte. Welke binnenkomende sinussen worden versterkt of
verzwakt, hangt af van de vorm van de holte. Het bronspectrum en de
overdrachtsfunctie (door de resonantieholten versterkte
formanten/boventonen) samen, vormen het spectrum van een spraakklank.
Dit is de bron-filtertheorie.
Spraakgeluiden worden dus gerealiseerd door trilling van de stembanden en
de resonantie van de mondkeelholte. Klinkers worden gewoonlijk beschreven
op basis van de eerste 2 of 3 formanten. De klinkers kunnen op een spectrum
van elkaar worden onderscheiden, met een oscillogram gaat dat niet.
7.2. De relatie tussen aanzetstuk en golfvorm
Het aanzetstuk is in de akoestische fonetiek de benaming voor het stelsel van holten dat zich op weg
naar buiten toe bevindt voorbij de producent van het brongeluid. Bij stemhebbende spraakklanken
wordt het brongeluid geproduceerd in het strottenhoofd. Het aanzetstuk wordt dan gevormd door het
stelsel van holten in keel, mond en neus. Bij de productie van stemloze fricatieven wordt het brongeluid
opgewekt door luchtwervelingen bij een sterke vernauwing hogerop in het mondkeelkanaal. Daar wordt
het aanzetstuk dan alleen gevormd door de holte(n) voorbij de plaats van de constrictie. De vorm van
het aanzetstuk is sterk variabel en wordt bepaald door beweeglijke delen (tong, kaak, lippen,
farynxwand). De vorm heeft ook invloed op de spectrale eigenschappen van het spraaksignaal.
7.3. Klinkers en formanten
 De 2-buis
Bij de bestudering van de relatie tussen de vorm van het
aanzetstuk en het akoestisch signaal van klinkers, wordt vaak
met het eenvoudige dubbele Helmholtz-resonator model
gewerkt. Dit zijn twee met elkaar verbonden resonatoren die de
vorm van de mondholte bij de productie van klinkers benaderen.
Het smalle verbindingsstuk tussen beide resonatoren
correspondeert met de smalle doorgang tussen de tong en het gehemelte. De grootste resonator (V1) is
dan de achterholte, en de resonator V2 functioneert als de voorholte. A2 stelt het effect van de lipvorm
voor.
Als we een geluidsbron (bv. een stemvork) in contact brengen met een enkele resonator (bv. de
achterholte), zal de lucht in de resonator al dan niet gaan resoneren. Komt de toon van de geluidsbron
overeen met de resonantiefrequentie van de resonator, dan treedt resonantie op. Dit manifesteert zich
als een versterkte toon die via A uit de resonator treedt. Resonantie doet zich voor wanneer
geluidsgolven die de bron heeft opgewekt, door de wanden van een holte zo worden
gereflecteerd/teruggekaatst dat de heengaande en de gereflecteerde golf elkaar versterken. De
resonantiefrequentie van een holte is afhankelijk van een aantal vormeigenschappen:
- Geluidssnelheid (340 m/s)
- Lengte van het tuitje (m)
- Oppervlakte van de tuit (m²)
- Volume van de holte (m³)
We kunnen algemene regels afleiden:
- De resonantiefrequentie neemt toe bij een kleiner wordend volume, en neemt af als het volume groter
wordt.
- De resonantiefrequentie neemt af als de tuitlengte toeneemt (en omgekeerd).
- De resonantiefrequentie neemt af als de diameter van de tuit kleiner wordt (en omgekeerd).
De gekoppelde resonatoren (voor- en achterholte) zijn verantwoordelijk voor twee
resonantiefrequenties: F1 (eerste formant, resonantiefrequentie van de achterbuis V 1)en F2 (tweede
formant, resonantiefrequentie van de voorbuis V2). Vier belangrijke factoren hebben effect op deze
formantfrequenties:
- De plaats van de constrictie: de tong zorgt meestal voor de locatie van de constrictie. Als deze naar
achteren gaat, neemt V1 in omvang af en wordt V2 groter.
- Mate van constrictie: als de tong een hogere stand inneemt, neemt A1 af en daardoor ook F1.
- De doorsnede en de lengte van de voortuit: de lipconstructie zorgt voor deze variatie. Bij getuite lippen
neemt L2 toe en F2 af.
- Ronding van de voortuit: heeft een verlagend effectzowel op de F1 als op de F2, omdat door de ronding
het hele pijpenstelsel wordt verlengd.
De klinkerdriehoek representeert de gemiddelde
formantfrequenties.

Van 2-buis naar 2+1-buis: nasalisering van klinkers
Gaten in het spectrum vormen een belangrijke cue bij het
onderscheid tussen orale en genasaleerde klinkers. Die
genasaleerde klinkers worden gerealiseerd met een open
velumstand, waardoor de neusholte als resonator wordt
bijgeschakeld. Dit complexe systeem bestaat uit twee
buizen met elk een eigen formant: de orale buis en de
nasale buis. Hoe opener het velum, hoe meer akoestische
koppeling tussen beide buizen. De resonantiefrequenties van de neusholte hebben een dempend
effect op de formanten van de orale holte, vooral als de formanten van beide dicht bij elkaar liggen
en de akoestische koppeling groot is. De formanten van de neusholte functioneren als
antiformanten, die de orale formanten wegdrukken.
(foto: links is oraal, rechts is nasaal, F2 is onderdrukt
bij de nasale a).
7.4. Medeklinkers
Medeklinkers vormen een zeer heterogene groep
klanken. Ze kunnen veel moeilijker beschreven
worden met enkel F1 en F2 (tong- en lipstand). Aan
het begin van een klankreeks onderscheiden we drie klankonderdelen/subfonen:
a) Het deel dat correspondeert met de gesloten mond
(voice bar).
b) De geluidspuls die wordt voortgebracht bij het
plotseling opengaan van de mond (de explosie).
c) De verandering van het spectrum in de overgang
tussen klinker en medeklinker.
We maken een onderscheid tussen niet-stationaire (een
klank die een in de tijd zeer wisselend karakter heeft) en stationaire klanken (relatief constante
verschijningsvorm).

Fricatieven
De oscillogrammen van [f] en [s] vertonen de onvoorspelbare, niet-periodieke vorm die kenmerkend is
voor ruissignalen. Het spectrum verschilt echter in o.a. de concentratie van energie. De ruisbron is
afhankelijk van de plaats van de turbulentie. Er is
sprake van twee ruisbronnen: de primaire ruisbron
(ergens in de mondholte, achter de tanden) en de
secundaire ruisbron (luchtstraal treft de tanden,
genereert ruis met sterke amplitude). Het spectrum
van alle fricatieven wordt dus bepaald door de aard
van de turbulentie. Dit hangt af van de lengte van
de primaire ruisbron/vernauwing, en de afstand
tussen primaire en secundaire (tanden) ruisbron.
Naarmate de plaats meer naar achter ligt, ligt ook
de primaire ruisbron meer achteraan.

Nasalen en lateralen
De nasale en laterale medeklinkers hebben gemeenschappelijke kenmerken:
- Stemhebbendheid.
- Een formantstructuur die lijkt op die van klinkers.
- Een relatief geringe amplitude.
- Niet gevormd door een simpele 2-buis, maar door middel van een extra holte.
Nasalen: de akoestische energie ontsnapt door de neus (en niet via de lippen) en de mondholte
functioneert als zijtak van de pijp die een uitgang naar buiten heeft via de neus. Het effect van die zijtak
is dat die elementen in het spectrum worden gedempt die overeenkomen met de resonantiefrequenties
van de mondholte. De bijschakeling van de neusholte zorgt dus voor antiresonanties: dalen in het
spectrum met weinig intensiteit.
Lateralen: in de mondholte, tussen de tong en het gehemelte
gevormd.

Halfklinkers
Halfklinkers worden gekleurd door de lipronding.
Bij bv. de [w] is er een langere lipronding
waardoor de lage frequenties meer intensiteit
hebben.
8. Spectrale eigenschappen van niet-stationaire klanken
8.1. Analyse van niet-stationaire klanken
Als gevolg van de continue verandering van de vorm van onze spraakorganen, is de spectrale
samenstelling van het spraakgeluid geen moment constant of stationair. Veel spraakklanken worden
echter als relatief stabiel beschouwd (bv. fricatieven, monoftongale klinkers). In zulke stabiele
spraakklanken kunnen we een middenstuk aanwijzen waarin de spectrale samenstelling min of meer
constant blijft. Bij de analyse is het voldoende om een spectrum te bepalen op 1 representatief tijdstip,
ergens in het midden van de klank.
Daarnaast zijn er echter spraakklanken die hun identiteit ontlenen aan een snelle verandering van
spectrale samenstelling. Dit zijn niet-stationaire, dynamische klanken (bv. diftongen, profklanken).
Diftongen: verglijding van de klinkerarticulatie binnen 1 syllabe. Voor de beschrijving zijn dan minstens 2
spectra nodig: 1 aan het begin van de verglijding en een tweede dat de toestand aan het einde
weergeeft.
Plofklanken: de mond maakt eerst een sluitingsgebaar dat een snelle spectrale verandering veroorzaakt,
dan is er een moment van (bijna)-stilte, waarna er een explosie van ruisgeluid ontstaat, die op haar beurt
wordt gevolgd door een snelle spectrale verandering bij de inzet van de volgende klinker.
Voor de analyse van dit soort geluiden hebben we behoefte aan een grafische voorstelling die de
veranderingen in het spectrum als functie van de tijd weergeeft. Er zijn drie manieren om het verloop
van het spectrum weer te geven: de spectrale waterval, het spectrogram en de afbeelding van
formantsporen.

Spectrale waterval
Dit soort spectrum geeft in drie dimensies voor
verschillende tijdstippen afzonderlijke spectra weer.
Bv. bij [bi] staat (a) voor de stemgeving, (b) voor de
explosie en (c) de overgang/transitie in [bi].

Spectrogram
Het spectrogram geeft drie dimensies weer:
intensiteit (door middel van zwarting: hoe zwarter,
hoe intenser), frequentie (0 tot 5 kHz) en tijd (in seconden).
Het geeft de intensiteit van elke frequentie op een bepaald
moment weer. De blauwe cirkels geven de 5 formanten van
de klinker weer. Sonoranten worden weergegeven door
regelmatig gespatieerde verticale strepen. Ze hebben 5
donkere, horizontale banden. F0 is de zwarting aan de
onderrand, de formanten zijn F1, F2 etc. Als de energie
minder geconcentreerd is zijn het fricatieven. De witte
stukken zijn spreekopauzes of stemloze plofklanken. Hier zit
geen energie/intensiteit.

Formantsporen
Dit zijn afbeeldingen van automatisch geschatte formantwaarden.
Het voordeel is dat de formant niet met grijstinten wordt
weergegeven, maar op de verticale as. Dat is dus nauwkeuriger te
lezen. Het nadeel is dat de kans op fouten groot is. Daarom kan je
best het formantspoor met een spectrogram vergelijken.
8.2. Classificatie
In het oscillogram kan men redelijk betrouwbaar de grenzen van brede fonetische klassen bepalen. We
kunnen echter niet weten welke klank het is, alleen de wijze van articulatie en de stemgeving.
Klankidentificatie is wel mogelijk met een spectrogram met formantwaarden (klinkers),
formantovergangen (medeklinkers) en ruisverdeling (medeklinkers).

Klinkers
Deze klanken worden geclassificeerd aan de hand van hun formantwaarden. Hoewel het spectrum
tijdens het verloop van een klinker verandert, proberen we steeds 1 tijdstip te vinden waarop de
formanten voor die klinker hun meest karakteristieke waarden aannemen. Er zijn vier criteria om dit
meest representatieve tijdstip aan te wijzen: intensiteitsmaximum, F1-maximum, temporeel midden en
de positie van de geringste variatie in het formantspoor.

Tweeklanken
In het Nederlands worden 3 echte tweeklanken onderscheiden: / Tweeklanken bestaan uit
twee doelklanken, in de meeste gevallen zien we in een tweeklank alleen maar een verglijding (van
beginklank naar eindklank) en geen interval waarin de formanten stabiele waarden hebben. Er zijn nog
klanken die uit een sequentie van twee klanken bestaan, maar niet als echte tweeklanken worden
gezien. Bv.  en  Bij deze onechte tweeklanken is te zien hoe de formanten enige tijd stabiel
blijven en daarna vrij abrupt verglijden. Bij echte tweeklanken gebeurt die verglijding langzamerhand.

Medeklinkers
We proberen de klanken nader te classificeren, door gebruik te maken van twee informatiebronnen: het
spectrum van een bepaald signaalfragment en het verloop van specifieke kenmerken van dat spectrum in
de tijd (namelijk van de formanten).
Plofklanken: zijn herkenbaar op basis van formantbuigingen (transities) en spectrale kleuring van de
ruisexplosie. Er zijn twee transities mogelijk: een begintransitie (overgang van C naar V) en een
eindtransitie (overgang van V naar C). Het traject van de F1 is voor alle CVC-reeksen van uiterst laag naar
een hogere waarde voor de klinker en weer omlaag voor de volgende medeklinkers. Dit is voor alle CVC-
combinaties dus vrijwel gelijk, er is
weinig verschil te zien. F2-transities
stellen ons wel in staat om de
articulatieplaatsen uit elkaar te houden.
Daarbij is wel een groot verschil te zien
in het verloop afhankelijk van de
articulatieplaats. Zeker zo belangrijk als
de transities is de spectrale kleuring van
de ruisexplosie. Er zijn 3 fases bij de
productie van plofklanken: de
stilte/stembandtrilling, de explosie en
de overgang naar de volgende klinker. Fase A correspondeert met de obstructie en is moeilijk waar te
nemen. Fase B correspondeert met de explosie en
wordt bepaald door de resonantie van de voorste
holte. De ruiskleuring is afhankelijk van de plaats
van vernauwing. Bij [s] is er een hoogfrequente ruis,
bij [f] is de ruis meer verdeeld over heel het
spectrum.
9. Articulatie en fonetische
processen
9.1. Articulatie
In eerdere hoofdstukken zagen we hoe spraakklanken worden gerealiseerd en welke akoestische
effecten daarbij worden teweeggebracht door de subprocessen initiatie, fonatie en articulatie. We
zagen ook dat de akoestische effecten sterk beïnvloed worden door aangrenzende klanken.
Spraakklanken worden echter niet alleen beïnvloed door hun onmiddellijke klankomgeving maar ook
door andere externe factoren.
Spraakklanken worden in een gesprek nooit geïsoleerd uitgesproken. Daardoor ondergaan ze de invloed
van de klankcontext en externe factoren (bv. de stand van de articulatoren). Met de stand van de
articulatoren wordt bedoeld: de belasting van de articulatoren en de vervorming van het spraakkanaal.
Articulatoren compenseren afwijkingen van de gebruikelijke bewegingen. Bv. de globale taak is de
sluiting van de lippen. De specifieke uitvoering daarvan kan op verschillende manieren (bv. onderkaak
naar boven brengen) en met verschillende gekoppelde articulatoren (bv. actie van de lippen en kaak).
9.2. Coarticulatie
Coarticulatie is een proces dat letterlijk betekent: het gezamenlijk articuleren. Klanken vloeien in elkaar
over. De standen van de articulatieorganen veranderen niet sprongsgewijs van het ene segment naar het
volgende, maar er is sprake van een geleidelijke, vloeiende overgang. Bij dit proces van onderlinge
beïnvloeding van segmenten kan een aantal vragen worden gesteld: is de invloed taalspecifiek of eigen
aan het spraakmechanisme? Dit is deels universeel en deels taalspecifiek. Hoe meer klinkers in een taal,
hoe meer kans op misverstand tussen de klinkers en hoe minder coarticulatie. In welke richting gaat de
invloed? Deze vraag is niet eenduidig te beantwoorden. Verschillende modellen worden naar voren
geschoven. Bv. het Windowmodel waarbij er een tweezijdige beïnvloeding is tussen klanken.
9.3. Assimilatie
Bij assimilatie wordt een spraakklank in minstens 1 distinctieve eigenschap gelijkgemaakt aan een
buurklank, zonder dat die buurklank zelf in dat opzicht verandert. Bv. klapdeur. De /p/ verandert hier van
stemloos naar stemhebbend, er is 1 distinctief kenmerkt veranderd. Het is daardoor een wezenlijk
andere klank, een realisatie van een ander foneem, geworden. Dit is anders dan coarticulatie, waarbij er
sporen zijn van de buurklank, maar geen ander foneem. Assimilatie komt enkel voor op de woord- of
morfeemgrens, terwijl bij coarticulatie dit ook binnen morfemen/fonemen kan. Assimilatieprocessen
delen we in volgens 3 criteria: richting van de beïnvloeding, afstand tussen de assimilerende klanken en
de aard van het gewijzigde kenmerk.
Beïnvloedingsrichting: enkel de geassimileerde klank wijzigt, de dominante niet. Er is altijd eenzijdige
beïnvloeding. Bij anticipatie/regressieve assimilatie wordt de eerste klank beïnvloed, bij de
perseveratie/progressieve assimilatie wordt de tweede klank beïnvloed door de eerste.
Afstand tussen de assimilerende klanken: contactassimilatie heeft betrekking op onmiddellijk op elkaar
volgende klanksegmenten. Bv. feestdag, herfstblad. Bij assimilatie op afstand zijn twee klanken
betrokken die niet onmiddellijk op elkaar volgen. Klinkerharmonie is hier een voorbeeld van: een klinker
past zich in 1 of meer distinctieve eigenschappen aan een andere klinker aan ondanks de aanwezigheid
van een of meer tussenliggende medeklinkers.
Aard van het distinctief kenmerk:
assimilatieprocessen blijven voornamelijk
beperkt tot 1 distinctief kenmerk. O.a.
stemhebbendheid, articulatieplaats en
nasaliteit.
Assimilatie is in principe taalspecifiek (en coarticulatie slechts deels). Wat is de zin en de oorzaak van
assimilatie? Het vergemakkelijkt het spreken. Het is namelijk moeilijk om bv. stembanden te doen trillen
tussen 2 stemloze obstruenten in, en om
te verspringen van articulatieplaats bij
medeklinkers. Assimilatie heeft geen
invloed op de luisteraar. Woorden blijven
herkenbaar omdat slechts 1 kenmerk
verandert. Assimilatie en coarticulatie
komen samen voor. Verschillen tussen
de twee:
Assimilatie in het Nederlands is altijd
contactassimilatie. We delen de
verschijnselen in volgens twee criteria:
naar beïnvloedingsrichting van assimilatie
en naar het betrokken distinctieve
kenmerk.
9.4. Secondaire articulatie
Tot nu toe zijn we ervan uitgegaan dat
klanken slechts met 1 articulatieplaats
worden gerealiseerd. Het is echter ook
mogelijk dat de obstructie zich op twee plaatsen in het aanzetstuk voordoet. De obstructie met de
kleinste openingsgraad wordt de primaire articulatie genoemd, die met de grotere openingsgraad de
secondaire articulatie. Er worden 6 typen secondaire articulatie onderscheiden: labialisatie [bwoot],
labiodentalisatie, palatalisatie [wasje], velarisatie [n], faryngalisatie en laryngalisatie.
9.5. Reductie
Wanneer de communicatieve omstandigheden geen hoge eisen stellen aan de akoestische definitie van
het spraakgeluid, hebben sprekers de neiging om te bezuinigen in aantal en aard van de
klanksegmenten. Klanken worden korter, lijken meer op elkaar of verdwijnen etc. Dit heet reductie.
Volledig wegvallen van klanken (elisie) treffen we vooral aan bij medeklinkers in clusters. Bv. wist je en
/h/ in de onbeklemtoonde syllaben. Ook klinkers kunnen lijden onder reductie. Volle klinkers verliezen
wat van hun kleur en komen dichter bij elkaar te zitten. Ze tenderen in de richting van de neutrale klinker
sjwa. De sjwa zelf kan volledig verdwijnen, zoals bij d’ ouwe tram. Relatief betekenisloze woorden (zoals
eigenlijk en natuurlijk) zijn extreem gevoelig voor reductie. Ze worden sterk gereduceerd door
reductieprocessen zoals weglaten van sonoranten op het einde van de lettergreep, verbleken van
klinkers tot sjwa of weglaten, enkel produceren van beginmedeklinker, beklemtoonde klinker en
slotmedeklinker. Het mechanisme dat hieraan ten grondslag ligt, is goed voorstelbaar. We nemen aan
dat er een grondvorm is (canonieke/citatievorm), die alleen bij zorgvuldige uitspraak van losse woorden
wordt gerealiseerd. Door bezuiniging in aard en aantal klanken lijken de klanken meer op elkaar, worden
ze korter uitgesproken of verdwijnen ze.
9.6. Andere fonetische processen
Andere fonetische processen komen zowel diachroon (door de tijd heen) en synchroon (in 1 relatief kort
tijdsinterval) voor of als gevolg van een spraakstoornis. Voorbeelden:
Debuccalisatie: verplaatsing van de mind naar de glottis. Het omgekeerde verschijnsel, buccalisatie,
komt niet vaak voor.
Lenitie: veel voorkomen proces, zowel diachroon, synchroon en als resultaat van een spraakstoornis. Het
is een overkoepelende term voor processen als voicing, debuccalisatie en degeminatie. Voicing is het
stemhebbend maken van stemloze medeklinkers, spirantisatie is de plofklank vervangen door een
fricatief, en degeminatie is het verkorten van een dubbele medeklinker. Dit laatste is het
tegenovergestelde van geminatie.
Initial articulatory strenghtening: de beginmedeklinker is langer dan de eindmedeklinker. Bv. die pin vs.
diep in.
10. Waarneming van spraak
10.1. Inleiding
Spraakwaarneming is geluidswaarneming. De waarneming van spraak verloopt vooral via het gehoor.
Akoestisch gezien is spraak, en geluid in het algemeen, niets anders dan kleine, snel op elkaar volgende,
verstoringen van de luchtdruk. Zulke trillingen worden in ons oor omgezet in zenuwimpulsen, die onze
hersenen vertellen dat er geluid klinkt. De waarneming gebeurt soms ook door visuele cues: dit is het
McGurk Effect, een auditieve illusie.
10.2. Gevoeligheid van het gehoor
Welke veranderingen in het fysisch signaal leiden tot welke verandering in gehoorsindruk? Dit is het
gebied van de psychofysica en de
psychoakoestiek.
Er is echter geen een-op-eenrelatie tussen de
eigenschappen in de drie domeinen. Zo is de
waargenomen luidheid van een klank niet
alleen afhankelijk van de intensiteit en
spectrale helling, maar ook van de
grondfrequentie, en zelfs van de tijdsduur.

Hoorbaarheid van verschillen
Het kleinst mogelijk toch hoorbaar verschil heet een verschildrempel/just noticeable difference. Dit JND
wordt gedefinieerd als het kleinste verschil tussen twee paarsgewijs aangeboden geluiden op grond
waarvan 75% van de luisteraars kan horen dat de twee geluiden niet identiek zijn.
Grondfrequentie: om te kunnen horen dat er een toonhoogteverschil bestaat tussen twee
spraakklanken, moet het verschil in grondfrequentie minstens 0,3 tot 2,5% bedragen.
Intensiteit: het verschil moet minstens 1 dB zijn om gehoord te worden.
Duur: er moet een duurverschil zijn van minstens 10%.
Formantfrequentie: om te horen dat twee klinkers verschillen in timbre moet de frequentie van de F 1
minstens 14 Hz verschillen of die van de F2 minstens 1,5%.
10.3. Maskeringsverschijnselen
De aanbieding van een toon maakt het oor ongevoelig voor naburige frequenties. We zeggen dan dat de
ene toon de andere maskeert. Bij gelijktijdige maskering maakt een toon een andere toon die simultaan
in het geluid aanwezig is, minder hoorbaar. Een lage toon maskeert een hogere toon sterker dan
omgekeerd, en hoe meer de geluiden op elkaar lijken, hoe groter het maskeringseffect. Bij ongelijktijdige
maskering beïnvloedt een eerdere klank de waarneembaarheid van de volgende klank of vice versa. Het
gehoor kan korte tijd uitgeschakeld worden door krachtig geluid. Dit heet voorwaartse
maskering/namaskering. Hoe meer geluiden op elkaar lijken, hoe krachtiger het effect. De duur van
ongevoeligheid duurt ongeveer 200 ms. De voorwaartse maskering is een effectief wapen tegen
galm/echo.
10.4. Waaraan herkennen we de diverse spraakklanken?

Verschillen tussen klinker en medeklinker
Klankkleur: klinkers hebben duidelijke formanten. Er zijn ook sonorante medeklinkers die een goed
gemarkeerde formantstructuur hebben (/w/, /j/, /l/, /r/, /n/, /m/,…): daarbij moeten we dan rekening
houden met andere kenmerken.
Geluidssterkte < intensiteit: klinkers zijn luider dan medeklinkers.
Toonhoogte < stemhebbend: stemhebbende klanken hebben een duidelijke toonhoogte. Toch zijn ook
gefluisterde klanken te herkennen.

Verschillen tussen klinkers
Frequenties: tweeklanken herkennen we door een relatief langzame verandering van de richting van de
formantfrequentie.
Duur: er zijn korte en lange klinkers.
Duur en frequentie worden tegelijk beoordeeld. Daardoor kan een zeer kort uitgesproken [a] toch als []
worden waargenomen en vice versa.

Verschillen tussen medeklinkers
Obstruenten (fricatieven en plosieven): bij de articulatie is er sprake van vernauwing of obstructie. Er
wordt dan stilte en/of ruis waargenomen. In beide gevallen ontbreekt de formantstructuur die
kenmerkend is voor klinkers. Blij plofklanken veroorzaakt de obstructie stilte. Als de explosie komt,
veroorzaakt dat duidelijk waarneembare ruis die ongeveer 10 ms duurt. Deze klank is gekleurd (F2) op
basis van de plaats van obstructie, en de ruis stimuleert verschillende delen van het basilair membraan
afhankelijk van de plaats van obstructie. De formantstijging of –daling is hoorbaar, en ontstaat door
beweging naar klinkerstand. De duur van de beweging van medeklinker naar klinker bedraagt 30 tot 100
ms. Vooral F2 verraadt de plaats van obstructie. Het verschil tussen stemhebbende en stemloze
plofklanken wordt niet gehoord op basis van de toonhoogte/stembandtrilling, maar wel door de duur
van de stilte. Bij stemloze plofklanken duurt dit langer dan bij stemhebbende. Dit wordt ook gehoord
door de duur en intensiteit van de ruis (dus van de explosie) en de snelheid van formantverandering voor
en na de stilte. Bij stemloze plofklanken gaat dat sneller.
Het grootste verschil tussen plofklanken en fricatieven is dat het formantloze interval bij wrijfklanken
wordt opgevuld met ruis. Er is ook geen duidelijke formantstructuur. De ruis is vergelijkbaar met die van
stemloze plofklanken op het einde van de stilte, maar de ruis van de fricatieven duurt langer en de inzet
is geleidelijker. Het onderscheid tussen stemhebbend en stemloos wordt niet gemaakt op basis van
toonhoogte, maar op basis van duur en intensiteit van de ruis. Die is groter bij stemloze fricatieven.
Sonoranten: bezitten wel zo’n formantstructuur, maar hun
intensiteit is zwakker dan die van klinkers. Bij nasalen blijft
tijdens de afsluiting in het mond-keelkanaal de doorgang naar
de neusholte open, waardoor in het frequentiegebied tot
1000 Hz nog vrij veel intensiteit hoorbaar blijft. De nasalen
/m/, /n/, en /õ/ hebben ongeveer hetzelfde neusgeluid, maar
verschillen door de kleuring voor en na de mondsluiting (F2).
De halfklinkers /w/ en /j/ hebben dezelfde formantstructuur
als de echte klinkers /u/ en /i/, maar de medeklinkervarianten hebben een geringere intensiteit. Zij
worden ook gekenmerkt door relatief trage formantveranderingen kort voor en kort na de vernauwing.
De liquidae /l/ en /r/ lijken sterk op elkaar. Ze hebben beide een duidelijke formantstructuur, een
geringere intensiteit dan echte klinkers (voornamelijk in de hogere formanten) en de
formantveranderingen van liquidae naar klinkers en terug zijn
duidelijk. Bij de /l/ lopen de F2 en de F3 tijdens de afsluiting vrij
sterk uiteen om bij de overgang naar de volgende klinker weer naar
elkaar toe te bewegen. De /r/ herkennen we vooral aan een
verlaging van de F3.
De /h/ lijkt sterk op de klinkers waaraan hij wordt vastgesproken,
met vrijwel dezelfde formantstructuur, maar met geringere
intensiteit. Het verschil tussen gefluisterde klinkers en /h/ is niet
spectraal zichtbaar, maar er is wel een abrupte inzet bij de klinker.
10.5. De rol van de gesproken context
De context helpt bij klankidentificatie. Er zijn drie soorten contextinformatie:
Spectrale normering: de identificatie van losse klanken is makkelijker als vooraf een korte
kennismakingszin wordt aangeboden.
Temporele normering: de identificatie van lange en korte klanken in relatie tot de duur van de klanken
die volgen op de te identificeren klank.
Coarticulatie: individuele klinker zijn minder goed te identificeren dan de klinker in een CVC-structuur.
Klanktransities geven meer informatie dan het spectraal midden van de klank.
10.6. Is spraak bijzonder?
Spraakgeluiden worden op een andere manier verwerkt dan niet-spraakgeluiden. Hier bespreken we
enige evidentie voor dit standpunt.

Rechteroorvoordeel
Spraakgeluiden worden sneller herkend als ze worden aangeboden via het rechteroor. Nietspraakgeluiden worden echter sneller herkend via het linkeroor. Dit komt omdat het rechteroor in
verbinding staat met de linker hersenhelft.

Categoriale waarneming
In een identificatietaak moeten luisteraars bepalen of ze /ba/ of /da/ horen. Er worden 8 verschillende
klanken aangeboden: de eerste is /ba/ en de laatste /da/. Daartussen gaan de klanken geleidelijk aan
met discrete verschillen meer naar /da/ en minder naar /ba/.
In een discriminatietaak worden paren gemaakt van steeds twee minimaal verschillende lettergrepen.
Luisteraars moeten zeggen of ze wel of geen verschil kunnen horen tussen de lettergrepen van elk paar.
Het blijkt dat luisteraars alleen goed kunnen horen dat die lettergrepen van elkaar verschillen als die
eerder waren ingedeeld in verschillende categorieën /ba/ en /da/. Paren ingedeeld in dezelfde categorie
zijn dus niet te onderscheiden.

Andere modellen
Cue trading: de kleur en de duur van de klinker bepalen het verschil tussen lang en kort. De kleur kan
compenseren voor de duur (een kort uitgesproken klinker kan toch lang lijken door verandering van
klankkleur).
Motortheory/speech perception: waargenomen klanken worden geïdentificeerd op basis van
articulatorische eigenschappen.
11. Herkenning van gesproken woorden (spraakketen: verstaan)
11.1. Inleiding: herkennen in het algemeen
Verstaan is het herkennen van taaleenheden in het spraakgeluid in hun volgorde. Een morfeem is het
kleinste teken in onze taal met vorm en betekenis. Het is cruciaal voor de interpretatie van spraak. Een
zin is een aaneenschakeling van woorden/morfemen. We staan kort stil bij de principes van herkenning.
We kunnen alleen objecten herkennen die we kennen. Woordherkenning impliceert dat het woord in
het mentale lexicon zit.
Herkennen kan op basis van partiële informatie, niet alle informatie moet er zijn om een woord te
herkennen.
De context helpt/stuurt de herkenning.
11.2. Modellen voor woordherkenning
De gemiddelde spreker van het Nederlands kent 50000 woorden, dit betekent dat hij die woorden
passief herkent. De gemiddelde spreekduur van een woord is ongeveer 500 ms. Woordherkenning is dus
vliegensvlug een woord selecteren uit de woordenschat.
Geschreven woorden worden herkend door spaties, aanbieding van het volledige woord en de
mogelijkheid tot terugkijken.
Gesproken woorden lopen in elkaar over (assimilatie & coarticulatie) bv. I scream of ice cream? Het
woord wordt sequentieel aangeboden. Het is een vluchtige presentatie, want 1 syllabe duurt ongeveer
250 ms. Geluid van een kwartseconde blijft even in het auditief geheugen. Om al deze redenen moet
woordherkenning eigenlijk starten voordat het woord volledig is uitgesproken.
We maken modellen om een idee te kunnen vormen over hoe iets werkt. We kennen de input (geluid
dat oor binnenkomt) en de output (reproductie van klank) van het herkenningssysteem, en met deze
psycholinguïstische modellen proberen we aan te geven hoe de relatie tussen deze twee ligt.

Het logogenmodel
De hersenen bevatten herkenningseenheden (logogenen). Elk logogen herkent 1 specifiek woord, dus de
mens bevat ongeveer 50000 logogenen. Elk binnenkomend woord wordt tegelijkertijd aan elk logogen
voorgelegd. Daarom behoort dit model tot de klasse van parallelle verwerkende systemen. Een logogen
bevat interne specificatie van de woordvorm (fonemen, grafemen, braille,…) en semantische en
syntactische kenmerken (woordsoort, betekenis,…). Elk logogen bevat ook een graadmeter die op ieder
moment aangeeft wat het activatieniveau van het logogen is. Als er spraakgeluid binnenkomt, dan lopen
de niveaus op van alle herkenningseenheden die in het geluid iets horen dat past bij hun interne
specificatie. Als we het begin van het woord kat horen, dan zal voor alle logogenen die als eerste klank
een [k] hebben, het activatieniveau oplopen, niet alleen dat van kat. Bij het voortschrijden van het woord
daalt het activatieniveau van de logogenen die niet passen.
Het logogenmodel bevat ook een vuurdrempel. Als het activatieniveau van het logogen meer dan deze
kritische waarde uitstijgt boven dat van zijn naaste concurrenten, vuurt het logogen. Op dat moment
wordt het woord dat in het logogen gespecifieerd is, herkend en komt alle informatie die in het logogen
ligt opgeslagen, beschikbaar. Als een logogen vuurt, dan dalen de actieniveaus van alle concurrenten
onmiddellijk naar hun rustpositie. Het actieniveau van het gevuurde logogen daalt ook, maar veel
langzamer. Op die manier krijgen woorden die nog maar kort geleden gehoord zijn, een voorsprong op
de andere woorden. Woorden die we in ons leven vaak of maar net gehoord hebben, de hoogfrequente
woorden, hebben een voorsprong op laagfrequente woorden. Ze worden dus sneller herkend.
Elk logogen ontvangt informatie van 2 kanten. We onderscheiden 2 informatiestromen: bottom-up
informatie (zintuiglijke informatie, het spraakgeluid zelf) en top-down informatie (kennis van taal en de
wereld). Beide informatiestromen beïnvloeden het activatieniveau van de logogenen.
Het logogenmodel laat ons ten slotte begrijpen hoe we ook langere woorden succesvol kunnen
herkennen, ook al moeten de laatste klanken nog binnenkomen en zijn de beginklanken al uit ons
auditief geheugen vervaagd. De spraakklanken dragen niet rechtstreeks bij tot de herkenning van
woorden, zij verhogen slechts de activatie van een aantal herkenningseenheden. Daarna hebben ze hun
werk gedaan en kunnen ze probleemloos vergeten worden. Het model sluit niet uit dat woorden ook
herkend kunnen worden op basis van fragmentarische informatie. Een voor de hand liggend woord kan
al aan zijn drempel komen als pas 1 of 2 klanken van dat woord zijn gehoord.
Er zijn echter ook nadelen aan het logogenmodel: het model is tamelijk onspecifiek. Het vertelt ons niet
precies op welk punt in de tijd, na het horen van hoeveel spraakgeluid, de luisteraar het woord zal
herkennen. Het is ook inefficiënt. De logogenen reageren alleen op passende, positieve informatie,
waardoor de activatieniveaus alleen maar kunnen stijgen en zolang er niet gevuurd is, nooit kunnen
dalen.

Het cohortmodel
Woordherkenning verloopt hier in 3 fasen.
Prelexicale activatiefase: in deze fase worden alle woorden geactiveerd. Het begincohort wordt
geactiveerd. Alle woorden waarvan de beginklanken overeenkomen met het in de eerste 200 ms
gehoord spraakgeluid, worden actief. Alle andere woorden gaan terug in de ruststand. Het begincohort
wordt geactiveerd op basis van positieve (passende) informatie en zintuiglijke informatie (bottom-up).
Lexicale selectiefase: bij meer binnenkomende informatie worden inadequate cohorten stelselmatig
geïnactiveerd. Dit werkt op basis van negatieve (niet-passende) informatie. Indien er geen concurrenten
zijn, wordt het woord provisorisch herkend.
Postlexicale verificatie- en integratiefase: in deze fase wordt nagegaan of het voorlopig herkende woord
de correcte oplossing is. Dit werkt op basis van semantische en syntactische context (top-down). Bij
fouten moet het systeem herstel doorvoeren.
Het uniekheidspunt (UP) is het vroegste punt waarop een woord herkent wordt. Dit punt ligt vaak voor
het einde van het woord, waardoor het woord al herkend is voor het beëindigd is. Vooral bij langere
woorden gebeurt dit, ze zijn makkelijker te herkennen dan korte. Ze bevatten een grotere lexicale
redundantie.

Het aangepaste cohortmodel
Het oorspronkelijke model had 2 problemen: enerzijds dat het faalt als het eerste foneem onduidelijk is.
Na de aanpassing konden kandidaten ook later worden toegevoegd. De activatie was niet meer alles of
niets, maar gradueel. Het eerste model kon ook de frequentie-effecten niet verklaren. Daarom is in het
aangepaste model deactivatie moeilijker voor hoogfrequente dan voor laagfrequente woorden.

Het Neighborhood Activation Model
Woordherkenning is het product van twee informatiestromen: stimulusinformatie (bottom-up) en de
structuur van het mentale lexicon (top-down). Dit model is enkel gericht op herkenning van losse,
monosyllabische woorden. Naburige woorden in het mentale lexicon worden sneller verward. Het
lexicon is opgebouwd uit neighborhoods/buurten. Dit is de groep van woorden in het mentale lexicon
die op een bepaald punt in het herkenningsproces concurrenten zijn van het stimuluswoord. Woorden
binnen 1 neighborhood zijn in hoge mate met elkaar verwarbaar, omdat ze sterk op elkaar lijken. Een
neighborhood bestaat uit alle woorden in het lexicon die in 1 enkele klank verschillen van het
stimuluswoord. Een verschil kan bestaan uit een klankinsertie (toevoeging), -deletie (weglating) of –
substitutie (vervanging). Korte stimuluswoorden hebben veel meer buren, dus een grotere
neighborhood.
Hoeveel buren een woord heeft, valt op voorhand echter niet te zeggen. Dat hangt mede af van de
geluidskwaliteit van de stimulus en de luisteromstandigheden. Het NAM stelt dat de woordherkenning
meer tijd en moeite kost naarmate er meer en aantrekkelijker alternatieven in de race zijn. De
aantrekkelijkheid wordt bepaald door de mate van gelijkheid en door de gebruiksfrequentie.

Het Trace-model
Dit model is gebaseerd op het idee van een neutraal netwerk. Dit is een computersimulatie van
architectuur van het menselijke centrale zenuwstelsel. Zo’n neutraal netwerk bevat rijen cellen op drie
niveaus en associatiebanen (verbindingen tussen de cellen). Voor ieder distinctief kenmerk is er een
gespecialiseerde kenmerkdetector, fonemen worden geactiveerd bij een geheel van distinctive features
(dus bij een foneem), en dan zijn er nog woorden. De information flow bestaat uit top-down en bottomup informatie, en binnen de lagen is er laterale inhibitie (de activatie van een herkenningscel leidt tot
onderdrukking of blokkering van een concurrerende herkenningscel die ernaast ligt).
11.3. Woordherkenningstaken
Modellen moeten getoetst kunnen worden. Het bewijs voor deze modellen wordt gezocht in
herkenningstaken. We proberen vragen te beantwoorden: wanneer wordt een woord herkend en hoe
zien we het verschil tussen moeilijke en makkelijke herkenning? Er zijn enkele experimentele technieken
die in de praktijk van het onderzoek bij dit type vragen gebruikt worden. Daarbij maken we een
onderscheid tussen off-line en on-line herkenningstaken.
Bij off-line taken krijgt de proefpersoon gelegenheid na te denken over wat hij gehoord heeft. Zijn taak is
dan op te schrijven of te zeggen welk woord hij denkt gehoord te hebben. We kunnen zo vaststellen wat
een proefpersoon denkt gehoord te hebben en of de herkenning juist of fout is, maar niet wanneer er
iets herkend is.
Bij on-line herkenningstaken zijn we niet alleen geïnteresseerd in de uitkomst van het
herkenningsproces, maar vooral in de voortgang van het proces. We vragen de proefpersoon
beslissingen te nemen over wat hij hoort, zonder dat we hem expliciet vragen welk woord hij herkend
heeft. Hij kan alleen antwoorden op het moment dat hij een woord herkent heeft. Zo komen we op een
indirecte manier achter het herkenningsmoment.

Lexicale decisie
Bij deze taak hoort de proefpersoon klankreeksen die soms wel en soms niet bestaande woorden in zijn
taal vormen. Hij heeft twee drukknoppen voor zich, en moet zo snel mogelijk op de ene knop drukken als
de klankreeks een bestaand woord vormt, en zo snel mogelijk op de andere als het geen woord is. Er
wordt een tijdmeting gestart, die stopt zodra de proefpersoon op een van de knoppen drukt. De
proefpersoon kan pas weten of de klankreeks een bestaand woord is, als hij dat woord herkend heeft.
Hoe sneller de proefpersoon correct beslist, des te gemakkelijker werd dat woord dus herkend. Zo wordt
dus vastgesteld dat de beslissingstijden op hoogfrequente woorden korter zijn dan die op laagfrequente
woorden. Deze taak biedt evidentie voor het frequentie-effect en het neighborhood-effect.

Detectie-/monitortaken
De proefpersoon krijgt de opdracht om zo snel mogelijk op een knop te drukken als hij een bepaalde
vooraf gespecifieerde klank hoort. Proefpersonen zijn pas bereid op te knop te drukken als zij het woord
waarin de doelklank zit, in zijn geheel herkend hebben. Proefpersonen horen echte woorden en
nonsenswoorden. We zien bij echte woorden dat het langer duurt voor ze afdrukken als de doelklank aan
het einde van het woord zit. Bij nonsenswoorden maakt dat geen verschil. Op deze manier heeft men
kunnen vaststellen dat het herkenningsmoment van woorden niet valt aan het einde van de klankreeks,
maar op het punt binnen de klankreeks waar het woord voor het eerst uniek onderscheiden is van de
rest van het lexicon (het UP), en dat het herkenningspunt verder naar voren schuift naarmate een woord
voorspelbaarder is gegeven zijn voorafgaande context.

Cross-modal priming
Wanneer een woordherkenningseenheid (logogen) W verhoogd actief is, worden ook alle
herkenningseenheden van woorden die met W verwant zijn, verhoogd actief. Dit wordt spreiding van
activatie genoemd. Bij het horen van bv. kapitein worden ook schip en anker actief. Omdat een herkend
woord nog lang nadat het gevuurd heeft, verhoogd actief blijft, kunnen de meegeactiveerde woorden zo
gemakkelijk herkend worden als ze in het latere zinsverband inderdaad ter sprake komen. Dit wordt
priming genoemd. In de vroege fasen van het herkenningsproces zijn echter meerdere
herkenningskandidaten tegelijkertijd actief. Stel, je hoort . Via spreiding van activatie zijn niet
alleen woorden die verwant zijn met kapitein verhoogd actief, maar ook de woorden die verwant zijn
met andere nog mogelijke herkenningskandidaten, zoals bank en geld wegens kapitaal. Als de volgende
klank binnenkomt, dooft de activatie van de andere actieve concurrenten uit. We voorspellen dus dat het
woord geld gemakkelijker herkend wordt voordat de // gehoord is, dan daarna.
Deze stelling kunnen we toetsen door een proefpersoon 2 dingen tegelijk te laten doen. Hij voert een
visuele lexicale decisietaak uit, terwijl hij luistert naar spraak. Hij zal sneller beslissen dat geld een correct
woord is als hij op dat moment de nog niet gehoord heeft. Een fractie van een seconde later, als
kapitaal niet meer actief is, is het priming effect voor geld verdwenen. Informatie uit de auditieve modus
wordt hier gebruikt om een taak in de visuele modus beter uit te voeren. Daarom wordt hier gesproken
van een crossmodale techniek. Zo kunnen we nagaan welke woorden in de diverse fasen van het
herkenningsproces als herkenningskandidaten door de luisteraar overwogen worden.

Woordaanvultaak (gating)
Een proefpersoon hoort een klein stukje van een woord, en moet dan raden van welk woord hij een
stukje heeft gehoord. De eerste keer lukt dat bijna nooit. Daarna krijgt de luisteraar een wat groter
stukje van hetzelfde woord, en mag hij nog eens proberen. Dit wordt herhaald tot de proefpersoon het
woord herkent. De luisteraar kan het hele woord al aanvullen als hij slechts de geluidsinformatie tot aan
het UP gehoord heeft.

Eyetracking
Het registreren van oogbewegingen is een interessant alternatief voor op een knop drukken (wat men in
het echte leven bijna nooit doet). De proefpersoon luistert naar spraak en kijkt tegelijkertijd naar een
beeldscherm. Op het scherm ziet hij plaatjes van bv. vier voorwerpen. Drie van de voorwerpen hebben
als woord gedeeltelijk overlappende klankreeksen, bv. bank, bal en bas. Bank is het doelwoord, bal is een
hoogfrequente afleider en bas een laagfrequente. Het vierde woord is ongerelateerd, bv. tijger. De
proefpersoon moet zo snel mogelijk, zonder fouten te maken, het plaatje aanwijzen waarvan hij de naam
hoort: bank. De plaatjes worden zichtbaar op het moment dat de beginklank van het gesproken woord
hoorbaar is. De proefpersoon richt zijn blik niet op de ongerelateerde afleider, en kijkt meer naar de
hoogfrequente afleider dan naar de laagfrequente. Zijn ogen verspringen zodra het klankverschil hem in
staat stelt tot beslissen.
Download