Taal en cognitie: optimaliteitstheorie

advertisement
Taal en cognitie:
Optimaliteitstheorie
Henriëtte de Swart
uitgangspunten
• Taalkunde theorie: representatie van
impliciete kennis van de moedertaalspreker
(competence)
• Morfologie, Syntaxis: gericht op ‘harde’
symbolische regels, generatie
• Algoritme bepaalt welgevormdheid.
• Creativiteit, oneindige recursie.
Taalvariatie
• Taalvariatie: er zijn vele talen, die op allerlei
punten van elkaar verschillen (klanken,
vormen, lexicon).
• Taalverwerving: vermogen om taal te leren is
aangeboren, lexicon en specifiek grammaticale
kenmerken van moedertaal aangeleerd.
• Hoeveel kunnen talen onderling verschillen?
Taal en hersenen
• Generatieve grammatica (Chomsky):
modulaire structuur: syntaxis, morfologie,
fonologie zijn aparte modules van de
grammatica.
• Hersenen: parallel processing.
• Kunnen we een taalkundige theorie bouwen
die in principe te implementeren valt in
hersenen (cross-modulair)?
Optimaliteitstheorie
• Optimaliteitstheorie: optimale oplossingen
van strijdige regels in natuurlijke taal
Uitspraak van woorden (fonologie)
Zinsbouw: optimale uitdrukking van
bepaalde betekenis (syntaxis)
Optimale interpretatie in contekst
(semantiek)
Centraal principe: economie
• Least Effort: Praten kost minder moeite als
je een normale, makkelijke uitspraak van een
klank kiest in een bepaalde positie.
• ‘Liever lui dan moe’
• Van belang voor spreker.
Luie uitspraak: ontstemd
• stemloos:
t k f s ch p
stemhebbend: d g v z g b
• Stemhebbend is ‘speciaal’, ‘moeilijker’, eist
actie van de stembanden
• Stemloos is ‘normaal’, ‘makkelijker’,
vereist geen actie van de stembanden
• Ontstemd: Klanken zijn stemloos aan het
einde van een woord.
Hoorder economie: getrouwheid
• Getrouwheid: Een klankonderscheid moet
behouden blijven in de uitspraak.
• Bijvoorbeeld: Stemhebbende klanken
behouden hun stem in de uitspraak.
(Stemvast)
• Duidelijkhied:
Belang voor hoorder
Taalvariatie
• Verschillen in uitspraak tussen talen ontstaan
door verschillend ‘belang’ toegekend aan
bepaalde fonologische regels.
• Nederlands: Ontstemd >> Stemvast
• Engels:
Stemvast >> Ontstemd
• Dit kan alleen als regels ‘soft’ zijn en
geschonden mogen worden.
Nederlands
hoed
[hoed]
 [hoet]
ONTSTEMD STEMVAST
*
*
Engels
hood
STEMVAST ONTSTEMD
 [hood]
[hoot]
*
*
Balans spreker-hoorder
• Voor spreker is ontstemd gemakkelijker,
voor hoorder is stemvast duidelijker.
• Nederlands kiest op een onderdeel voor een
makkelijke uitspraak.
• Engels kiest op dat punt voor een duidelijke
uitspraak.
Basisprincipes
• OT beschouwt grammatica als relatie tussen
input en output ( neuraal netwerk).
• GEN: genereert mogelijke kandidaten voor
gegeven input ( activatiepatronen).
• Output: optimale kandidaat wint, alle andere
kandidaten suboptimaal ( harmonische situatie
stabiel netwerk).
• Gelijktijdige evaluatie van alle regels ( parallel
processing)
Patroonherkenning
• Gezichtsherkenning
• Muziek
• Herkenning van
handgeschreven letters
Handgeschreven letters
• Is dit een A of een H?
• Vraag niet te beantwoorden zonder contekst
Letters in contekst
• Letters in contekst zijn niet ambigu
Patroonherkenning =
optimalisatieproces
• Een waargenomen patroon wordt opgedeeld in
samenstellende kenmerken
• Kenmerken wijzen in de richting van bepaalde
letters
• Kenmerken blokkeren keuze voor een bepaalde
letter
• Neurale netwerken modelleren optimizatie
proces – computationele toepassingen.
Patronen versus regels
• Optimalisatie in contekst versus
Symbolische regels
• Is er sprake van volledig gescheiden
cognitieve processen?
• OT: het verschil is niet zo groot als het lijkt:
combinatie van symbolische en
subsymbolische processen.
Taalvariatie in syntaxis
•
•
•
•
Het regent.
[Nederlands]
Piove.
[Italiaans]
Wat regent er?
Waarom hebben alle Nederlandse zinnen
een onderwerp, en hoeft dat in het Italiaans
niet?
Conflicterende regels
• Onderwerpregel: Alle zinnen hebben een
onderwerp.
• Betekenisregel: alle elementen uit de zin
hebben betekenis.
• Onderwerpregel >> Betekenisregel (Nl)
• Betekenisregel >> Onderwerpregel (It).
Nederlands
Betekenis 
Regent
Het regent
Onderwerp
Betekenis
*

*
Italiaans
Betekenis 
Piove
‘Het’ piove
Betekenis

Onderwerp
*
*
Prince en Smolensky (1993)
• Taal wordt gestuurd door proces van optimalisatie
• Er zijn wel regels, maar die zijn niet hard
• Schending van taalregels mag om te voldoen aan
een sterkere regel
• Grammatica: verzameling potentieel strijdige
taalregels.
• Taalvariatie: talen verschillen in ordening van
regels
Parallel met neurale netwerken
• OT is geen directe modellering van taal in een
neuraal netwerk: combinatie van symbolische
en subsymbolische noties.
• Symbolische regels (constraints).
• ‘harmonisch’ patroon van activatie van netwerk
(evaluatie constraints onder ordening)
• gespiegeld in ‘harmonische’ uitkomst van
combinatie van conflicterende regels.
Optimalisatie van interpretatie
• Zes sollicitanten werden uitgenodigd voor
een gesprek.
Drie werden afgewezen.
Drie welke?
• Zes sollicitanten werden aangenomen
Drie werden afgewezen.
Drie welke?
Liever anaforisch
• DOAP:
Do not overlook anaphoric possibilities
Mogelijkheden voor een anaforische
interpretatie moet je gebruiken
Drie = sollicitanten,
niet ‘anderen’
Conflicterende regels
• ANTECEDENTREGEL
Kies als het antecedent van een incomplete
NP de verzameling AB van de voorgaande
zin
• Zes sollicitanten werden uitgenodigd voor
een gesprek. Drie werden afgewezen.
Drie = drie van de sollicitanten die werden
uitgenodigd voor een gesprek
Gezond verstandregel
• Zes sollicitanten werden aangenomen. Drie
werden afgewezen.
Drie  drie van de sollicitanten die werden
aangenomen.
• GEZOND VERSTANDREGEL
Vermijd tegenstrijdigheden
Drie = drie andere sollicitanten
Ordening
Gezond Antecedent DOAP
verstand regel
Drie van de sollicitanten
die werden aangenomen
werden afgewezen
Drie andere sollicitanten
werden afgewezen

Drie andere mensen
werden afgewezen
*!
*
*
!*
Anafora resolutie
• Als ik met een dokter praat, is de dokter het
vaak met hem oneens.
Wie is hem?
• Als ik met een dokter praat, is de dokter het
vaak met zichzelf oneens.
Wie is zichzelf?
hem versus zichzelf
• Reflexieve en niet-reflexieve pronomina
• PRINCIPE B
Als twee argumenten van dezelfde
semantische relatie niet zijn gemarkeerd als
identiek, interpreteer ze dan als
verschillend.
Ordening
input
output
Als ik met een
dokter praat is
de dokter het
vaak met hem
oneens
een dokter1 de dokter1 hem1
PrincB DOAP
*!
 een dokter1 de dokter2 hem1
 een dokter1 de dokter1 hem2
een dokter1 de dokter2 hem2
Als ik met een  een dokter1 de dokter1 zichzelf1
dokter praat is
een dokter1 de dokter2 zichzelf1
de dokter het
een dokter1 de dokter1 zichzelf2
vaak met
zichzelf oneens
een dokter1 de dokter2 zichzelf3
*!
*
*
*
*!
*!
*!*
Consekwenties Taalverwerving
• Twee klassen constraints:
• Markedness: vermijd structuur (‘liever lui
dan moe’). b.v. ONTSTEMD
• Faithfulness: respecteer input
(‘getrouwheid) b.v. STEMVAST
Verschil begrip/productie
• Volwassenentaal
faithfulness > markedness
/trein/  trein
/tijn/  tijn
• Kindertaal
markedness > faithfulness
/trein/  tein
/tijn/  tijn
Reflexieven en pronomina
• Productie: 100% goed (v.a.  3 jaar)
• Begrip: reflexieven 100% goed (v.a.  3
jaar), pronomina coreferentie OK tot  6,6
jaar. Waarom?
• Berti zag zichzelfi/*k.
• Berti zag hem*i/k. (volwassentaal)
• Berti zag hemi/k. (kindertaal)
Semantische variatie
• Tot nu toe hebben we variatie gezien in
fonologische ordeningsregels. Er is ook
variatie in syntactische ordening.
• Is er ook sprake van semantische variatie
die we kunnen beschrijven in OT?
DN and NC
Nobody said nothing. (Eng)
xy
Niemand zei niets. (Dutch)
xy
Nadie miraba a nadie. (Spa)
xy
Nessuno ha parlato con nessuno. (Ital)
xy
• Personne n’a rien dit. (Fr)
ambiguous
•
•
•
•
Negatie in OT semantiek
FaithNeg: reflecteer non-affirmativiteit van
de input in de output.
• *Neg: vermijd negatie in de output.
• Universele ordening: FaithNeg >> *Neg.
• InterpretNeg (IntNeg): Elke neg
uitdrukkingen in de input levert een
negatieve betekenis in de output.
DN (Interpretatie)
Form
Meaning
neg+neg
x1x2
x1x2

x1x2
Niemand zei niets
FNeg
*
IntNeg *Neg
**
*
*
**
NC (Interpretatie)
Form
Meaning
neg+neg
x1x2
 x1x2
x1x2
Nadie miraba a nadie
FNeg
*Neg
*
IntNeg
**
*
**
*
Bi-directionaliteit
• Grammatica beschrijft relatie tussen vorm
en betekenis.
• Spreker rol: kies de beste vorm om de
gewenste betekenis over te dragen.
• Hoorder rol: kies de beste betekenis voor de
door spreker geproduceerde vorm.
• Bi-directionele OT: optimizatie over vormbetekenis paren.
Negatie in OT syntaxis
FaithNeg: reflecteer non-affirmativiteit van
de input in de output.
*Neg: vermijd negatie in de output.
• Universele ordening: FaithNeg >> *Neg.
MaxNeg: Elk indefiniet argument in het
bereik van negatie wordt gemarkeerd als
negatief.
DN (productie)
meaning
form
x1x2
indef+indef

FNeg
*Neg
*
neg+indef
neg+neg
Nederlands: Niemand zei iets
MaxNeg
**
*
*
**
NC (productie)
meaning
form
x1x2
indef+indef
FNeg
MaxNeg *Neg
*
neg+indef
 neg+neg
Spaans: Nadie ha dicho nada.
**
*
*
**
Negatie in bi OT
• FNeg >> MaxNeg >> *Neg >> IntNeg.
(NC talen: markering van negatie betekent
dat je negatie absorbeert in de semantiek)
• FNeg >> IntNeg >> *Neg >> MaxNeg.
(DN talen: iteratie van negatie in de
semantiek betekent dat je negatie niet op
alle argumenten markeert).
Taal en Cognitie (slot)
• Theoriën over taal moeten taalkennis inbedden in
cognitie.
• Theoriën over taal moeten taalkennis inbedden in
het brein.
• Verwevenheid van taaltheorie met
ontwikkelingen in neurocognitie
• Belang van experimentele evidentie
(taalproductie, processing, taalverwerving).
• Belang van computationele modellering
(toepassingen kennis in taalgebruik).
Download