Taal en logica

advertisement
Betekenis 2:
Compositionaliteit, bereik
en lambda’s
Henriëtte de Swart
onderwerpen
Vorige keer: predikaatlogica, vertaling
van zinnen.
Dit keer: uitbreiding van de
predikaatlogica met lambda’s, interne
structuur van zinnen, compositionaliteit,
kwantoren en bereik, idiomen.
Stof van vandaag
J&M hoofdstuk 18, maar niet 18.4 en
18.5
J&M Hoofdstuk 17,
sectie 17.3.3
Meer dan woorden…
Hoe wordt de betekenis van complexe
gehelen (constituenten, zinnen)
opgebouwd uit die van woorden?
‘Jan slaat Piet’  ‘Piet slaat Jan’
Woordvolgorde  Subject-Object relatie
 Agens-Patiens relatie.
Compositionaliteit
Principe van Compositionaliteit van
betekenis (Frege): de betekenis van het
geheel is een functie van de betekenis van
de samenstellende delen en van de manier
waarop ze zijn samengesteld.
zinsbetekenis = woordbetekenis + structuur
Dus: semantiek altijd afhankelijk van
syntaxis.
Ambiguïteiten
Ambiguë woorden: bank, baan.
Structurele ambiguïteiten: Jan zag de
man met de verrekijker. 2 betekenissen
~ 2 syntactische structuren.
Bereiksambiguïteiten: Er hing een vlag
bij iedere ambassade. 1 vlag of
evenveel vlaggen als er ambassades
zijn. Structurele ambiguïteit?
Semantische
representaties
Semantische representaties worden
geformuleerd in logische talen (b.v. 1e
orde propositie/predikatenlogica).
Logische talen respecteren principe van
compositionaliteit: regels voor
interpretatie volgen regels voor wffs.
Probleem I
Syntaxis natuurlijke taal  syntaxis 1e
orde predikaatlogica.
Eerste orde predikaatlogica is niet
voldoende om alle natuurlijke
taaluitdrukkingen te representeren.
Concreet: modificatie, kwantificatie over
predikaten, tweede orde kwantoren.
Modificatie
Joost is een Nederlandse taalkundige
T(j)  Nl(j)
Pim is een grote muis/
een kleine olifant
Niet: M(p)  Gr(p)
Niet: O(p)  Kl(p)
Kwantificatie over
eigenschappen
Jan heeft alle eigenschappen van
Sinterklaas.
P [P(s)  P(j).
Geen eerste orde logica!
In eerste orde logica alleen predikaat
constanten (geen predikaatvariabelen).
Tweede orde kwantoren
Alle studenten houden van taalkunde.
x [St(x)  Hvt(x)]
De meeste studenten houden van
taalkunde.
Niet: Mx [St(x)  Hvt(x)] waarom niet?
Niet: Mx [St(x)  Hvt(x)] waarom niet?
Probleem II
Probleem: syntaxis van natuurlijke taal
syntaxis van propositie/ predikatenlogica.
Is het wel mogelijk om een compositionele
interpretatie van natuurlijke taal te geven
m.b.v. deze logica’s?
1e orde logic en
compositionaliteit
Zinnen met individuele constanten/
variabelen: compositionele vertaling .
Hanna slaapt.
Hanna slaapt (S)
S(h)
/
\
/
\
Hanna h
Slaapt S
h
S
(NP)
(VP) functie applicatie
Kwantoren en
compositionaliteit
Zinnen met kwantoren: geen compositionele
vertaling. B.v. Iedere student danst.
Iedere student danst (S) xS(x)D(x)
/
\
Iedere student
Danst D
(NP)
(VP)
/
\
Iedere ?? student S
(Det)
(N)
Kwantoren en
compositionaliteit
Zinnen met kwantoren: geen compositionele
vertaling. B.v. Iedere student danst.
Iedere student danst (S) xS(x)D(x)
/
\
Iedere student ??
Danst D
(NP)
(VP)
/
\
Hoe komen we
Iedere ?? student S compositioneel
(Det)
(N)
van hier naar daar?
Lambda abstractie
Gebruik van lambda abstractie maakt
het mogelijk semantische representaties
te geven voor delen van een
syntactische boom, zodat we een
compositionele vertaling van de zin
kunnen geven.
Lambda abstractie ook met 2e orde
logica.
Essentie
1-plaatsige predikaten (praten, dansen,
student,…) denoteren verzamelingen.
Vertaling als predikaat: hoofdletters (P,
D,S,…).
Vertaling als lambda abstract: xP(x).
 bindt individuele variabele x.
 pikt alle waarden van x eruit die de formule
P(x) waar maken, en definieert daarmee de
verzameling van P’s (karakteristieke functie).
Lambda’s: formeel
Als  een formule is, en x een variabele
(die normaliter voorkomt in ), dan is
||x||M, g die functie h van het
universum U naar {0,1} zodanig dat
voor alle individuen e in U, h(e) = 1 als
||x||M, g[x/e] = 1, en h(e) = 0 anders.
Lambda conversie
Toepassing van lambda abstract op
constante/variabele leidt tot lambda
conversie: [x S(x)](h) = S(h)
x S(x): 1-plaatsig predikaat. Functie
applicatie: toepassen op individuele
constante h. Lambda conversie: deletie
van  en vervanging van x door h.
 conversie: formeel
Voor  een open propositie, en x een
individuele variabele die voorkomt in ,
en c een individuele constante, dan x
(c)  [c/x], waar [c/x] is de formule
 met vervanging van alle voorkomens
van x door c.
Compositionaliteit met 
Hanna slaapt
Hanna slaapt (S) xS(x)(h) = S(h)
/
\
functie applicatie
Hanna h
Slaapt xS(x)
(NP)
(VP)
Abstractie over
predikaten
Een kleine olifant x (K(O))(x).
een kleine olifant (NP) x(K(O))(x)
/
\
een ??
kleine olifant (A(N)) yK(O)(y)
/
\ functie applicatie
kleine (A)
olifant (N)
PyK(P)(y)
O
NPs als verzameling
eigenschappen
Hanna: h (individuele constante)
Hanna: P P(h) (bundel eigenschappen
Hanna slaapt: S(h)
Slaapt(Hanna): x S(x)(h) = S(h)
‘Hanna is een slaper.’
Hanna(Slapen): P P(h)(Slapen) = S(h)
‘Slapen is een eigenschap van Hanna.’
Lambda’s met
kwantoren
Iedereen danst x D(x)
Kwantoren verwijzen niet naar een vast
individu, dus geen representatie als
constante, maar: P x P(x)
‘Dansen is een eigenschap van
iedereen.’
P x P(x)(Dansen) = x D(x)
Compositionaliteit met
kwantoren
Iedere student danst (S) xS(x)D(x)
/
\
Iedere student ??
Danst D
(NP)
(VP)
/
\
Iedere ?? student S
(Det)
(N)
Compositionaliteit met
kwantoren
Iedere student danst (S) xS(x)D(x)
/
\
Iedere student
Danst
Qx[S(x)Q(x)]
yD(y)
/
\
Iedere
student zS(z)
PQx[P(x)Q(x)]
Tweede orde kwantoren
De meeste studenten dansen
De meeste: PQ[|PQ| > |P-Q|]
Relatie tussen twee verzamelingen:
abstractie over twee predikaten.
Reflexieven I
Zichzelf: RxR(x,x), waarbij R een 2plaatsige relatie.
Hanna bewondert zichzelf.
Zichzelf bewonderen:
RxR(x,x)(Bewonderen) = xB(x,x)
Hanna bewondert zichzelf:
xB(x,x)(h) = B(h,h).
Reflexieven II
Iedereen bewondert zichzelf.
Zichzelf bewonderen:
RxR(x,x)(Bewonderen) = xB(x,x)
Iedereen: PyP(y).
Iedereen bewondert zichzelf:
PyP(y)(xB(x,x)) = yB(y,y)
Van buiten naar binnen
Mo kust Peter  Peter kust Mo.
yx Kussen(y)(x)(p) = x Kussen(p)(x)
Eigenschap ‘Peter kussen’
x Kussen(p)(x)(m) = Kussen(p)(m)
Kussen(p)(m) = Kussen(m,p)
‘Mo kust Peter’
Van buiten naar binnen
Mo kust Peter  Peter kust Mo.
xy Kussen(y)(x)(p) = y Kussen(y)(p)
‘gekust worden door Peter’
y Kussen(y)(p)(m) = Kussen(m)(p)
Kussen(m)(p) = Kussen(p,m)
‘Peter kust Mo’
Recursieve toepassing van lambda
conversie: Currying
Passief constructie
Actieve vorm van het werkwoord:
yx Kussen(y)(x) ‘kussen’
Passieve vorm van het werkwoord:
xyKussen-(x)(y) ‘gekust worden door’
Lexicale operatie: vorm een passief uit
een actief.
Semantische verrijking
Herschrijfregels verrijken met
semantische informatie.
Hiermee bepalen hoe de betekenis van
het complexe geheel wordt berekend uit
de semantische representaties van zijn
delen.
Voorbeeld 1
Hanna slaapt
S  NP VP
{VP.sem (NP.sem)}
NP  Hanna {h}
VP  slaapt
{xS(x)}
xS(x)(h) = S(h)
Voorbeeld 2
Iedere student danst
S  NP VP {NP.sem (VP.sem)}
NP  Det N {Det.sem (N.sem)}
Det  iedere {PQx[Px Qx]}
N  student {x S(x)}
PQx[Px Qx] (x S(x)) =
Qx[Sx Qx]
Bereiksambiguïteiten
Er wappert een vlag bij iedere
ambassade.
yx (Vlag(y) & Amb(x)  Wapper(x,y))
xy (Amb(x)  Vlag(y) & Wapper(x,y))
Wat voor soort ambiguïteit is dit?
Direct bereik
Iedere ambassade > een vlag.
Combineer een vlag met predikaat
wapperen, daarna iedere ambassade.
Qx[Amb(x)Q(x)]
z[y [Vlag(y) & Wap(z,y)]]
x[Amb(x) y [Vlag(y) & Wap(x,y)]]
Omgekeerd bereik
Een vlag > iedere ambassade.
Combineer iedere ambassade met
predikaat wapperen, daarna een vlag.
Py [Vlag(y) & P(y)]
zx [Amb(x)  Wapperen(x,z)]
y [Vlag(y) & x [Amb(x)  Wap(x,y)]]
Bereiksambiguïteiten
Syntactische aanpak: postuleer niveau
van syntactische representatie (Logical
Form) waarop kwantorbereik wordt
gedisambigueerd (Q-raising).
Semantische aanpak: Q-store ~ bewaar
interpretatie van deel van de boom.
Computationele aanpak:
onderspecificatie.
voorbeeld
e [Wapperen(e) & Agens(x,e) & Location(y,e)]
x [Vlag(x) & Q(x)]
y [Ambassade(y)  Q(y)]
Onderspecificatie
Compleet over lexicale informatie, en
koppeling NPs aan argumentposities
(wat wappert waar), maar
ondergespecificeerd over relatieve
volgorde kwantoren in semantische
representatie.
Alle mogelijke lezingen kunnen worden
gegenereerd.
Constraint-based
aanpak
Generalisatie van onderspecificatie
kwantoren naar bredere set gevallen,
b.v. negatie (‘iedere student is niet rijk’),
intensionele werkwoorden (‘Jan wil een
Spaanse taalkundige trouwen’).
Toevoeging van beperkingen
(constraints) op mogelijke interpretaties.
Hole-semantics
Vervang lambda’s door ‘gaten’ (holes).
Gebruik labels ipv lambda conversie.
Gebruik dominance constraints om te
bepalen welk label welke ‘hole’ mag
vullen.
voorbeeld
Er wappert een vlag bij iedere
ambassade.
l3: e [Wap(e) & Agens(x,e) & Loc(y,e)]
l1: x [Vlag(x) & h1] l2: y [Amb(y)h2]
l1  h0, l2  h0 l3  h1 l3 h2.
Labels inpluggen
Plug in labels P(h0) = l1 of P(h0) = l2 om
h0 te bereiken als gedisambigueerde
representatie.
Methode gebruikt in computationele
semantiek (Blackburn & Bos 2005).
Elk onderdeel van formule kan ‘hole’
worden, dus generalisatie over
constructies.
Idiomen
Voorbeelden:
Nederlands: geen kaas
gegeten hebben van iets ~
niet veel weten van iets
Engels: kick the bucket ~
dood gaan
Meer idiomen
Russisch: sobaku sjest' na
chem-to = hond eten op iets
~ ervaring hebben in iets
Frans: sucrer les fraises = de
aarbeien suikeren ~ beven,
kinds zijn.
Idiomen in taalkundige
theorie
Probleem: geen letterlijke betekenis,
geen compositionele interpretatie.
Oplossing: toevoegen van specifieke
semantische verrijking aan bepaalde
constituenten.
VP  kaas gegeten hebben van iets
{yx [veel_weten(y)(x)]
Conclusies
-abstractie en -conversie maken het
mogelijk delen van de syntactische
boom te interpreteren.
Handhaving principe van
compositionaliteit.
Toepassing op andere verschijnselen:
reflexiviteit, passiefvorming, bereik.
Conclusies
Bereiksambiguïteiten vormen lastig
probleem voor taalkundige theorie,
omdat ze niet te herleiden zijn tot
lexicale/structurele ambiguïteiten;
onderspecificatie.
Idiomen vormen probleem voor
compositionele interpretatie.
Download