Betekenis 2: Compositionaliteit, bereik en lambda’s Henriëtte de Swart onderwerpen Vorige keer: predikaatlogica, vertaling van zinnen. Dit keer: uitbreiding van de predikaatlogica met lambda’s, interne structuur van zinnen, compositionaliteit, kwantoren en bereik, idiomen. Stof van vandaag J&M hoofdstuk 18, maar niet 18.4 en 18.5 J&M Hoofdstuk 17, sectie 17.3.3 Meer dan woorden… Hoe wordt de betekenis van complexe gehelen (constituenten, zinnen) opgebouwd uit die van woorden? ‘Jan slaat Piet’ ‘Piet slaat Jan’ Woordvolgorde Subject-Object relatie Agens-Patiens relatie. Compositionaliteit Principe van Compositionaliteit van betekenis (Frege): de betekenis van het geheel is een functie van de betekenis van de samenstellende delen en van de manier waarop ze zijn samengesteld. zinsbetekenis = woordbetekenis + structuur Dus: semantiek altijd afhankelijk van syntaxis. Ambiguïteiten Ambiguë woorden: bank, baan. Structurele ambiguïteiten: Jan zag de man met de verrekijker. 2 betekenissen ~ 2 syntactische structuren. Bereiksambiguïteiten: Er hing een vlag bij iedere ambassade. 1 vlag of evenveel vlaggen als er ambassades zijn. Structurele ambiguïteit? Semantische representaties Semantische representaties worden geformuleerd in logische talen (b.v. 1e orde propositie/predikatenlogica). Logische talen respecteren principe van compositionaliteit: regels voor interpretatie volgen regels voor wffs. Probleem I Syntaxis natuurlijke taal syntaxis 1e orde predikaatlogica. Eerste orde predikaatlogica is niet voldoende om alle natuurlijke taaluitdrukkingen te representeren. Concreet: modificatie, kwantificatie over predikaten, tweede orde kwantoren. Modificatie Joost is een Nederlandse taalkundige T(j) Nl(j) Pim is een grote muis/ een kleine olifant Niet: M(p) Gr(p) Niet: O(p) Kl(p) Kwantificatie over eigenschappen Jan heeft alle eigenschappen van Sinterklaas. P [P(s) P(j). Geen eerste orde logica! In eerste orde logica alleen predikaat constanten (geen predikaatvariabelen). Tweede orde kwantoren Alle studenten houden van taalkunde. x [St(x) Hvt(x)] De meeste studenten houden van taalkunde. Niet: Mx [St(x) Hvt(x)] waarom niet? Niet: Mx [St(x) Hvt(x)] waarom niet? Probleem II Probleem: syntaxis van natuurlijke taal syntaxis van propositie/ predikatenlogica. Is het wel mogelijk om een compositionele interpretatie van natuurlijke taal te geven m.b.v. deze logica’s? 1e orde logic en compositionaliteit Zinnen met individuele constanten/ variabelen: compositionele vertaling . Hanna slaapt. Hanna slaapt (S) S(h) / \ / \ Hanna h Slaapt S h S (NP) (VP) functie applicatie Kwantoren en compositionaliteit Zinnen met kwantoren: geen compositionele vertaling. B.v. Iedere student danst. Iedere student danst (S) xS(x)D(x) / \ Iedere student Danst D (NP) (VP) / \ Iedere ?? student S (Det) (N) Kwantoren en compositionaliteit Zinnen met kwantoren: geen compositionele vertaling. B.v. Iedere student danst. Iedere student danst (S) xS(x)D(x) / \ Iedere student ?? Danst D (NP) (VP) / \ Hoe komen we Iedere ?? student S compositioneel (Det) (N) van hier naar daar? Lambda abstractie Gebruik van lambda abstractie maakt het mogelijk semantische representaties te geven voor delen van een syntactische boom, zodat we een compositionele vertaling van de zin kunnen geven. Lambda abstractie ook met 2e orde logica. Essentie 1-plaatsige predikaten (praten, dansen, student,…) denoteren verzamelingen. Vertaling als predikaat: hoofdletters (P, D,S,…). Vertaling als lambda abstract: xP(x). bindt individuele variabele x. pikt alle waarden van x eruit die de formule P(x) waar maken, en definieert daarmee de verzameling van P’s (karakteristieke functie). Lambda’s: formeel Als een formule is, en x een variabele (die normaliter voorkomt in ), dan is ||x||M, g die functie h van het universum U naar {0,1} zodanig dat voor alle individuen e in U, h(e) = 1 als ||x||M, g[x/e] = 1, en h(e) = 0 anders. Lambda conversie Toepassing van lambda abstract op constante/variabele leidt tot lambda conversie: [x S(x)](h) = S(h) x S(x): 1-plaatsig predikaat. Functie applicatie: toepassen op individuele constante h. Lambda conversie: deletie van en vervanging van x door h. conversie: formeel Voor een open propositie, en x een individuele variabele die voorkomt in , en c een individuele constante, dan x (c) [c/x], waar [c/x] is de formule met vervanging van alle voorkomens van x door c. Compositionaliteit met Hanna slaapt Hanna slaapt (S) xS(x)(h) = S(h) / \ functie applicatie Hanna h Slaapt xS(x) (NP) (VP) Abstractie over predikaten Een kleine olifant x (K(O))(x). een kleine olifant (NP) x(K(O))(x) / \ een ?? kleine olifant (A(N)) yK(O)(y) / \ functie applicatie kleine (A) olifant (N) PyK(P)(y) O NPs als verzameling eigenschappen Hanna: h (individuele constante) Hanna: P P(h) (bundel eigenschappen Hanna slaapt: S(h) Slaapt(Hanna): x S(x)(h) = S(h) ‘Hanna is een slaper.’ Hanna(Slapen): P P(h)(Slapen) = S(h) ‘Slapen is een eigenschap van Hanna.’ Lambda’s met kwantoren Iedereen danst x D(x) Kwantoren verwijzen niet naar een vast individu, dus geen representatie als constante, maar: P x P(x) ‘Dansen is een eigenschap van iedereen.’ P x P(x)(Dansen) = x D(x) Compositionaliteit met kwantoren Iedere student danst (S) xS(x)D(x) / \ Iedere student ?? Danst D (NP) (VP) / \ Iedere ?? student S (Det) (N) Compositionaliteit met kwantoren Iedere student danst (S) xS(x)D(x) / \ Iedere student Danst Qx[S(x)Q(x)] yD(y) / \ Iedere student zS(z) PQx[P(x)Q(x)] Tweede orde kwantoren De meeste studenten dansen De meeste: PQ[|PQ| > |P-Q|] Relatie tussen twee verzamelingen: abstractie over twee predikaten. Reflexieven I Zichzelf: RxR(x,x), waarbij R een 2plaatsige relatie. Hanna bewondert zichzelf. Zichzelf bewonderen: RxR(x,x)(Bewonderen) = xB(x,x) Hanna bewondert zichzelf: xB(x,x)(h) = B(h,h). Reflexieven II Iedereen bewondert zichzelf. Zichzelf bewonderen: RxR(x,x)(Bewonderen) = xB(x,x) Iedereen: PyP(y). Iedereen bewondert zichzelf: PyP(y)(xB(x,x)) = yB(y,y) Van buiten naar binnen Mo kust Peter Peter kust Mo. yx Kussen(y)(x)(p) = x Kussen(p)(x) Eigenschap ‘Peter kussen’ x Kussen(p)(x)(m) = Kussen(p)(m) Kussen(p)(m) = Kussen(m,p) ‘Mo kust Peter’ Van buiten naar binnen Mo kust Peter Peter kust Mo. xy Kussen(y)(x)(p) = y Kussen(y)(p) ‘gekust worden door Peter’ y Kussen(y)(p)(m) = Kussen(m)(p) Kussen(m)(p) = Kussen(p,m) ‘Peter kust Mo’ Recursieve toepassing van lambda conversie: Currying Passief constructie Actieve vorm van het werkwoord: yx Kussen(y)(x) ‘kussen’ Passieve vorm van het werkwoord: xyKussen-(x)(y) ‘gekust worden door’ Lexicale operatie: vorm een passief uit een actief. Semantische verrijking Herschrijfregels verrijken met semantische informatie. Hiermee bepalen hoe de betekenis van het complexe geheel wordt berekend uit de semantische representaties van zijn delen. Voorbeeld 1 Hanna slaapt S NP VP {VP.sem (NP.sem)} NP Hanna {h} VP slaapt {xS(x)} xS(x)(h) = S(h) Voorbeeld 2 Iedere student danst S NP VP {NP.sem (VP.sem)} NP Det N {Det.sem (N.sem)} Det iedere {PQx[Px Qx]} N student {x S(x)} PQx[Px Qx] (x S(x)) = Qx[Sx Qx] Bereiksambiguïteiten Er wappert een vlag bij iedere ambassade. yx (Vlag(y) & Amb(x) Wapper(x,y)) xy (Amb(x) Vlag(y) & Wapper(x,y)) Wat voor soort ambiguïteit is dit? Direct bereik Iedere ambassade > een vlag. Combineer een vlag met predikaat wapperen, daarna iedere ambassade. Qx[Amb(x)Q(x)] z[y [Vlag(y) & Wap(z,y)]] x[Amb(x) y [Vlag(y) & Wap(x,y)]] Omgekeerd bereik Een vlag > iedere ambassade. Combineer iedere ambassade met predikaat wapperen, daarna een vlag. Py [Vlag(y) & P(y)] zx [Amb(x) Wapperen(x,z)] y [Vlag(y) & x [Amb(x) Wap(x,y)]] Bereiksambiguïteiten Syntactische aanpak: postuleer niveau van syntactische representatie (Logical Form) waarop kwantorbereik wordt gedisambigueerd (Q-raising). Semantische aanpak: Q-store ~ bewaar interpretatie van deel van de boom. Computationele aanpak: onderspecificatie. voorbeeld e [Wapperen(e) & Agens(x,e) & Location(y,e)] x [Vlag(x) & Q(x)] y [Ambassade(y) Q(y)] Onderspecificatie Compleet over lexicale informatie, en koppeling NPs aan argumentposities (wat wappert waar), maar ondergespecificeerd over relatieve volgorde kwantoren in semantische representatie. Alle mogelijke lezingen kunnen worden gegenereerd. Constraint-based aanpak Generalisatie van onderspecificatie kwantoren naar bredere set gevallen, b.v. negatie (‘iedere student is niet rijk’), intensionele werkwoorden (‘Jan wil een Spaanse taalkundige trouwen’). Toevoeging van beperkingen (constraints) op mogelijke interpretaties. Hole-semantics Vervang lambda’s door ‘gaten’ (holes). Gebruik labels ipv lambda conversie. Gebruik dominance constraints om te bepalen welk label welke ‘hole’ mag vullen. voorbeeld Er wappert een vlag bij iedere ambassade. l3: e [Wap(e) & Agens(x,e) & Loc(y,e)] l1: x [Vlag(x) & h1] l2: y [Amb(y)h2] l1 h0, l2 h0 l3 h1 l3 h2. Labels inpluggen Plug in labels P(h0) = l1 of P(h0) = l2 om h0 te bereiken als gedisambigueerde representatie. Methode gebruikt in computationele semantiek (Blackburn & Bos 2005). Elk onderdeel van formule kan ‘hole’ worden, dus generalisatie over constructies. Idiomen Voorbeelden: Nederlands: geen kaas gegeten hebben van iets ~ niet veel weten van iets Engels: kick the bucket ~ dood gaan Meer idiomen Russisch: sobaku sjest' na chem-to = hond eten op iets ~ ervaring hebben in iets Frans: sucrer les fraises = de aarbeien suikeren ~ beven, kinds zijn. Idiomen in taalkundige theorie Probleem: geen letterlijke betekenis, geen compositionele interpretatie. Oplossing: toevoegen van specifieke semantische verrijking aan bepaalde constituenten. VP kaas gegeten hebben van iets {yx [veel_weten(y)(x)] Conclusies -abstractie en -conversie maken het mogelijk delen van de syntactische boom te interpreteren. Handhaving principe van compositionaliteit. Toepassing op andere verschijnselen: reflexiviteit, passiefvorming, bereik. Conclusies Bereiksambiguïteiten vormen lastig probleem voor taalkundige theorie, omdat ze niet te herleiden zijn tot lexicale/structurele ambiguïteiten; onderspecificatie. Idiomen vormen probleem voor compositionele interpretatie.