AI Kaleidoscoop College 9: Natuurlijke taal Het Probleem Grammatica’s Transitie netwerken Leeswijzer: Hoofdstuk 14.0-14.3 AI9 1 Natuurlijke taal: het probleem • Communiceren met computers als met mensen, middels natuurlijke taal • Belangrijk voor veel toepassingen – Databases – Gebruikersgemak – Vertaalprogramma’s – Maat voor “intelligentie” • Programma’s maken gebruik van – structuur van taal – betekenis van taal – kennis over de wereld – ongeschreven gedragsregels AI9 2 Nivo’s in de analyse van natuurlijke taal • • • • • • • Fonetiek: ritme & intonatie Fonology: klankeenheden (fonemen) Morfologie: opbouw van woorden (morfemen) Syntaxis: opbouw van zinnen Semantiek: betekenis van woorden en zinnen Pragmatiek: gebruiksregels voor woorden en zinnen Algemene kennis: achtergrondkennis AI9 3 Fases in de analyse van natuurlijke taal. input parsing (ontleden) parse tree semantische interpretatie semantisch netwerk contextuele interpretatie uitgebreider semantisch netwerk AI9 dit college college’s 7&8 NB: in de praktijk geen lineaire volgorde 4 Syntax, grammatica Voorbeeld Algemeen S NP VP één begin-symbool NP N NP ART N VP V VP V NP regels: symbolensymbolen ART a | the N man|dog V likes|bites AI9 eindsymbolen 5 Parseren • Herken of zin correct is volgens de grammatica • of: genereer een correcte zin S Top down parsing NP A AI9 NB: zoekproces! VP N VP the N VP the man VP the man V NP the man likes NP the man likes A N the man likes the N 6 the man likes the dog Bottom up parsing the man likes the dog the man likes the N the man likes A the man likes NP the man V NP the man VP the N VP A N VP NP AI9 N VP S NB: zoekproces! 7 Parsing: resultaat = parse-tree S NP A VP N V the man likes Ambiguïteit: NP A N the dog Eén zin kan overeenkomen met meerdere parse-trees AI9 8 Ambiguïteit: Voorbeeld He saw her with the telescope He saw her with the telescope AI9 9 Verschillende typen grammatica's: Chomsky hierarchie Reguliere talen: Def: geen recursieve regels Vb: voorgaande slides Context-vrije talen: Def: één symbool aan linkerkant van regel, mogelijk met recursie Vb: voorgaande grammatica + VP ind_V that S ind_V says | beliefs Context gevoelige talen: Def: mogelijk >1 aan linkerkant van regels Vb: volgende slide Recursief opsombare talen Def: willekeurige regels AI9 10 Chomsky hierarchie (2) Reguliere talen: Context-vrije talen: Context gevoelige talen: Recursief opsombare talen NB: = Natuurlijke taal? AI9 11 Context-gevoelige grammatica S NP V NP ART NR N NR s|p ART s a s | the s ART p some p | the p sN man s | dog s pN men p | dogs p sV runs | bites pV run | bite Voorbeeld: • the dogs bite • the dogs bites Uitbreiding met semantiek extra symbool: bijter/niet-bijter • the dog bites AI9 • the man bites S NP ART NR V N p the p dogs p bite 12 Typen grammatica’s: evaluatie • Context-vrij: eenvoudig formalisme niet voldoende voor natuurlijke taal (wel voldoende voor bijna alle computer-talen) • Context-gevoelig: voldoende sterk, maar: explosie van aantal regels, mengen van syntax & semantiek AI9 13 Transitie-netwerken = alternatieve notatie voor grammatica’s • maak een netwerk voor elke non-terminal • elk pad in zo’n netwerk is een regel voor de non-terminal • pijlen zijn de non-terminals of terminals in de regel AI9 14 Transitie-netwerken (Vb) S NP VP NP NP N ART N VP VP V V NP ART a | the N V AI9 man |dog likes |bites S: NP: VP: ART: N: V: NP VP ART N N V NP V the a man dog likes bites 15 Transitie netwerken, alternatieve notatie a that the man dog thinks man dog likes a says bites the man dog man dog AI9 16 Augmented transition networks (ATN’s) • ATN = TN + datastructuren + procedures (per overgang) om data-structuren te manipuleren NP ART N Vb: NR V VP VP proc NP1: ART = a | the N = man | dog NR = s proc VP1: V = bites | runs if NR-of-NP=s then ok else fail proc NP2: ART = some | the N = men | dogs NR = p proc VP2: V = bite | run if NR-of-NP=p then ok else fail AI9 17 Gebruik van ATN’s: syntax semantiek syntax (= parse-tree) S = NP (s) ART the (s,p) N VP (s) V = dog (s) likes (s) VP ART N a = man (s) (s) Semantiek (= conceptuele graaf) AI9 bite agent dog:#1 object man:#1 18 Semantiek (= conceptuele graaf) bite agent dog:#1 object man:#1 Maak semantische representatie mbv case-frame Case-frame = voorgebakken lege semantische structuur bite agent <animate> object <thing> instrument AI9 part teeth 19 semantische representatie m.b.v case-frame bite agent <animate> object <thing> instrument part teeth • Voordelen: – type-informatie – impliciete kennis AI9 20 Volgende keer Stellingen bewijzers: Hoofdstuk 12 AI9 21