Natuurlijke-Taalinterfaces Week 1 -- Inleiding 2e trimester 2002/03 docent: Gosse Bouma www.let.rug.nl/~gosse/nti/ [email protected] College-overzicht Week 1: Introductie. Wat is een nti, wanneer nuttig? Open problemen. Week 2: Computationele Semantiek. Zinnen automatisch vertalen in logische formules. Week 3: Vraag-antwoord systemen. Logische formules evalueren in een model. Week 5: Lambda-calculus. Een systematische manier om semantiek op te bouwen. Natuurlijke-Taalinterfaces 2 College-overzicht week 7: Discourse Representation Theory. De semantiek van teksten. week 9: Pronoun Resolution. De betekenis van voornaamwoorden. week 4,6,8,10: Open-domain question answering: How many calories are there in a Big Mac? Natuurlijke-Taalinterfaces 3 Studiemateriaal Webpagina: Literatuur (zie web-pagina) : www.let.rug.nl/~gosse/nti/ hst 10.2 van Breinmakers en -brekers, (delen van) Blackburn en Bos, Computational Semantics, Aantekeningen Software (Zie web-pagina) : Blackburn en Bos (semantiek, theorem-proving) Hdrug (grammatica, parsing, visualisatie) Natuurlijke-Taalinterfaces 4 Werkvorm en Toetsing Practicum: Zaal H12.102 (UNIX) Donderdag 10-12 uur Opdrachten mogen in groepjes van 2 gemaakt worden. Toetsing: Practicumopdrachten (3) + eindopdracht. Natuurlijke-Taalinterfaces 5 Wat is een natuurlijketaalinterface? Een programma dat een gebruiker in staat stelt om in natuurlijke taal met een computer te communiceren. Een nti kan bv. gebruikt worden om een database te ondervragen. De interface kan op tekst of spraak gebaseerd zijn. Natuurlijke-Taalinterfaces 6 Voordelen van natuurlijke taal geen leerproces: expressief: je kunt alles zeggen, je kunt alles kort zeggen. cooperatieve dialoog: gebruikers zijn gewend aan, vetrouwd met, taal. systeem helpt gebruiker op weg (help, adviessystemen, bedoelt u x?) spraak !! : geen keyboard+scherm nodig Natuurlijke-Taalinterfaces 7 Ask Jeeves www.askjeevs.com where can I see pictures of chocolate? where van I find information on the software Windows NT? where can I find information about the author Tennessee Williams? where can I learn about aftercare for lip piercings? Natuurlijke-Taalinterfaces 8 OV Reisinformatie Van welk station naar welk station wilt u reizen? Van Voorburg naar Utrecht Overvecht Wanneer wilt u van Voorburg naar Utrecht Overvecht reizen? Op woensdag. Hoe laat wilt u overmorgen reizen? Om tien uur. U wilt dus om tien uur ‘s ochtends vertrekken? Ja. Ik heb de volgende verbindingen voor u gevonden:….. Natuurlijke-Taalinterfaces 9 Een eenvoudig dialoogmodel Dialoog Manager:begin dialoog Gebruiker: geeft antwoord wh(X,time(X)) Applicatie interface: formuleer query Hoe laat is het? Grammatica: analyseer antwoord wat wilt u weten? X = hour(10,10) Dialoog Manager: geef antwood & .. Het is tien over tien, ... Natuurlijke-Taalinterfaces 10 Hoe maak je een nti? Grammatica: moet alle te verwachten inputs van de gebruiker kunnen analyseren. Applicatie interface: moet grammaticale analyses omzetten in queries voor de applicatie. Dialoog manager: moet een natuurlijke dialoog ondersteunen. Natuurlijke-Taalinterfaces 11 Grammaticale analyse voor nti Doel: analyseren van tekst of spraak en omzetten in een semantische representatie. Nodig: woordenboek syntactische regels semantische regels Natuurlijke-Taalinterfaces 12 Grammaticale analyse voor nti Woordenboek problemen: onvolledig wanneer gaat de bus naar Drachten? Grammaticale problemen: ongrammaticale zinnen, onbekende constructies wanneer, uh, ik bedoel, hoe laat…. de trein naar Zwolle, wanneer gaat die? de trein naar Zwolle vertrekt hoe laat? Natuurlijke-Taalinterfaces 13 Semantische analyse voor nti hoeveel lezingen heeft een woord of zin? Time flies like an arrow Die nacht was Marie goed bevallen de trein naar Leeuwarden vertrekt/staat voor die naar Zwolle PP-attachment: Ids dacht aan zijn schaatsen in de auto Ids dacht in de auto aan schaatsen (vergeten!) Ids dacht aan schaatsen die nog in de auto lagen Natuurlijke-Taalinterfaces 14 Semantische analyse voor nti “Context”: Anafora, deixis, ellipsis: (Jan kocht een computer.) Zij gisteren ook Marjan kocht op 3 dec 2002 een computer. Bereik van kwantoren, coordinatie, negatie,… Bij alle tentamens blijft één student tot het einde zitten Rob en Gertjan kochten een laptop Natuurlijke-Taalinterfaces 15 Applicatie-interface Database: Door welke landen stroomt de Rijn? <rijn,1000,<CH,DE,NL>> <donau,2000,<DE,AUT,HON,ROE>> <theems,300,<GB>> <seine,500,<FR>> wh(x,land(x) & stroom_door(rijn,x)) Wat is de langste rivier in Europa? wh(x,riv(x) & y(riv(y) & len(x,l1) & & l2 > l1 )) Natuurlijke-Taalinterfaces len(y,l2) 16 Applicatie-interface Vertaling tussen semantische representatie (logische formules) en representatie van de applicatie (relationele database, expertsysteem,..) Redeneren (theorem proving) met logische formules Natuurlijke-Taalinterfaces 17 Killer Apps? Automatisch Vertalen, Email filtering/answering, Question-answering voor het Web, Information-extraction (job adds) Spraakherkenning, Spraaksynthese, Combinaties van voicemail/email/sms/… Natuurlijke-Taalinterfaces 18 Tot slot Lees: Breinbrekers & Breinmakers, natuurlijke taalinterface. volgende week: Computationele Semantiek, 1.1 –1.4 Blackburn en Bos, 2.1. en 2.2. regel z.s.m. een account op Hagen (UNIX!). deze week nog geen practicum. Natuurlijke-Taalinterfaces 19