Natuurlijke Taalverwerking

advertisement
Natuurlijke-Taalinterfaces
Week 1 -- Inleiding
2e trimester 2002/03
docent: Gosse Bouma
www.let.rug.nl/~gosse/nti/
[email protected]
College-overzicht

Week 1: Introductie. Wat is een nti, wanneer
nuttig? Open problemen.



Week 2: Computationele Semantiek. Zinnen
automatisch vertalen in logische formules.
Week 3: Vraag-antwoord systemen. Logische
formules evalueren in een model.
Week 5: Lambda-calculus. Een systematische
manier om semantiek op te bouwen.
Natuurlijke-Taalinterfaces
2
College-overzicht

week 7: Discourse Representation Theory. De
semantiek van teksten.

week 9: Pronoun Resolution. De betekenis
van voornaamwoorden.

week 4,6,8,10: Open-domain question
answering: How many calories are there in
a Big Mac?
Natuurlijke-Taalinterfaces
3
Studiemateriaal

Webpagina:


Literatuur (zie web-pagina) :




www.let.rug.nl/~gosse/nti/
hst 10.2 van Breinmakers en -brekers,
(delen van) Blackburn en Bos, Computational
Semantics,
Aantekeningen
Software (Zie web-pagina) :


Blackburn en Bos (semantiek, theorem-proving)
Hdrug (grammatica, parsing, visualisatie)
Natuurlijke-Taalinterfaces
4
Werkvorm en Toetsing

Practicum: Zaal H12.102 (UNIX)



Donderdag 10-12 uur
Opdrachten mogen in groepjes van 2
gemaakt worden.
Toetsing:

Practicumopdrachten (3) + eindopdracht.
Natuurlijke-Taalinterfaces
5
Wat is een natuurlijketaalinterface?



Een programma dat een gebruiker in
staat stelt om in natuurlijke taal met
een computer te communiceren.
Een nti kan bv. gebruikt worden om een
database te ondervragen.
De interface kan op tekst of spraak
gebaseerd zijn.
Natuurlijke-Taalinterfaces
6
Voordelen van natuurlijke taal

geen leerproces:


expressief:


je kunt alles zeggen, je kunt alles kort zeggen.
cooperatieve dialoog:


gebruikers zijn gewend aan, vetrouwd met, taal.
systeem helpt gebruiker op weg (help,
adviessystemen, bedoelt u x?)
spraak !! :

geen keyboard+scherm nodig
Natuurlijke-Taalinterfaces
7
Ask Jeeves





www.askjeevs.com
where can I see pictures of chocolate?
where van I find information on the software
Windows NT?
where can I find information about the author
Tennessee Williams?
where can I learn about aftercare for lip
piercings?
Natuurlijke-Taalinterfaces
8
OV Reisinformatie

Van welk station naar welk station wilt u reizen?

Van Voorburg naar Utrecht Overvecht

Wanneer wilt u van Voorburg naar Utrecht Overvecht
reizen?

Op woensdag.

Hoe laat wilt u overmorgen reizen?

Om tien uur.

U wilt dus om tien uur ‘s ochtends vertrekken?

Ja.

Ik heb de volgende verbindingen voor u
gevonden:…..
Natuurlijke-Taalinterfaces
9
Een eenvoudig dialoogmodel

Dialoog Manager:begin dialoog


Gebruiker: geeft antwoord


wh(X,time(X))
Applicatie interface: formuleer query


Hoe laat is het?
Grammatica: analyseer antwoord


wat wilt u weten?
X = hour(10,10)
Dialoog Manager: geef antwood & ..

Het is tien over tien, ...
Natuurlijke-Taalinterfaces
10
Hoe maak je een nti?



Grammatica: moet alle te verwachten
inputs van de gebruiker kunnen
analyseren.
Applicatie interface: moet grammaticale
analyses omzetten in queries voor de
applicatie.
Dialoog manager: moet een natuurlijke
dialoog ondersteunen.
Natuurlijke-Taalinterfaces
11
Grammaticale analyse voor nti

Doel:


analyseren van tekst of spraak en omzetten in een
semantische representatie.
Nodig:



woordenboek
syntactische regels
semantische regels
Natuurlijke-Taalinterfaces
12
Grammaticale analyse voor nti

Woordenboek problemen: onvolledig


wanneer gaat de bus naar Drachten?
Grammaticale problemen:
ongrammaticale zinnen, onbekende
constructies



wanneer, uh, ik bedoel, hoe laat….
de trein naar Zwolle, wanneer gaat die?
de trein naar Zwolle vertrekt hoe laat?
Natuurlijke-Taalinterfaces
13
Semantische analyse voor nti

hoeveel lezingen heeft een woord of zin?




Time flies like an arrow
Die nacht was Marie goed bevallen
de trein naar Leeuwarden vertrekt/staat voor die
naar Zwolle
PP-attachment:



Ids dacht aan zijn schaatsen in de auto
Ids dacht in de auto aan schaatsen (vergeten!)
Ids dacht aan schaatsen die nog in de
auto lagen
Natuurlijke-Taalinterfaces
14
Semantische analyse voor nti

“Context”: Anafora, deixis, ellipsis:




(Jan kocht een computer.)
Zij gisteren ook
Marjan kocht op 3 dec 2002 een computer.
Bereik van kwantoren, coordinatie, negatie,…


Bij alle tentamens blijft één student tot het einde
zitten
Rob en Gertjan kochten een laptop
Natuurlijke-Taalinterfaces
15
Applicatie-interface

Database:





Door welke landen stroomt de Rijn?


<rijn,1000,<CH,DE,NL>>
<donau,2000,<DE,AUT,HON,ROE>>
<theems,300,<GB>>
<seine,500,<FR>>
wh(x,land(x) & stroom_door(rijn,x))
Wat is de langste rivier in Europa?

wh(x,riv(x) & y(riv(y) & len(x,l1) &
& l2 > l1 ))
Natuurlijke-Taalinterfaces
len(y,l2)
16
Applicatie-interface


Vertaling tussen semantische
representatie (logische formules) en
representatie van de applicatie
(relationele database, expertsysteem,..)
Redeneren (theorem proving) met
logische formules
Natuurlijke-Taalinterfaces
17
Killer Apps?







Automatisch Vertalen,
Email filtering/answering,
Question-answering voor het Web,
Information-extraction (job adds)
Spraakherkenning,
Spraaksynthese,
Combinaties van
voicemail/email/sms/…
Natuurlijke-Taalinterfaces
18
Tot slot

Lees:






Breinbrekers & Breinmakers, natuurlijke
taalinterface.
volgende week:
Computationele Semantiek, 1.1 –1.4
Blackburn en Bos, 2.1. en 2.2.
regel z.s.m. een account op Hagen (UNIX!).
deze week nog geen practicum.
Natuurlijke-Taalinterfaces
19
Download