Zinnen 1

advertisement
Zinnen 1
Henriëtte de Swart
Combinaties
Taal maakt combinaties op verschillende
niveaus:
Fonemen combineren tot morfemen
(creëren van betekenis)
Morfemen combineren tot woorden
(complexe betekenissen)
Woorden combineren tot
woordgroepen, zinnen en
teksten (meer complexe
betekenissen).
Wat is syntaxis?
Syntaxis bestudeert de combinaties van
woorden tot woordgroepen en zinnen.
Zinnen 1: structuur, bomen, herschrijfregels
(de Swart)
Zinnen 2: kenmerken, processen,
transformaties, afhankelijkheden (Winter)
Complexiteit (Chernilovskaya)
Let op: colleges zinnen 1+2 horen bij
tentamenstof toets 1. Complexiteit bij toets 2.
Stof bij dit college
Uit het boek:
hoofdstuk 12 (vanaf begin t/m
12.3, over structuur, herschrijfregels,
woordgroepen en zinnen);
Hoofdstuk 12 (sectie 12.5, sectie 12.6, sectie
12.7.2, over grammatica’s);
Hoofdstuk 13 (sectie 13.2, over ambiguïteit).
Dit college
Syntactische verschijnselen (waar kijken
we naar?)
Syntactische doelstellingen (generatie,
parsing, theorie en toepassing)
Syntactische categorieën (woordsoorten,
parts of speech)
Syntactische structuren (constituenten,
zinnen)
Syntactische regels (grammatica’s)
Syntactische verschijnselen
Syntaxis is de moderne pendant van de
traditionele grammatica:
woordsoorten (werkwoord, lidwoord, …)
zinsdelen (onderwerp, persoonsvorm, …)
zinsbouw
redekundig en taalkundig ontleden
Maar er zijn belangrijke verschillen:
theoretisch en toegepast.
Syntactische verschijnselen
Patronen van (on)grammaticaliteit
 Jan at een boterham
 Jan at
 Jan verorberde een boterham
 *Jan verorberde
 Jan smulde *(van) een boterham
 Jan smulde
Transitieve en intransitieve werkwoorden,
voorzetsels: subcategorisatie
Syntactische verschijnselen
 Goed of fout?
Hun doen maar wat
Een aantal studenten zijn afgevallen
 http://dewerelddraaitdoor.vara.nl/Videodetail.628.0.html?&no_cache=1&tx_ttnews%5Btt_news%5D=14990
&tx_ttnews%5BbackPid%5D=626&tx_ttnews%5Bcat%5D=148
 Voor iedereen ongrammaticaal:
*Hem doet maar wat
*Een van de studenten zijn afgevallen
 Congruentie en naamval
Syntactische verschijnselen
Wat betekent deze zin:
Oude mannen en vrouwen eerst!
Oude [mannen en vrouwen]
[Oude mannen] en vrouwen

Jan zag de man met de verrekijker
zag [de man met de verrekijker]
[zag [de man]] [met de verrekijker]

Structurele ambiguïteit
Syntactische verschijnselen
Jan zag de man met de verrekijker
*Jan zag wie?
*Jan zag de man hoe?
*Wie Jan zag?
*Hoe Jan zag de man met de verrekijker?
Wie zag Jan?
Hoe zag Jan de man met de verrekijker?
Verplaatsing en afhankelijkheden:
woordvolgorde, relaties tussen woordgroepen
Varianten op dezelfde zin
 Jan zag de man met de verrekijker
(bewerende, declaratieve zin)
 Wie zag Jan? (vraagzin)
 Zie de man met de verrekijker!
(imperatieve zin)
 Romeo kuste Julia (actieve vorm)
 Julia werd door Romeo gekust
(lijdende vorm)
Recursie en oneindigheid
Jan vond de sleutel.
Jan vond de sleutel van de deur.
Jan vond de sleutel van de deur van de
garage.
Jan vond de sleutel van de deur van de
garage van de limousine.
Jan vond …
Syntactische doelstellingen
Onbewuste kennis van een modertaalgebruiker (competence) karakteriseren.
Het oneindige, grammaticale gebruik van
eindige middelen (creativiteit van taal).
Descriptief en niet prescriptief!
Perspectief van taalproductie (generatie –
hoe bouw je zinnen?) en taalverwerking
(processing, parsing – hoe begrijpen
mensen/computers zinsstructuur).
Formele grammatica
Syntactische theorie wil een expliciete
karakterisering geven van de taalkennis,
door middel van precieze, formele regels.
Generatieve grammatica (Chomsky): een
definitie van de verzameling grammaticale
zinnen en woordgroepen: generatie van
alle grammaticale uitdrukkingen, en
uitsluiting van alle ongrammaticale
uitdrukkingen.
Processing/parsing
Processing: verwerking in het brein, waarbij
de onderliggende structuur van stroom
woorden wordt herkend.
Verwerkingsstap tussen auditieve perceptie
(herkenning van klanken) en interpretatie.
Parsing (computationele toepassingen):
omzetten van strings van woorden in
structurele representatie van structuur en
afhankelijkheidsrelaties.
Taal in het brein
 Taal als kennissysteem:
‘software’.
 Opgeslagen in brein: ‘wetware’
 Bij rechtshandige mensen
vooral in linkerhersenhelft.
 Gebieden specifiek voor taal:
Wernicke’s gebied (taalbegrip),
Broca’s area (spraakproductie).
Garden path effect
The horse raced past the barn fell.
[The horse raced past the barn]
Heranalyse: raced is geen simple past,
maar past participle. Vgl.
The car driven past the barn crashed.
Meer ‘intuinzinnen’
 The government plans to raise taxes were
defeated.
 Time flies like an arrow; fruit flies like a banana.
 Ik sloeg meermaals de man met de wandelstok
gade.
 Stowe et al (2004) tonen aan dat dit soort
ambiguïteiten leiden tot activiteit in de rechter
frontale kwab, waar ook humor een rol speelt.
Taalvariatie
Verschillen en overeenkomsten tussen talen
verantwoorden in één universeel
regelsysteem.
Wh-verplaatsing: verplicht in Nederlands,
niet in Swahili:
 Wie zag Jan? - *Jan zag wie? - *Wie Jan zag?
 Jan aliona nani? - *Nani Jan aliona? - *Nani aliona
Jan? (Swahili)
Universele Grammatica: mogelijkheden en
onmogelijkheden van taalvariatie.
Syntactische constituenten
Een zin is nooit een platte rij woorden, maar
heeft een bepaalde opbouw, structuur.
Vgl. met de structuur van lettergrepen
(fonologie) en woorden (morfologie).
Woorden vormen met elkaar woordgroepen =
constituenten = phrases
Een constituent kan worden aangegeven met
rechte haken: [oude [mannen en vrouwen]]
Motivatie voor constituentstructuur
Een constituent gedraagt zich als een
eenheid voor bepaalde syntactische
verschijnselen (en zo kunnen we een
constituent ook motiveren).
Nederlands als V2 taal: bijna alles wat voor
het werkwoord komt vormt één constituent:
 [Jan] lacht, [oude mannen en vrouwen] gaan eerst,
[gisteren om half elf] vertrokken we, [op een oude
fiets met handremmen] gaat het langzamer, [alle
oude schoenen die ik in de afgelopen jaren heb
verzameld] gooi ik nu weg,…
Disambigueren
Jan zag de man met de verrekijker
De man met de verrekijker werd gisteren
nog gesignaleerd.
De man die Jan zag met de
verrekijker liep hard weg.
Wie zag Jan?
Wie zag Jan met de verrekijker?
Interne structuur
Jan zag de man met de verrekijker
De verrekijker
Met de verrekijker
De man met de verrekijker
Zag de man met de verrekijker
[Jan [zag [de man [met [de verrekijker]]]]]
Boomstructuur 1
Jan
zag
de
man
De constituenten
van een zin
met
kunnen worden
aangegeven door
middel van een
boomstructuur
de
verrekijker
Boomstructuur 2
Jan

zag

de


man
met
de
verrekijker
Woordsoorten: nomina
De woorden van een taal
vormen niet één grote
homogene verzameling, maar er zijn
woordsoorten, categorieën, parts of speech.
Noun, nomen, substantief, zelfstandig
naamwoord: mannen, vrouwen, man,
verrekijker, zand
Afgekort als N
Mogelijke boomstructuren
Chomskyaanse bomen: binaire vertakking
Lastig: mannen en vrouwen
Welke drie structuren zijn mogelijk?
Welke argumenten kun je bedenken voor
de structuur [mannen [en vrouwen]]?
Let op bij het tekenen van bomen voor je
taal in het groepsproject. Gebruik hiervoor
binaire vertakkingen tenzij je goede
redenen hebt om dat niet te doen..
Meer woordsoorten
Verbum, verb, afgekort als V: ziet, at,
verorberde, smulde, doen, zijn, zag, kust,
gekust, doet, afgevallen, is..
Adjectief, adjective, bijvoeglijk
naamwoord, afgekort als A: oude,
vriendelijke, blauwe, …
Ook adverbia: gisteren, wel, ..
Meer woordsoorten
Preposities, voorzetsels, afgekort als P:
met, in, op, door, van…
Determiner, lidwoord, afgekort als D: de,
het, een.
Categorie D is ruimer dan alleen lidwoord,
ook kwantoren (enkele, alle, geen,..)
demonstratieven (deze, die, ..), whwoorden (welke).
Verbindingswoorden
Conjunction, conjunctie: nevenschikkend
voegwoord (en, of, want), afgekort als
Conj of C.
Complementizer: speciale term voor
onderschikkend voegwoord (dat, of),
afgekort als Comp of C.
Voorbeelden van twee soorten of: neem je
soep of salade? Weet je of Jan komt?
Subcategorieën
Proper name, eigennaam, afgekort als PN:
Jan, Susanne, Sinterklaas,..
Pronoun, pronomen, persoonlijk
voornaamwoord: ik, hij, hem, hun.
Auxiliary of hulpwerkwoord, afgekort als
Aux: hebben, zijn, worden, kunnen, willen,
.. Ik heb geslapen, hij is gekomen, hij
wordt gekust, ik kan komen, hij wil komen.
Benoemen van woordgroepen
Categorie hoofd van constituent geeft naam
aan woordgroep:
Naamwoord – naamwoordelijke constituent
NP: de man, Sinterklaas
Determinator – determiner phrase DP: de
man, iedere student
Werkwoord – werkwoordelijke constituent
VP: lachte, zag de man
Voorzetsel – voorzetselgroep PP: met de
verrekijker, in de tuin
Nieuwe categorieën
Zin, sentence, clause: S (‘complete
thought’).
RelClause: relatieve bijzin: vluchten die
vertrekken in de ochtend
GerundVP: flights departing in the morning
Wh-NP: Welke van deze vluchten zijn
direct?
Taalvariatie
Niet alle talen gebruiken dezelfde
woordgroepen (b.v. Nederlands heeft geen
gerund).
Let op: wanneer je herschrijfregels
formuleert voor de taal in je project, zorg dan
dat ze alle grammaticale constructies
genereren, en geen ongrammaticale.
Met herschrijfregels formuleer je een
grammatica die ‘blind’ moet worden
toegepast.
Knopen benoemen
[Nman]
[Aoude]
[Dde]
[N’oude man]
[NPde [N’oude man]
[DPde [N’oude man]
Benoemen van knopen in boom
S
NP/DP
Det
alle
N’
A
N
blauwe boeken
VP
V
liggen
PP
P
op
NP
D
de
N
tafel
Herschrijfregels
Herschrijfregels, productieregels
Fonologie, morfologie: vaak finite state.
Voor syntaxis meestal: context-vrije
grammatica
Phrase structure rules zijn formules om
woordgroepen mee te maken.
A  B C
A
bestaat uit B en C, C volgt op B
bv. S  NP VP ‘Jan lachte’, ‘de man viel’
Algemene principes
Algemene vorm van zo’n herschrijfregel: A
 1 ... n
Waarbij A is een non-terminaal symbool
(een categorie), 1 is een (non-)terminaal
symbool (een categorie of een woord)
Er is een startsymbool S.
Contekstvrije grammatica
Een context-vrije herschrijfgrammatica G
(een CFG) is een verzameling van phrase
structure regels met een startsymbool S.
G genereert een taal: de verzameling
strings die bestaat uit terminale symbolen
afgeleid uit S.
Derivatie: de stapsgewijze productie van
een rijtje woorden (en tegelijk een boom)
door een grammatica.
Derivatie: bouwen van een boom












S
NP VP
Det Nom VP
de Nom VP
de Noun VP
de vrouw VP
de vrouw Verb NP
de vrouw kust NP
de vrouw kust Det Nom
de vrouw kust de Nom
de vrouw kust de Noun
de vrouw kust de man
startsymbool
door S  NP VP
door NP  Det Nom
door Det  de
door Nom  Noun
door Noun  vrouw
door VP  Verb NP
door Verb  kust
door NP  Det Nom
door Det  de
door Nom  Noun
door Noun  man
Oefeningen
1) Maak oefening 12.1 uit het boek.
2) Check of je de structuren kunt afleiden
door middel van de in het boek gegeven
regels. Introduceer nieuwe herschrijfregels
indien nodig.
Download