Zinnen 1 Henriëtte de Swart Combinaties Taal maakt combinaties op verschillende niveaus: Fonemen combineren tot morfemen (creëren van betekenis) Morfemen combineren tot woorden (complexe betekenissen) Woorden combineren tot woordgroepen, zinnen en teksten (meer complexe betekenissen). Wat is syntaxis? Syntaxis bestudeert de combinaties van woorden tot woordgroepen en zinnen. Zinnen 1: structuur, bomen, herschrijfregels (de Swart) Zinnen 2: kenmerken, processen, transformaties, afhankelijkheden (Winter) Complexiteit (Chernilovskaya) Let op: colleges zinnen 1+2 horen bij tentamenstof toets 1. Complexiteit bij toets 2. Stof bij dit college Uit het boek: hoofdstuk 12 (vanaf begin t/m 12.3, over structuur, herschrijfregels, woordgroepen en zinnen); Hoofdstuk 12 (sectie 12.5, sectie 12.6, sectie 12.7.2, over grammatica’s); Hoofdstuk 13 (sectie 13.2, over ambiguïteit). Dit college Syntactische verschijnselen (waar kijken we naar?) Syntactische doelstellingen (generatie, parsing, theorie en toepassing) Syntactische categorieën (woordsoorten, parts of speech) Syntactische structuren (constituenten, zinnen) Syntactische regels (grammatica’s) Syntactische verschijnselen Syntaxis is de moderne pendant van de traditionele grammatica: woordsoorten (werkwoord, lidwoord, …) zinsdelen (onderwerp, persoonsvorm, …) zinsbouw redekundig en taalkundig ontleden Maar er zijn belangrijke verschillen: theoretisch en toegepast. Syntactische verschijnselen Patronen van (on)grammaticaliteit Jan at een boterham Jan at Jan verorberde een boterham *Jan verorberde Jan smulde *(van) een boterham Jan smulde Transitieve en intransitieve werkwoorden, voorzetsels: subcategorisatie Syntactische verschijnselen Goed of fout? Hun doen maar wat Een aantal studenten zijn afgevallen http://dewerelddraaitdoor.vara.nl/Videodetail.628.0.html?&no_cache=1&tx_ttnews%5Btt_news%5D=14990 &tx_ttnews%5BbackPid%5D=626&tx_ttnews%5Bcat%5D=148 Voor iedereen ongrammaticaal: *Hem doet maar wat *Een van de studenten zijn afgevallen Congruentie en naamval Syntactische verschijnselen Wat betekent deze zin: Oude mannen en vrouwen eerst! Oude [mannen en vrouwen] [Oude mannen] en vrouwen Jan zag de man met de verrekijker zag [de man met de verrekijker] [zag [de man]] [met de verrekijker] Structurele ambiguïteit Syntactische verschijnselen Jan zag de man met de verrekijker *Jan zag wie? *Jan zag de man hoe? *Wie Jan zag? *Hoe Jan zag de man met de verrekijker? Wie zag Jan? Hoe zag Jan de man met de verrekijker? Verplaatsing en afhankelijkheden: woordvolgorde, relaties tussen woordgroepen Varianten op dezelfde zin Jan zag de man met de verrekijker (bewerende, declaratieve zin) Wie zag Jan? (vraagzin) Zie de man met de verrekijker! (imperatieve zin) Romeo kuste Julia (actieve vorm) Julia werd door Romeo gekust (lijdende vorm) Recursie en oneindigheid Jan vond de sleutel. Jan vond de sleutel van de deur. Jan vond de sleutel van de deur van de garage. Jan vond de sleutel van de deur van de garage van de limousine. Jan vond … Syntactische doelstellingen Onbewuste kennis van een modertaalgebruiker (competence) karakteriseren. Het oneindige, grammaticale gebruik van eindige middelen (creativiteit van taal). Descriptief en niet prescriptief! Perspectief van taalproductie (generatie – hoe bouw je zinnen?) en taalverwerking (processing, parsing – hoe begrijpen mensen/computers zinsstructuur). Formele grammatica Syntactische theorie wil een expliciete karakterisering geven van de taalkennis, door middel van precieze, formele regels. Generatieve grammatica (Chomsky): een definitie van de verzameling grammaticale zinnen en woordgroepen: generatie van alle grammaticale uitdrukkingen, en uitsluiting van alle ongrammaticale uitdrukkingen. Processing/parsing Processing: verwerking in het brein, waarbij de onderliggende structuur van stroom woorden wordt herkend. Verwerkingsstap tussen auditieve perceptie (herkenning van klanken) en interpretatie. Parsing (computationele toepassingen): omzetten van strings van woorden in structurele representatie van structuur en afhankelijkheidsrelaties. Taal in het brein Taal als kennissysteem: ‘software’. Opgeslagen in brein: ‘wetware’ Bij rechtshandige mensen vooral in linkerhersenhelft. Gebieden specifiek voor taal: Wernicke’s gebied (taalbegrip), Broca’s area (spraakproductie). Garden path effect The horse raced past the barn fell. [The horse raced past the barn] Heranalyse: raced is geen simple past, maar past participle. Vgl. The car driven past the barn crashed. Meer ‘intuinzinnen’ The government plans to raise taxes were defeated. Time flies like an arrow; fruit flies like a banana. Ik sloeg meermaals de man met de wandelstok gade. Stowe et al (2004) tonen aan dat dit soort ambiguïteiten leiden tot activiteit in de rechter frontale kwab, waar ook humor een rol speelt. Taalvariatie Verschillen en overeenkomsten tussen talen verantwoorden in één universeel regelsysteem. Wh-verplaatsing: verplicht in Nederlands, niet in Swahili: Wie zag Jan? - *Jan zag wie? - *Wie Jan zag? Jan aliona nani? - *Nani Jan aliona? - *Nani aliona Jan? (Swahili) Universele Grammatica: mogelijkheden en onmogelijkheden van taalvariatie. Syntactische constituenten Een zin is nooit een platte rij woorden, maar heeft een bepaalde opbouw, structuur. Vgl. met de structuur van lettergrepen (fonologie) en woorden (morfologie). Woorden vormen met elkaar woordgroepen = constituenten = phrases Een constituent kan worden aangegeven met rechte haken: [oude [mannen en vrouwen]] Motivatie voor constituentstructuur Een constituent gedraagt zich als een eenheid voor bepaalde syntactische verschijnselen (en zo kunnen we een constituent ook motiveren). Nederlands als V2 taal: bijna alles wat voor het werkwoord komt vormt één constituent: [Jan] lacht, [oude mannen en vrouwen] gaan eerst, [gisteren om half elf] vertrokken we, [op een oude fiets met handremmen] gaat het langzamer, [alle oude schoenen die ik in de afgelopen jaren heb verzameld] gooi ik nu weg,… Disambigueren Jan zag de man met de verrekijker De man met de verrekijker werd gisteren nog gesignaleerd. De man die Jan zag met de verrekijker liep hard weg. Wie zag Jan? Wie zag Jan met de verrekijker? Interne structuur Jan zag de man met de verrekijker De verrekijker Met de verrekijker De man met de verrekijker Zag de man met de verrekijker [Jan [zag [de man [met [de verrekijker]]]]] Boomstructuur 1 Jan zag de man De constituenten van een zin met kunnen worden aangegeven door middel van een boomstructuur de verrekijker Boomstructuur 2 Jan zag de man met de verrekijker Woordsoorten: nomina De woorden van een taal vormen niet één grote homogene verzameling, maar er zijn woordsoorten, categorieën, parts of speech. Noun, nomen, substantief, zelfstandig naamwoord: mannen, vrouwen, man, verrekijker, zand Afgekort als N Mogelijke boomstructuren Chomskyaanse bomen: binaire vertakking Lastig: mannen en vrouwen Welke drie structuren zijn mogelijk? Welke argumenten kun je bedenken voor de structuur [mannen [en vrouwen]]? Let op bij het tekenen van bomen voor je taal in het groepsproject. Gebruik hiervoor binaire vertakkingen tenzij je goede redenen hebt om dat niet te doen.. Meer woordsoorten Verbum, verb, afgekort als V: ziet, at, verorberde, smulde, doen, zijn, zag, kust, gekust, doet, afgevallen, is.. Adjectief, adjective, bijvoeglijk naamwoord, afgekort als A: oude, vriendelijke, blauwe, … Ook adverbia: gisteren, wel, .. Meer woordsoorten Preposities, voorzetsels, afgekort als P: met, in, op, door, van… Determiner, lidwoord, afgekort als D: de, het, een. Categorie D is ruimer dan alleen lidwoord, ook kwantoren (enkele, alle, geen,..) demonstratieven (deze, die, ..), whwoorden (welke). Verbindingswoorden Conjunction, conjunctie: nevenschikkend voegwoord (en, of, want), afgekort als Conj of C. Complementizer: speciale term voor onderschikkend voegwoord (dat, of), afgekort als Comp of C. Voorbeelden van twee soorten of: neem je soep of salade? Weet je of Jan komt? Subcategorieën Proper name, eigennaam, afgekort als PN: Jan, Susanne, Sinterklaas,.. Pronoun, pronomen, persoonlijk voornaamwoord: ik, hij, hem, hun. Auxiliary of hulpwerkwoord, afgekort als Aux: hebben, zijn, worden, kunnen, willen, .. Ik heb geslapen, hij is gekomen, hij wordt gekust, ik kan komen, hij wil komen. Benoemen van woordgroepen Categorie hoofd van constituent geeft naam aan woordgroep: Naamwoord – naamwoordelijke constituent NP: de man, Sinterklaas Determinator – determiner phrase DP: de man, iedere student Werkwoord – werkwoordelijke constituent VP: lachte, zag de man Voorzetsel – voorzetselgroep PP: met de verrekijker, in de tuin Nieuwe categorieën Zin, sentence, clause: S (‘complete thought’). RelClause: relatieve bijzin: vluchten die vertrekken in de ochtend GerundVP: flights departing in the morning Wh-NP: Welke van deze vluchten zijn direct? Taalvariatie Niet alle talen gebruiken dezelfde woordgroepen (b.v. Nederlands heeft geen gerund). Let op: wanneer je herschrijfregels formuleert voor de taal in je project, zorg dan dat ze alle grammaticale constructies genereren, en geen ongrammaticale. Met herschrijfregels formuleer je een grammatica die ‘blind’ moet worden toegepast. Knopen benoemen [Nman] [Aoude] [Dde] [N’oude man] [NPde [N’oude man] [DPde [N’oude man] Benoemen van knopen in boom S NP/DP Det alle N’ A N blauwe boeken VP V liggen PP P op NP D de N tafel Herschrijfregels Herschrijfregels, productieregels Fonologie, morfologie: vaak finite state. Voor syntaxis meestal: context-vrije grammatica Phrase structure rules zijn formules om woordgroepen mee te maken. A B C A bestaat uit B en C, C volgt op B bv. S NP VP ‘Jan lachte’, ‘de man viel’ Algemene principes Algemene vorm van zo’n herschrijfregel: A 1 ... n Waarbij A is een non-terminaal symbool (een categorie), 1 is een (non-)terminaal symbool (een categorie of een woord) Er is een startsymbool S. Contekstvrije grammatica Een context-vrije herschrijfgrammatica G (een CFG) is een verzameling van phrase structure regels met een startsymbool S. G genereert een taal: de verzameling strings die bestaat uit terminale symbolen afgeleid uit S. Derivatie: de stapsgewijze productie van een rijtje woorden (en tegelijk een boom) door een grammatica. Derivatie: bouwen van een boom S NP VP Det Nom VP de Nom VP de Noun VP de vrouw VP de vrouw Verb NP de vrouw kust NP de vrouw kust Det Nom de vrouw kust de Nom de vrouw kust de Noun de vrouw kust de man startsymbool door S NP VP door NP Det Nom door Det de door Nom Noun door Noun vrouw door VP Verb NP door Verb kust door NP Det Nom door Det de door Nom Noun door Noun man Oefeningen 1) Maak oefening 12.1 uit het boek. 2) Check of je de structuren kunt afleiden door middel van de in het boek gegeven regels. Introduceer nieuwe herschrijfregels indien nodig.