Coherence structure and lexical cohesion in expository and persuasive texts Constraints in Discourse III 30 July – 1 August 2008 Ildikó Berzlánovich, Markus Egg, Gisela Redeker University of Groningen Center for Language and Cognition The MTO Project |2 › Modelling Textual Organisation (MTO) › financed by a grant from NWO › project leaders: Markus Egg Gisela Redeker › http://www.let.rug.nl/mto/ Alignment hypothesis |3 Lexical cohesion is more closely aligned with coherence in thematically organised texts than in intentionally organised texts. Specifically: › close alignment in expository texts › less or no alignment in persuasive texts Outline |4 › › › › › › Discourse organisation Corpus Method (genre, coherence, cohesion) Results (coherence, cohesion, alignment) Conclusion Future work Discourse organisation Results Conclusion Future work Corpus Method (genre, coherence, cohesion) |5 GENRE 1 GENRE 2 COHERENCE COHERENCE COHESION COHESION text 1 text 1 COHERENCE COHERENCE COHESION COHESION text 2 text 2 Discourse organisation Results Conclusion Future work Corpus Method (genre, coherence, cohesion) |6 GENRE 1 GENRE 2 COHERENCE COHERENCE COHESION COHESION text 1 text 1 COHERENCE COHERENCE COHESION COHESION text 2 text 2 Discourse organisation Results Conclusion Future work Corpus Method (genre, coherence, cohesion) |7 GENRE 1 GENRE 2 COHERENCE COHERENCE COHESION COHESION text 1 text 1 COHERENCE COHERENCE COHESION COHESION text 2 text 2 Discourse organisation Results Conclusion Future work Corpus Method (genre, coherence, cohesion) |8 GENRE 1 GENRE 2 COHERENCE COHERENCE ↕ ↕ COHESION COHESION text 1 text 1 COHERENCE COHERENCE ↕ ↕ COHESION COHESION text 2 text 2 Discourse organisation Corpus Method (genre, coherence, cohesion) Results Conclusion Future work |9 Genre › class of communicative events with common communicative purposes shared in a discourse community (Swales 1990) › global schematic structure – “moves” Coherence › underlying relations between propositions in text Cohesion › semantic relations between surface elements in text Discourse organisation Corpus Method (genre, coherence, cohesion) Results Conclusion Future work |10 Corpus in the MTO project › expository texts - encyclopedia entries - short news stories › persuasive texts - fundraising letters - advertisements › “mixed” genres - news analyses, commentaries, editorials (?) - reviews Discourse organisation Corpus Method (genre, coherence, cohesion) Results Conclusion Future work |11 Texts for pilot study › expository texts: encyclopedia entries (EE01, EE02) › persuasive texts: fundraising letters (FL01, FL02) Discourse organisation Corpus Method (genre, coherence, cohesion) Results Conclusion Future work |12 Encyclopedia entries 1. 2. 3. 4. name the object define the object describe in general (e.g., size, age, category) describe details (e.g., surface, past/future development, discovery) Fundraising letters - seven moves (Upton 2002) 1. 2. 3. 4. 5. 6. 7. get attention introduce the cause and/or establish credentials of organisation solicit response offer incentive reference insert express gratitude conclude with pleasantries Discourse organisation Corpus Method (genre, coherence, cohesion) Results Conclusion Future work |13 Fragment from EE01 (De Zon) Na vorming van de zon en het zonnestelsel is onze ster begonnen aan een lang bestaan als zogenaamde dwergster. In de dwergfase van het leven van de zon wordt de energie die ze uitstraalt in het centrum geproduceerd door fusie van waterstof tot helium. De zon is nu ongeveer vijf miljard jaar oud en heeft nog brandstof voor nog eens vijf miljard jaar. After the forming of the sun and the solar system, our star began its long existence as a so-called dwarf star. In the dwarf phase of its life, the energy that the sun gives off is generated in its core through the fusion of hydrogen into helium. The sun is about five billion years old now and it still has enough fuel for another five billion years. Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |14 Rhetorical Structure Theory (Mann & Thompson 1988) › › › › functional relations between propositions reconstruction of writer’s purposes subject-matter vs. presentational relations mononuclear relations multinuclear relations 1-2 1-2 Elaboration Conjunction Na vorming van de zon en het zonnestelsel is onze ster begonnen aan een lang bestaan als zogenaamde dwergster. In de dwergfase van het leven van de zon wordt de energie die ze uitstraalt in het centrum geproduceerd door fusie van waterstof tot helium. De zon is nu ongeveer vijf miljard jaar oud en heeft nog brandstof voor nog eens vijf miljard jaar. Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |15 hierarchy 1-4 Elaboration 1-2 3-4 Elaboration Conjunction Na vorming van de In de dwergfase van De zon is nu en heeft nog zon en het het leven van de zon ongeveer vijf miljard brandstof voor nog zonnestelsel is onze wordt de energie die jaar oud eens vijf miljard jaar. ster begonnen aan ze uitstraalt in het een lang bestaan als centrum zogenaamde geproduceerd door dwergster. fusie van waterstof tot helium. Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |16 hierarchy 1-31 Elaboration 1 2-31 1 De Zon 2-4 Elaboration Elaboration 5-16 17-31 Elaboration Circumstance Joint 2 De zon is op een 3-4 afstand van 150 5-8 9-16 Bgr or contrast (mn) Elaboration Evaluation 17-19 20-31 18-19 20-21 Nonvolitional-cause Nonvolitional-cause miljoen kilometer de dichtstbijzijnde ster. 3 Licht dat het 4 Ter vergelijking, de oppervlak van de op de zon na meest zon verlaat bereikt in nabije ster, Proxima slechts acht minuten Centauri, staat op een de aarde. afstand waar het licht vier jaar en vier maanden over doet.# 5-6 7-8 9 Het is een beetje 10-16 17 De zon is zo dicht pijnlijk om toe te Elaboration Conjunction bij de aarde Elaboration Interpretation 22-31 Rest or elab or rest-mn (mn) Elaboration moeten geven, 5 Na vorming van de 6 In de dwergfase 7 De zon is nu 8 en heeft nog 10 maar onze zon is zon en het van het leven van ongeveer vijf miljard brandstof voor nog maar een heel zonnestelsel is onze de zon wordt de jaar oud eens vijf miljard jaar. gewoon sterretje. ster begonnen aan energie die ze een lang bestaan als uitstraalt in het zogenaamde centrum dwergster. geproduceerd door 11-16 List 11-12 13-14 18 dat we het 19 wat bij de meeste 20 Het oppervlak 21 er is allerlei 22 Dat wordt oppervlak in detail andere sterren blijkt verre van glad structuur op te zien. veroorzaakt door kunnen bestuderen, onmogelijk is. en egaal te zijn; 23-31 Nonvolitional-cause trillingen van het zonsoppervlak en 15-16 23-25 26-31 door het Nonvolitional-cause magneetveld van de Conjunction fusie van waterstof 11 Niet heel erg 12 maar ook weer tot helium. helder, niet heel erg lichtzwak; Conjunction 13 niet erg zwaar, 14 maar ook niet erg licht; Conjunction 15 niet heel groot, Nonvolitional-result zon. 16 maar ook niet 23-24 heel klein.# 25 wordt het magneetveld dat in Conj or circ (mono) 23 Omdat de zon in 24 waarbij de ongeveer 28 dagen evenaar sneller om zijn as draait, draait dan de polen 26-28 29-31 27-28 29-30 Condition Elaboration het gas is ingevroren opgewonden. 26 Als dat te strak wordt 31 Op het plaatje is Elaboration 28 en krijgt een 29 Daarbij kunnen 30 die we magneetveld los van nieuwe structuur. prachtige lussen en protuberansen uitsteeksels gevormd noemen. het gas er rechts boven één te zien. Conj or seq 27 breekt het worden Discourse organisation Corpus Method (genre, coherence, cohesion) Results Conclusion Future work |17 › lexical cohesion › network of relations › lexical semantic relations (Halliday & Matthiessen 2004, Morris & Hirst 1991 ) - repetition - systematic semantic relations hyponymy (hyperonymy, co-hyponymy) meronymy (holonymy, co-meronymy) synonymy antonymy - collocation Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |18 Repetition 1-4 Elaboration 1-2 3-4 Elaboration Conjunction Na vorming van de In de dwergfase van zon en het het leven van de zon wordt de energie die ze uitstraalt in het centrum geproduceerd door fusie van waterstof tot helium. zonnestelsel is onze ster begonnen aan een lang bestaan als zogenaamde dwergster. De zon is nu ongeveer vijf miljard en heeft nog brandstof voor nog jaar oud eens vijf miljard jaar. Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |19 Hyponymy 1-4 Elaboration 1-2 3-4 Elaboration Conjunction Na vorming van de zon en het zonnestelsel is onze ster begonnen aan een lang bestaan als zogenaamde dwergster. In de dwergfase van het leven van de zon wordt de energie die ze uitstraalt in het centrum geproduceerd door fusie van waterstof tot helium. De zon is nu ongeveer vijf miljard jaar oud en heeft nog brandstof voor nog eens vijf miljard jaar. Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |20 Meronymy 1-4 Elaboration 1-2 3-4 Elaboration Conjunction Na vorming van de In de dwergfase van De zon is nu zon en het het leven van de zon ongeveer vijf miljard jaar oud wordt de energie die zonnestelsel is onze ster begonnen aan ze uitstraalt in het een lang bestaan als centrum zogenaamde geproduceerd door fusie van waterstof tot dwergster. helium. en heeft nog brandstof voor nog eens vijf miljard jaar. Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |21 Synonymy 1-4 Elaboration 1-2 3-4 Elaboration Conjunction Na vorming van de zon en het zonnestelsel is onze ster begonnen aan In de dwergfase van het leven van de zon wordt de energie die ze uitstraalt in het een lang bestaan alscentrum zogenaamde geproduceerd door fusie van waterstof tot dwergster. helium. De zon is nu ongeveer vijf miljard jaar oud en heeft nog brandstof voor nog eens vijf miljard jaar. Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |22 Collocation 1-4 Elaboration 1-2 3-4 Elaboration Conjunction Na vorming van de zon en het zonnestelsel is onze ster begonnen aan een lang bestaan als zogenaamde dwergster. In de dwergfase van De zon is nu het leven van de zon ongeveer vijf miljard jaar oud wordt de energie die ze uitstraalt in het centrum geproduceerd door fusie van waterstof tot helium. en heeft nog brandstof voor nog eens vijf miljard jaar. Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |23 1-4 Elaboration 1-2 3-4 Elaboration Conjunction Na vorming van de zon en het zonnestelsel is onze ster begonnen aan een lang bestaan als zogenaamde dwergster. In de dwergfase van het leven van de zon wordt de energie die ze uitstraalt in het centrum geproduceerd door fusie van waterstof tot helium. De zon is nu ongeveer vijf miljard jaar oud en heeft nog brandstof voor nog eens vijf miljard jaar. Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |24 Centrality of discourse units EDUs in coherence structure in lexical cohesion Moves smallest units in RST tree top level of RST tree lexical cohesive links per EDU average lexical cohesive density Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |25 EE01 1-31 Elaboration 1 2-31 NAME Elaboration Elaboration 2-4 DEFINE 2 Elaboration 3-4 5-16 17-31 DESCRIBE IN GENERAL DESCRIBE DETAILS Discourse organisation Corpus Results Conclusion Method (genre, coherence, cohesion) Future work |26 FL01 1-24 Preparation 1-2 3-24 GET ATTENTION Motivation 3-19 Motivation 20-23 Preparation 3-8 EXPRESS GRATITUDE 9-19 GET ATTENTION 20-23 SOLICIT RESPONSE Solutionhood 9-11 24 12-19 INTRODUCE CREDENTIALS OF ORGANISATION CAUSE 16-19 Discourse organisation Results (coherence, cohesion, alignment) Corpus Conclusion Method (genre, coherence, cohesion) Future work |27 Coherence relations Subject-matter (incl. multinuclear) relations Presentational relations EE01 EE02 FL01 FL02 28 26 10 10 0 1 12 10 Discourse organisation Results (coherence, cohesion, alignment) Corpus Conclusion Method (genre, coherence, cohesion) Future work |28 Type of cohesion Repetition EE01 EE02 FL01 FL02 30 21 % 35 20 % 23 29 % 39 48 % Systematic 104 semantic links 73 % 131 76 % 33 42 % 6 7% 6% 6 4% 23 29 % 37 45 % 142 100 % 172 100 % 79 100 % 82 100 % Collocation TOTAL 8 Discourse organisation Results (coherence, cohesion, alignment) Corpus Conclusion Method (genre, coherence, cohesion) Future work |29 50 Number of lexical cohesive links 45 40 35 30 25 20 EE01 15 EE02 10 FL01 5 FL02 0 1 3 5 7 9 11 13 15 17 19 21 Elementary discourse units 23 25 27 29 31 Discourse organisation Results (coherence, cohesion, alignment) Corpus Conclusion Method (genre, coherence, cohesion) Future work |30 EE01 internal links 50 external links 45 Number of external and internal cohesive links 40 35 30 25 20 15 10 5 0 1 3 1 2-4 NAME DEFINE 5 7 9 11 13 15 5-16 DESCRIBE IN GENERAL 17 19 21 23 25 27 17-31 DESCRIBE DETAILS 29 31 Discourse organisation Results (coherence, cohesion, alignment) Corpus Conclusion Method (genre, coherence, cohesion) Future work |31 FL01 internal links Number of external and internal cohesive links 25 external links 20 15 10 5 0 1 3 5 7 1-8 GET ATTENTION 9 11 9-11 INTRODUCE CAUSE 13 15 17 12-19 ESTABLISH CREDENTIALS OF ORGANISATION 19 21 23 24 20-23 EXPRESS SOLICIT RESPONSE GRATITUDE Discourse organisation Results (coherence, cohesion, alignment) Corpus Conclusion Method (genre, coherence, cohesion) Future work |32 EE01 Genre-specific moves EDUs Number of EDUs Density Name 1 1 2.0 Define 2-4 3 15.0 Describe in general (1) 5-8 4 12.3 Describe in general (2) 9-16 8 2.4 Describe details (1) 17-22 6 4.8 Describe details (2) 23-31 9 2.2 31 4.6 Total Discourse organisation Results (coherence, cohesion, alignment) Corpus Conclusion Method (genre, coherence, cohesion) Future work |33 FL01 Genre-specific moves Get attention (1) Get attention (2) Introduce cause Credentials of organisation Solicit response Express gratitude Total EDUs Number of EDUs Density 1-2 3-8 9-11 2 6 3 11.0 5.2 3.7 12-19 8 2.5 20-23 4 2.8 24 1 5.0 24 3.3 Discourse organisation Corpus Method (genre, coherence, cohesion) Results Conclusion Future work |34 › EE: Define is the central move both in coherence and in lexical cohesion › FL: Solicit response is the central move in coherence, but no central move was found for lexical cohesion → alignment much closer for EE than for FL Discourse organisation Corpus Method (genre, coherence, cohesion) Results Conclusion Future work |35 › corpus building - more texts - more genres (e.g., advertisements, reviews) › refinement of centrality measures › comparison of RST trees and tree structures based on lexical cohesion