RUG - Template basic ENG

advertisement
Coherence structure and lexical cohesion
in expository and persuasive texts
Constraints in Discourse III
30 July – 1 August 2008
Ildikó Berzlánovich, Markus Egg, Gisela Redeker
University of Groningen
Center for Language and Cognition
The MTO Project
|2
› Modelling Textual Organisation (MTO)
› financed by a grant from NWO
› project leaders:
Markus Egg
Gisela Redeker
› http://www.let.rug.nl/mto/
Alignment hypothesis
|3
Lexical cohesion is more closely aligned with
coherence in thematically organised texts
than in intentionally organised texts.
Specifically:
› close alignment in expository texts
› less or no alignment in persuasive texts
Outline
|4
›
›
›
›
›
›
Discourse organisation
Corpus
Method (genre, coherence, cohesion)
Results (coherence, cohesion, alignment)
Conclusion
Future work
Discourse organisation
Results
Conclusion
Future work
Corpus
Method (genre, coherence, cohesion)
|5
GENRE 1
GENRE 2
COHERENCE
COHERENCE
COHESION
COHESION
text 1
text 1
COHERENCE
COHERENCE
COHESION
COHESION
text 2
text 2
Discourse organisation
Results
Conclusion
Future work
Corpus
Method (genre, coherence, cohesion)
|6
GENRE 1
GENRE 2
COHERENCE
COHERENCE
COHESION
COHESION
text 1
text 1
COHERENCE
COHERENCE
COHESION
COHESION
text 2
text 2
Discourse organisation
Results
Conclusion
Future work
Corpus
Method (genre, coherence, cohesion)
|7
GENRE 1
GENRE 2
COHERENCE
COHERENCE
COHESION
COHESION
text 1
text 1
COHERENCE
COHERENCE
COHESION
COHESION
text 2
text 2
Discourse organisation
Results
Conclusion
Future work
Corpus
Method (genre, coherence, cohesion)
|8
GENRE 1
GENRE 2
COHERENCE
COHERENCE
↕
↕
COHESION
COHESION
text 1
text 1
COHERENCE
COHERENCE
↕
↕
COHESION
COHESION
text 2
text 2
Discourse organisation
Corpus
Method (genre, coherence, cohesion)
Results
Conclusion
Future work
|9
Genre
› class of communicative events with common communicative
purposes shared in a discourse community (Swales 1990)
› global schematic structure – “moves”
Coherence
› underlying relations between propositions in text
Cohesion
› semantic relations between surface elements in text
Discourse organisation
Corpus
Method (genre, coherence, cohesion)
Results
Conclusion
Future work
|10
Corpus in the MTO project
› expository texts
- encyclopedia entries
- short news stories
› persuasive texts
- fundraising letters
- advertisements
› “mixed” genres
- news analyses, commentaries, editorials (?)
- reviews
Discourse organisation
Corpus
Method (genre, coherence, cohesion)
Results
Conclusion
Future work
|11
Texts for pilot study
› expository texts: encyclopedia entries (EE01, EE02)
› persuasive texts: fundraising letters (FL01, FL02)
Discourse organisation
Corpus
Method (genre, coherence, cohesion)
Results
Conclusion
Future work
|12
Encyclopedia entries
1.
2.
3.
4.
name the object
define the object
describe in general (e.g., size, age, category)
describe details (e.g., surface, past/future development, discovery)
Fundraising letters - seven moves (Upton 2002)
1.
2.
3.
4.
5.
6.
7.
get attention
introduce the cause and/or establish credentials of organisation
solicit response
offer incentive
reference insert
express gratitude
conclude with pleasantries
Discourse organisation
Corpus
Method (genre, coherence, cohesion)
Results
Conclusion
Future work
|13
Fragment from EE01 (De Zon)
Na vorming van de zon en het zonnestelsel is onze ster begonnen aan
een lang bestaan als zogenaamde dwergster. In de dwergfase van het
leven van de zon wordt de energie die ze uitstraalt in het centrum
geproduceerd door fusie van waterstof tot helium. De zon is nu ongeveer
vijf miljard jaar oud en heeft nog brandstof voor nog eens vijf miljard jaar.
After the forming of the sun and the solar system, our star began its long
existence as a so-called dwarf star. In the dwarf phase of its life, the
energy that the sun gives off is generated in its core through the fusion of
hydrogen into helium. The sun is about five billion years old now and it still
has enough fuel for another five billion years.
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|14
Rhetorical Structure Theory (Mann & Thompson 1988)
›
›
›
›
functional relations between propositions
reconstruction of writer’s purposes
subject-matter vs. presentational relations
mononuclear relations
multinuclear relations
1-2
1-2
Elaboration
Conjunction
Na vorming van de
zon en het
zonnestelsel is onze
ster begonnen aan
een lang bestaan als
zogenaamde
dwergster.
In de dwergfase van
het leven van de zon
wordt de energie die
ze uitstraalt in het
centrum
geproduceerd door
fusie van waterstof tot
helium.
De zon is nu
ongeveer vijf miljard
jaar oud
en heeft nog
brandstof voor nog
eens vijf miljard jaar.
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|15
hierarchy
1-4
Elaboration
1-2
3-4
Elaboration
Conjunction
Na vorming van de
In de dwergfase van
De zon is nu
en heeft nog
zon en het
het leven van de zon
ongeveer vijf miljard
brandstof voor nog
zonnestelsel is onze
wordt de energie die
jaar oud
eens vijf miljard jaar.
ster begonnen aan
ze uitstraalt in het
een lang bestaan als
centrum
zogenaamde
geproduceerd door
dwergster.
fusie van waterstof tot
helium.
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|16
hierarchy
1-31
Elaboration
1
2-31
1 De Zon
2-4
Elaboration
Elaboration
5-16
17-31
Elaboration
Circumstance
Joint
2 De zon is op een
3-4
afstand van 150
5-8
9-16
Bgr or contrast (mn)
Elaboration
Evaluation
17-19
20-31
18-19
20-21
Nonvolitional-cause
Nonvolitional-cause
miljoen kilometer de
dichtstbijzijnde ster.
3 Licht dat het
4 Ter vergelijking, de
oppervlak van de
op de zon na meest
zon verlaat bereikt in
nabije ster, Proxima
slechts acht minuten
Centauri, staat op een
de aarde.
afstand waar het licht
vier jaar en vier
maanden over doet.#
5-6
7-8
9 Het is een beetje
10-16
17 De zon is zo dicht
pijnlijk om toe te
Elaboration
Conjunction
bij de aarde
Elaboration
Interpretation
22-31
Rest or elab or rest-mn (mn)
Elaboration
moeten geven,
5 Na vorming van de
6 In de dwergfase
7 De zon is nu
8 en heeft nog
10 maar onze zon is
zon en het
van het leven van
ongeveer vijf miljard
brandstof voor nog
maar een heel
zonnestelsel is onze
de zon wordt de
jaar oud
eens vijf miljard jaar.
gewoon sterretje.
ster begonnen aan
energie die ze
een lang bestaan als
uitstraalt in het
zogenaamde
centrum
dwergster.
geproduceerd door
11-16
List
11-12
13-14
18 dat we het
19 wat bij de meeste
20 Het oppervlak
21 er is allerlei
22 Dat wordt
oppervlak in detail
andere sterren
blijkt verre van glad
structuur op te zien.
veroorzaakt door
kunnen bestuderen,
onmogelijk is.
en egaal te zijn;
23-31
Nonvolitional-cause
trillingen van het
zonsoppervlak en
15-16
23-25
26-31
door het
Nonvolitional-cause
magneetveld van de
Conjunction
fusie van waterstof
11 Niet heel erg
12 maar ook weer
tot helium.
helder,
niet heel erg
lichtzwak;
Conjunction
13 niet erg zwaar,
14 maar ook niet erg
licht;
Conjunction
15 niet heel groot,
Nonvolitional-result
zon.
16 maar ook niet
23-24
heel klein.#
25 wordt het
magneetveld dat in
Conj or circ (mono)
23 Omdat de zon in
24 waarbij de
ongeveer 28 dagen
evenaar sneller
om zijn as draait,
draait dan de polen
26-28
29-31
27-28
29-30
Condition
Elaboration
het gas is ingevroren
opgewonden.
26 Als dat te strak
wordt
31 Op het plaatje is
Elaboration
28 en krijgt een
29 Daarbij kunnen
30 die we
magneetveld los van
nieuwe structuur.
prachtige lussen en
protuberansen
uitsteeksels gevormd
noemen.
het gas
er rechts boven één
te zien.
Conj or seq
27 breekt het
worden
Discourse organisation
Corpus
Method (genre, coherence, cohesion)
Results
Conclusion
Future work
|17
› lexical cohesion
› network of relations
› lexical semantic relations (Halliday & Matthiessen 2004, Morris &
Hirst 1991 )
- repetition
- systematic semantic relations
hyponymy (hyperonymy, co-hyponymy)
meronymy (holonymy, co-meronymy)
synonymy
antonymy
- collocation
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|18
Repetition
1-4
Elaboration
1-2
3-4
Elaboration
Conjunction
Na vorming van de
In de dwergfase van
zon en het
het leven van de zon
wordt de energie die
ze uitstraalt in het
centrum
geproduceerd door
fusie van waterstof tot
helium.
zonnestelsel is onze
ster begonnen aan
een lang bestaan als
zogenaamde
dwergster.
De zon is nu
ongeveer vijf miljard
en heeft nog
brandstof voor nog
jaar oud
eens vijf miljard jaar.
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|19
Hyponymy
1-4
Elaboration
1-2
3-4
Elaboration
Conjunction
Na vorming van de
zon en het
zonnestelsel is onze
ster begonnen aan
een lang bestaan als
zogenaamde
dwergster.
In de dwergfase van
het leven van de zon
wordt de energie die
ze uitstraalt in het
centrum
geproduceerd door
fusie van waterstof tot
helium.
De zon is nu
ongeveer vijf miljard
jaar oud
en heeft nog
brandstof voor nog
eens vijf miljard jaar.
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|20
Meronymy
1-4
Elaboration
1-2
3-4
Elaboration
Conjunction
Na vorming van de In de dwergfase van De zon is nu
zon en het
het leven van de zon ongeveer vijf miljard
jaar oud
wordt de energie die
zonnestelsel is onze
ster begonnen aan
ze uitstraalt in het
een lang bestaan als
centrum
zogenaamde
geproduceerd door
fusie van waterstof tot
dwergster.
helium.
en heeft nog
brandstof voor nog
eens vijf miljard jaar.
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|21
Synonymy
1-4
Elaboration
1-2
3-4
Elaboration
Conjunction
Na vorming van de
zon en het
zonnestelsel is onze
ster begonnen aan
In de dwergfase van
het leven van de zon
wordt de energie die
ze uitstraalt in het
een lang bestaan alscentrum
zogenaamde
geproduceerd door
fusie van waterstof tot
dwergster.
helium.
De zon is nu
ongeveer vijf miljard
jaar oud
en heeft nog
brandstof voor nog
eens vijf miljard jaar.
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|22
Collocation
1-4
Elaboration
1-2
3-4
Elaboration
Conjunction
Na vorming van de
zon en het
zonnestelsel is onze
ster begonnen aan
een lang bestaan als
zogenaamde
dwergster.
In de dwergfase van De zon is nu
het leven van de zon
ongeveer vijf miljard
jaar oud
wordt de energie die
ze uitstraalt in het
centrum
geproduceerd door
fusie van waterstof tot
helium.
en heeft nog
brandstof voor nog
eens vijf miljard jaar.
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|23
1-4
Elaboration
1-2
3-4
Elaboration
Conjunction
Na vorming van de
zon en het
zonnestelsel is onze
ster begonnen aan
een lang bestaan als
zogenaamde
dwergster.
In de dwergfase van
het leven van de zon
wordt de energie die
ze uitstraalt in het
centrum
geproduceerd door
fusie van waterstof tot
helium.
De zon is nu
ongeveer vijf miljard
jaar oud
en heeft nog
brandstof voor nog
eens vijf miljard jaar.
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|24
Centrality of discourse units
EDUs
in coherence
structure
in lexical
cohesion
Moves
smallest units
in RST tree
top level
of RST tree
lexical cohesive links
per EDU
average lexical
cohesive density
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|25
EE01
1-31
Elaboration
1
2-31
NAME
Elaboration Elaboration
2-4
DEFINE
2
Elaboration
3-4
5-16
17-31
DESCRIBE
IN GENERAL
DESCRIBE
DETAILS
Discourse organisation
Corpus
Results
Conclusion
Method (genre, coherence, cohesion)
Future work
|26
FL01
1-24
Preparation
1-2
3-24
GET
ATTENTION
Motivation
3-19
Motivation
20-23
Preparation
3-8
EXPRESS
GRATITUDE
9-19
GET
ATTENTION
20-23
SOLICIT
RESPONSE
Solutionhood
9-11
24
12-19
INTRODUCE CREDENTIALS OF
ORGANISATION
CAUSE
16-19
Discourse organisation
Results (coherence, cohesion, alignment)
Corpus
Conclusion
Method (genre, coherence, cohesion)
Future work
|27
Coherence relations
Subject-matter (incl.
multinuclear) relations
Presentational relations
EE01
EE02
FL01
FL02
28
26
10
10
0
1
12
10
Discourse organisation
Results (coherence, cohesion, alignment)
Corpus
Conclusion
Method (genre, coherence, cohesion)
Future work
|28
Type of
cohesion
Repetition
EE01
EE02
FL01
FL02
30
21 %
35
20 %
23
29 %
39
48 %
Systematic
104
semantic links
73 %
131
76 %
33
42 %
6
7%
6%
6
4%
23
29 %
37
45 %
142 100 %
172
100 %
79
100 %
82
100 %
Collocation
TOTAL
8
Discourse organisation
Results (coherence, cohesion, alignment)
Corpus
Conclusion
Method (genre, coherence, cohesion)
Future work
|29
50
Number of lexical cohesive links
45
40
35
30
25
20
EE01
15
EE02
10
FL01
5
FL02
0
1
3
5
7
9
11
13
15
17
19
21
Elementary discourse units
23
25
27
29
31
Discourse organisation
Results (coherence, cohesion, alignment)
Corpus
Conclusion
Method (genre, coherence, cohesion)
Future work
|30
EE01
internal links
50
external links
45
Number of external and
internal cohesive links
40
35
30
25
20
15
10
5
0
1
3
1
2-4
NAME DEFINE
5
7
9
11
13
15
5-16
DESCRIBE IN GENERAL
17
19
21
23
25
27
17-31
DESCRIBE DETAILS
29
31
Discourse organisation
Results (coherence, cohesion, alignment)
Corpus
Conclusion
Method (genre, coherence, cohesion)
Future work
|31
FL01
internal links
Number of external and
internal cohesive links
25
external links
20
15
10
5
0
1
3
5
7
1-8
GET ATTENTION
9
11
9-11
INTRODUCE
CAUSE
13
15
17
12-19
ESTABLISH
CREDENTIALS OF
ORGANISATION
19
21
23
24
20-23
EXPRESS
SOLICIT
RESPONSE GRATITUDE
Discourse organisation
Results (coherence, cohesion, alignment)
Corpus
Conclusion
Method (genre, coherence, cohesion)
Future work
|32
EE01
Genre-specific moves
EDUs
Number
of EDUs
Density
Name
1
1
2.0
Define
2-4
3
15.0
Describe in general (1)
5-8
4
12.3
Describe in general (2)
9-16
8
2.4
Describe details (1)
17-22
6
4.8
Describe details (2)
23-31
9
2.2
31
4.6
Total
Discourse organisation
Results (coherence, cohesion, alignment)
Corpus
Conclusion
Method (genre, coherence, cohesion)
Future work
|33
FL01
Genre-specific moves
Get attention (1)
Get attention (2)
Introduce cause
Credentials of
organisation
Solicit response
Express gratitude
Total
EDUs
Number
of EDUs
Density
1-2
3-8
9-11
2
6
3
11.0
5.2
3.7
12-19
8
2.5
20-23
4
2.8
24
1
5.0
24
3.3
Discourse organisation
Corpus
Method (genre, coherence, cohesion)
Results
Conclusion
Future work
|34
› EE: Define is the central move both in coherence and
in lexical cohesion
› FL: Solicit response is the central move in coherence,
but no central move was found for lexical cohesion
→ alignment much closer for EE than for FL
Discourse organisation
Corpus
Method (genre, coherence, cohesion)
Results
Conclusion
Future work
|35
› corpus building
- more texts
- more genres (e.g., advertisements, reviews)
› refinement of centrality measures
› comparison of RST trees and tree structures based on
lexical cohesion
Download