SHEETS Hoofdstuk 1 Kwantitatieve variabelen: numerieke

advertisement
SHEETS Hoofdstuk 1
Kwantitatieve variabelen: numerieke gegevens
Kwalitatieve variabelen: categorische gegevens
Verdeling: variatiepatroon van een (kwantitatieve) variabele
Presenteren van gegevens
I Stamdiagram (voor klein aantal waarnemingen)
Waarnemingen gerangschikt naar overeenkomstige eerste cijfers (stam) en mogelijk
verschillende eindcijfers (blad).
Rangschik steeds van klein naar groot.
1
stam
25
26
27
28
blad
12
stamdiagram voor de waar044 nemingen 251, 252, 260, 264,
264, 281 en 289
19
rug-aan-rug stamdiagram: twee stamdiagrammen met gemeenschappelijke stam.
II Histogram van frequenties (voor groot aantal waarnemingen)
1. Bepaal kleinste en grootste waarneming
en verdeel het bereik van de waarnemingen in gelijke klassen
(klasse =interval: a 5 waarneming < b)
2. Maak een frequentietabel door het aantal waarnemingen in die klasse te tellen.
2
3. Teken het histogram: klassen op horizontale as, frequenties op verticale as: rechthoeken oprichten boven de klasse
III Histogram van relatieve frequenties
Idem, nu met op de verticale as de relatieve frequentie van de klasse, d.i. het aantal waarnemingen in de klasse gedeeld door
het totaal aantal waarnemingen.
Gepresenteerde meetgegevens bekijken:
– Wat is de plaats van het centrum van
de verdeling?
– Is de verdeling symmetrisch? Of is zij
scheef, met een rechter- of linkerstaart?
– Is er sprake van één of meer toppen?
– Zijn er uitschieters?
3
IV Tijdreeksgrafieken
Grootheid die in de tijd verandert, uitgezet
op de verticale as; de horiontale as is de
tijd-as.
Tijdreeksen betreffen vaak economische grootheden en indexcijfers.
Let op:
1. de trend, de lange termijnverandering.
2. het seizoenpatroon, terugkerende afwijkingen van de trend voor overeenkomstige seizoenen.
4
Centrummaten
1. steekproefgemiddelde x̄ bij n waarnemingen x1, x2, . . . , xn
n
1 X
x1 + x2 + . . . + xn
=
x̄ =
xi
n
n i=1
2. mediaan M : “de middelste waarneming in
grootte”.
– Rangschik de waarnemingen van klein naar
groot.
– Bij een oneven aantal waarnemingen is
de middelste waarneming de mediaan.
– Bij een even aantal waarneminen is het
gemiddelde van de middelste twee waarnemingen de mediaan.
5
De mediaan is een resistente centrummaat:
niet-gevoelig voor uitschieters, x̄ is niet-resistent.
Het p-de percentiel (p is een percentage, bijvoorbeeld 20%) van een verzameling waarnemingen wordt zo gekozen dat p (20)% van de
waarnemingen kleiner is en 100 − p (80%) groter.
Kwartielen Q1, Q3 en Q3 zijn het 25-ste, 50ste en 76-ste percentiel.
De mediaan M = Q2 = 50-ste percentiel.
6
Bepalen p-de percentiel
1. Rangschik waarnemingen van klein naar groot.
2. Bepaal de plaats van het p-de percentiel
door het percentage p van n te nemen: is de
uitkomst een geheel getal dan moet je het
gemiddelde van twee waarnemingen nemen.
Voorbeeld n = 25 waarnemingen.
- Het 50-ste percentiel: p = 50% van n =
25 is 12.5, dus de 13e waarneming in grootte
moet “door midden gedeeld” en is dus het
50ste percentiel = M .
- Het 20ste percentiel: 20% van 25 is 5: de
“grens” ligt tussen de 5de en 6de waarneming. Dus het 20ste percentiel is het gemiddelde van deze twee.
7
Spreidingsmaten
1. Interkwartielafstand IKA = Q3 − Q1: resistente spreidingsmaal
2. Variantie bij waarnemingen x1, x2, . . . , xn
1 X
(xi − x̄)2
n−1
X
X
1
1
=
x2
xi)2
i − (
n−1
n
s2 =
√
3. Standaardafwijking s = s2
Eigenschappen
1 s2 = 0 en s = 0
2 Als s = 0, zijn alle waarnemingen gelijk.
8
5 getallen samenvatting van een verdeling:
kleinste waarneming, Q1, M, Q3 en grootste waarneming.
boxdiagram grafische weergave van de 5 getallen samenvatting
De 1.5 x IKA-regel: waarnemingen die minstens 1.5 x IKA voobij Q1 en Q3 liggen zijn uitschieters.
9
Berekening x̄ en s met de rekenmachine
- Zet mode op statistiek (sd).
- Voer de meetgegevens in(x1, dataknop, x2,
dataknop, etc.)
- Gebruik x̄-knop voor x̄ en σn−1-knop voor s;
voor s2 deze kwadrateren.
10
Download