8.1 Centrum- en spreidingsmaten Gemiddelde: de som van de getallen gedeeld door het aantal Mediaan: middelste waarnemingsgetal van alle getallen naar grootte gerangschikt. Bij een even aantal waarnemingsgetallen is de mediaan het gemiddelde van de middelste twee. Modus: waarnemingsgetal met de grootste frequentie. Wanneer je een klassenindeling hebt gemaakt, spreken we niet meer van een modus maar van een modale klasse; de klasse met de grootste frequentie. Berekenen met GR: voer in List1: de klassenmiddens. List2: de frequenties. Optie 1VAR geeft de lijst met gemiddelde (x onder -), standaardafwijking (xσn), aantal waarnemingsgetallen (n), afwijking van het gemiddelde (d), kleinste getal (minX), grootste getal (maxX), Q1, Q3, Mediaan (Med) Kwalitatieve gegevens: aanwezigheid van kenmerk als kleur ogen, beroep... Kwantitatieve gegevens: uit te drukken in getal, hoeveelheden, lengten, aantallen... Bij een relatieve cumulatieve frequentiepolygoon bereken je de frequentie in procenten en zet deze vervolgens in een grafiek. Je ziet de mediaan op 50%, Q1 op 25% en Q2 op 75%. Q1 = mediaan van het eerste kwartiel in een boxplot Q2 = de mediaan, midden in een boxplot Q3 = mediaan van het derde kwartiel in een boxplot Spreidingsbreedte: verschil tusen grootste en kleinste waarnemingsgetal Kwartielafstand: verschil tussen derde en eerste kwartiel Standaardafwijking: σ, zeg sigma. Berekenen: Standaardafwijking berekenen met 3,5,8,9,10 met de hand -gemiddelde = 7 -deviaties (afwijking van gemiddelde) d: -4, -2, 1, 2, 3 -kwadraten van deviaties d2: 16, 4, 1, 4, 9 -gemiddelde van kwadraten som d2:n = 6,8 -standaardafwijking = √ (som d2 : n) = √ 6,8 = 2,6 8.2 Eigenschappen van de normale verdeling Door bij een grote populatie een steeds kleinere klassenbreedte te nemen, wordt de frequentiepolygoon steeds meer een klokvormige kromme. Dit noemen we een normale verdeling. De polygoon heet een normaalkromme. Top is het gemiddelde. Totale oppervlak is 100%. 1 = μ-2σ (rel.cum. freq. = 2,5) 2 = μ-σ (rel.cum. freq. = 16) 3 = μ (rel.cum. freq. = 50) 4 = μ+σ (rel.cum. freq. = 84) 5 = μ+2σ (rel.cum. freq. = 97,5) Op normaal-waarschijnlijkheidspapier is de cumulatieve frequentie op de verticale as zodanig uitgerekt dat de polygoon een rechte lijn behoort te zijn. Is de lijn niet recht, dan is het geen normale verdeling. 8.3 Oppervlakten onder normaal-krommen Om het oppervlak van een gebied onder de normaalkromme te berekenen gebruiken we de de notatie normalcdf(l ,r , μ, σ). l = linkergrens σ = standaardafwijking r = rechtergrens μ = gemiddelde Wanneer de linkergrens ontbreekt noteren we -1099, wanneer dat de rechtergrens is 1099. Dit voer je in op je GR onder normalcdf (...) en je rondt het oppervlak af op 3 decimalen. Wanneer wél het oppervlak is gegeven en je moet een grens berekenen, gebruik je invNorm. Bij de InvNorm vul je altijd de oppervlakte links van a (is rechtergrens van gebied) in. Oppervlakte links kun je ook berekenen als je rechts weet, namelijk 1 - opp. rechts. InvNorm ( opp. links, μ, σ) Regel: rond a op één decimaal meer af dan de gegeven σ. Berekenen van μ en σ is moeilijker, zie hieronder. - vergelijking wordt P((23-28) : σ) = 1 - 0,83 - y1 = P((23-28) : x) y2 = 0,17 - Tekenen, denk aan Xmax en Ymax! - Bereken snijpunt met Isect geeft x = 5,24 dus σ = 5,2 (afronden op 1 decimaal omdat opp al in twee is weergegeven) μ of σ dus berekenen met vergelijking: P((gegeven grens - μ) : σ) = 1 - opp. vul voor ontbrekende gegeven X in. 8.4 Toepassingen van de normaalverdeling Toelatingstest, μ = 63,2, σ = 13,2. Maximaal 20% mag meedoen aan een vervolgtest. Vanaf welke score mag je meedoen aan het vervolg? opp. links = 1 - 0,2 = 0,8 a = InvNorm (0.80, 63.2, 13.2) = 74,32 Meedoen mag dus vanaf 75 800 mannen met de grootste lengte worden geselecteerd uit een groep van 18.760, μ = 1,78m en σ = 8. Vanaf welke lengte horen zij daarbij? lengte = InvNorm (1- (800:18.760), 178, 8) = 191,8 dus vanaf 191,8 cm.