havo A 4.4 Centrum- en spreidingsmaten Centrummaten gemiddelde • het gemiddelde van een serie waarnemingsgetallen is de som van die getallen gedeeld door het aantal getallen mediaan • eerst de waarnemingsgetallen naar grootte rangschikken • bij oneven aantal getallen is de mediaan het middelste getal • bij even aantal getallen is de mediaan het gemiddelde van de middelste twee getallen modus • de modus is het waarnemingsgetal met de grootste frequentie opgave 27 (zonder GR) a gemiddelde = (3×2 + 4×4 + 5×6 + 6×5 + 7×4 + 8×4 + 9×3 + 10×2) : 30 gemiddelde = 6,3 30 getallen 15e en 16e getal 15e getal = 6 en 16e getal = 6 mediaan = ( 6 + 6 ) : 2 mediaan = 6 het cijfer 5 komt 6 keer voor modus = 5 b modus, mediaan, gemiddelde c totaal was 189 en het aantal ll. was 30 30 + 4 = 34 leerlingen 34 × 6,5 = 221 221 – 189 = 32 de vierde leerling 32 – (3 × 9) = 5 het cijfer 3 komt 2 keer voor cijfer frequentie 3 2 4 4 5 6 6 5 7 4 8 4 9 3 10 2 opgave 27 (met GR) a voer in lijst 1 = { 3, 4, 5, 6, 7, 8, 9, 10 } en lijst 2 = { 2, 4, 6, 5, 4, 4, 3, 2 } optie 1-Var Stats L1,L2 (TI) of 1VAR (casio) gemiddelde = 6,3 mediaan = 6 modus = 5 b modus, mediaan, gemiddelde c totaal was 189 en het aantal ll. was 30 30 + 4 = 34 leerlingen 34 × 6,5 = 221 221 – 189 = 32 de vierde leerling 32 – (3 × 9) = 5 Voordelen en nadelen centrummaten voordeel nadeel modus • snel op te schrijven, weinig rekenwerk • de enige centrummaat die bij kwalitatieve gegevens te gebruiken is • geeft weinig informatie • is niet altijd aanwezig • een kleine verandering kan een geheel andere modus opleveren mediaan • niet gevoelig voor uitschieters • weinig rekenwerk • alleen de volgorde van de waarnemingsgetallen is van belang, niet de grootte van de waarnemingsgetallen gemiddelde • alle gegevens worden gebruikt • gevoelig voor uitschieters • iedereen kent deze centrummaat om het gemiddelde te berekenen moet je eerst de klassenmiddens berekenen opgave 31 de klasse met de grootste frequentie is de modale klasse a klassenmiddens zijn aantal 1800, 2200, 2600, 3000 en 3400 branduren voer in lijst1 { 1800,2200,2600,3000,3400 } en lijst2 { 85,75,63,58,19 } 1600-<2000 optie 1 Var-Stats L1,L2 of 1VAR 2000-<2400 gemiddelde ≈ 2401 uur 2400-<2800 b GR mediaan = 2200 2800-<3200 dus de mediaan ligt in de klasse 2000-< 2400 c de modale klasse is 1600-< 2000 3200-<3600 d 300 waarnemingsgetallen 150e en 151e getal 150 – 85 = 65e getal en 151 – 85 = 66e getal in klasse 2000-< 2400 er zitten 75 getallen in deze klasse 2000 + (65,5 : 75) × 400 ≈ 2349, dat is dus meer dan 2200 frequentie 85 75 63 58 19 Hoe teken je een boxplot? 1 bepaal de mediaan 2 bepaal het eerste kwartiel (mediaan van de “1e” helft) en het derde kwartiel (mediaan van de “2e” helft) 3 teken een getallenlijn en zet het kleinste en grootste waarnemingsgetal, de mediaan en de beide kwartielen boven de getallenlijn 4 teken de boxplot voorbeeld de volgende score’s zijn gehaald bij een test 23 – 43 – 24 - 34 - 13 - 32 - 44 - 53 - 17 - 28 – 30 – 22 – 19 schrijf de getallen van klein naar groot op 13 – 17 – 19 – 22 – 23 – 24 – 28 – 30 – 32 – 34 – 43 – 44 – 53 teken een getallenlijn kleinste waarnemingsgetal = 13 grootste waarnemingsgetal = 53 mediaan = 28 1e kwartiel (Q1) = (19 + 22) : 2 = 20,5 3e kwartiel (Q3) = (34 + 43) : 2 = 37,5 10 15 20 25 tussen 2 verticale streepjes altijd 25% van de waarnemingsgetallen 30 35 40 45 in de box 50% 50 55 Boxplot mbv de grafische rekenmachine 1 frequentie tabel maken stat edit 1 L1 (waarnemingsgetallen) L2 (frequentie’s) invullen 2 boxplot berekenen stat calc 1 1 var stats L1,L2 (L1,+2 2nd 1,2) 3 boxplot tekenen 2nd stat plot 1 on type ‘5e’ graph relatieve cumulatieve frequentie ∙ 100 De relatieve cumulatieve frequentiepolygoon kun je goed gebruiken om een boxplot te tekenen. ∙ 75 ∙ 50 0% kleinste getal = 3 25% 1e kwartiel (Q1) = 10 50% mediaan = 13 75% 3e kwartiel (Q3) = 20 100% grootste getal = 24 ∙ 25 ∙3 0 5 10 10 1315 20 5 10 20 25 24 boxplot 0 15 25 Spreidingsmaten • vaak wordt naast een centrummaat een zogenaamde spreidingsmaat berekend om aan te geven hoever de data in een verdeling uitelkaar liggen • spreidingsbreedte : verschil tussen het grootste en kleinste getal • kwartielafstand : verschil tussen het 1e en 3e kwartiel (Q3 – Q1) opgave 35 a bij elke klas is de mediaan 3 km. b nee, de mediaan is bij elke klas hetzelfde c in klas 4A zit 50% tussen 1 en 5 km in klas 4B zit 50% tussen 2 en 4 km d in klas 4A is de spreiding het grootst in klas 4C is de spreiding het kleinst De standaardafwijking • de meest gebruikte spreidingsmaat is de standaardafwijking • om de standaardafwijking te berekenen moet je eerst van elk waarnemingsgetal berekenen hoe ver het van het gemiddelde afligt • zo krijg je bij elk waarnemingsgetal x de deviatie d • d = x – x ( de afwijking van het gemiddelde ) • standaardafwijking σ = √gemiddelde van (x – x)2 • het berekenen van σ doe je met (TI) 1-Var Stats L1,L2 σx of (Casio) 1VAR xσn opgave 43 gewicht freq. 4,8 4,9 5,0 5,1 5,2 5,3 5,4 2 4 10 18 12 3 1 a voer in lijst 1 = {4.8,4.9,5.0,5.1,5.2,5.3,5.4} en lijst 2 = {2,4,10,18,12,3,1} optie 1-Var Stats L1,L2 of 1VAR geeft minX = 4,8 ; Q1 = 5 ; Med = 5,1 ; Q3 = 5,2 ; maxX = 5,4 mediaan = 5,1 kwartielafstand = Q3 – Q1 = 5,2 – 5 = 0,2 spreidingsbreedte = maxX – minX = 5,4 – 4,8 = 0,6 b schatting σ = 0,3 2σ = 0,6 2σ = spreidingsbreedte = 0,6 dat kan niet c GR x ≈ 5,09 en σ ≈ 0,12 gemiddelde ≈ 5,09 kg en de standaardafwijking ≈ 0,12 kg Notaties op de GR • • • • • • • • • • x σ σx xσn n minX maxX Q1 Q3 Med : het gemiddelde : de standaardafwijking : de standaardafwijking (TI) : de standaardafwijking (Casio) : het totale aantal waarnemingen : het kleinste waarnemingsgetal : het grootste waarnemingsgetal : het eerste kwartiel : het derde kwartiel : de mediaan (het tweede kwartiel)