Centrummaten gemiddelde het gemiddelde van een serie waarnemingsgetallen is de som van die getallen gedeeld door het aantal getallen mediaan eerst de waarnemingsgetallen naar grootte rangschikken bij oneven aantal getallen is de mediaan het middelste getal bij even aantal getallen is de mediaan het gemiddelde van de middelste twee getallen modus de modus is het waarnemingsgetal met de grootste frequentie 8.1 Klasse indeling en centrale tendenties Gemiddelde en modus berekening doe je m.b.v een frequentie tabel Eiergewichten uit de biologische veeteelt Gewicht frequentie m f*m 10 -< 15 7 12,5 87,5 15 -< 20 9 17,5 157,5 20 -< 25 10 22,5 225 25 -< 30 19 27,5 522,5 30 -< 35 16 32,5 520 35 -< 40 14 37,5 525 40 -< 45 9 42,5 382,5 45 -< 50 8 47,5 380 50 -< 55 7 52,5 367,5 55 -< 60 5 57,5 287,5 60 -< 65 4 62,5 250 65 -< 70 2 67,5 135 110 3840 Gemiddelde x 34,9 gr om het gemiddelde te berekenen moet je eerst de klassenmiddens berekenen de klasse met de grootste frequentie is de modale klasse voorbeeld a b c bereken het gemiddelde klassenmiddens zijn 1800, 2200, 2600, 3000 en 3400 voer in lijst1 { 1800,2200,2600,3000,3400 } en lijst2 { 85,75,63,58,19 } optie 1 Var-Stats L1,L2 (TI) of 1VAR(Casio) gemiddelde ≈ 2401 uur bereken de mediaan 300 waarnemingsgetallen 150e en 151e getal m.b.v. tabel klasse 2000-<2400 m.b.v. GR mediaan = 2200 dus de mediaan ligt in de klasse 2000-< 2400 wat is de modale klasse de modale klasse is 1600-< 2000 aantal branduren frequentie 1600-<2000 85 2000-<2400 75 2400-<2800 63 2800-<3200 58 3200-<3600 19 85 160 8.1 Voordelen en nadelen centrummaten voordeel nadeel modus • snel op te schrijven, weinig rekenwerk • de enige centrummaat die bij kwalitatieve gegevens te gebruiken is • geeft weinig informatie • is niet altijd aanwezig • een kleine verandering kan een geheel andere modus opleveren mediaan • niet gevoelig voor uitschieters • weinig rekenwerk • alleen de volgorde van de waarnemingsgetallen is van belang, niet de grootte van de waarnemingsgetallen gemiddelde • alle gegevens worden gebruikt • iedereen kent deze centrummaat •gevoelig voor uitschieters 8.1 Hoe teken je een boxplot? bepaal de mediaan bepaal het eerste kwartiel (mediaan van de “1e” helft) en het derde kwartiel (mediaan van de “2e” helft) teken een getallenlijn en zet het kleinste en grootste waarnemingsgetal, de mediaan en de beide kwartielen boven de getallenlijn teken de boxplot 8.1 Tekenen van de Boxplot. Mediaan= tweede kwartiel = 50 % grens m.b.v. de gecumuleerde frequentietabel. Eerste kwartiel = 25 % grens Derde kwartiel = 75 % grens grens aantal relatief Gecumuleerde relatieve verdeling -< 10 0 0,0 -< 15 7 6,4 -< 20 16 14,5 -< 25 26 23,6 -< 30 45 40,9 -< 35 61 55,5 -< 40 75 68,2 -< 45 84 76,4 -< 50 92 83,6 -< 55 99 90,0 20,0 -< 60 104 94,5 0,0 -< 65 108 98,2 -< 70 110 100,0 120,0 100,0 80,0 60,0 40,0 0 Boxplot 20 40 60 80 voorbeeld de volgende score’s zijn gehaald bij een test 23 – 43 – 24 - 34 - 13 - 32 - 44 - 53 - 17 - 28 – 30 – 22 – 19 schrijf de getallen eerst van klein naar groot op 13 – 17 – 19 – 22 – 23 – 24 – 28 – 30 – 32 – 34 – 43 – 44 – 53 teken een getallenlijn kleinste waarnemingsgetal = 13 grootste waarnemingsgetal = 53 mediaan = 28 1e kwartiel (Q1) = (19 + 22) : 2 = 20,5 3e kwartiel (Q3) = (34 + 43) : 2 = 37,5 10 15 20 25 30 tussen 2 verticale streepjes altijd 25% van de waarnemingsgetallen 35 40 45 50 55 in de box 50% 8.1 Boxplot mbv de grafische rekenmachine 1 frequentie tabel maken stat edit 1 L1 (waarnemingsgetallen) L2 (frequentie’s) invullen 2 boxplot berekenen stat calc 1 1 var stats L1,L2 (L1,+2 2nd 1,2) 3 boxplot tekenen 2nd stat plot 1 on type ‘5e’ graph 8.1 De relatieve cumulatieve frequentiepolygoon kun je goed gebruiken om een boxplot te tekenen relatieve cumulatieve frequentie (%) 0% kleinste getal = 3 100 25% 1e kwartiel (Q1) = 10 50% mediaan = 13 75% 3e ∙ ∙ 75 kwartiel (Q3) = 20 100% grootste getal = 24 ∙ 50 ∙ 25 ∙3 0 5 10 1315 20 5 10 15 20 25 24 boxplot 0 25 8.1 Spreidingsmaten vaak wordt naast een centrummaat een zogenaamde spreidingsmaat berekend om aan te geven hoever de data in een verdeling uitelkaar liggen spreidingsbreedte : verschil tussen het grootste en kleinste getal kwartielafstand : verschil tussen het 1e en 3e kwartiel (Q3 – Q1) 8.1 De standaardafwijking de meest gebruikte spreidingsmaat is de standaardafwijking om de standaardafwijking te berekenen moet je eerst van elk waarnemingsgetal berekenen hoe ver het van het gemiddelde afligt zo krijg je bij elk waarnemingsgetal x de deviatie d d = x – x ( de afwijking van het gemiddelde ) standaardafwijking σ = √gemiddelde van (x – x)2 het berekenen van σ doe je met (TI) 1-Var Stats L1,L2 σx of (Casio) 1VAR xσn 8.1 Notaties op de GR x σ σx xσn n minX maxX Q1 Q3 Med : het gemiddelde : de standaardafwijking : de standaardafwijking (TI) : de standaardafwijking (Casio) : het totale aantal waarnemingen : het kleinste waarnemingsgetal : het grootste waarnemingsgetal : het eerste kwartiel : het derde kwartiel : de mediaan (het tweede kwartiel) opgave 19 a de klassenmiddens zijn 710, 730, 750, …………………, 870 voer in lijst1 = {710,730,………,870} en lijst2 = {10,14,…………,3} GR minX = 710 , Q1 = 770 , Med = 790 , Q3 = 810 en maxX = 870 700 b 730 760 790 820 GR x ≈ 783 en σ ≈ 35 het gemiddelde is 783 uur en de standaardafwijking is 35 uur 850 880 opgave 19 c afwijking van meer dan één keer van de standaardafwijking van het gemiddelde kleiner dan 783 – 35 = 748 groter dan 783 + 35 = 818 < 748 10 + 14 + 8 . 16 20 2 > 818 20 . 38 + 15 + 3 + 3 55 x 100% ≈ 31% 175 d 748 + ≈ 55 100% - 8% = 92% 0,92 gemiddelde = 0,92 x 783 ≈ 720 branduren standaardafwijking = 0,92 x 35 ≈ 32 branduren 818 De normale verdeling neem je bij een klassenindeling van een zeer grote populatie de klassenbreedte steeds kleiner, dan zal de frequentiepolygoon steeds meer gaan lijken op een vloeiende kromme krijg je een klokvormige kromme, dan is er sprake van een normale verdeling de kromme heet de normaalkromme de top ligt boven het gemiddelde μ de breedte van de kromme hangt af van de standaardafwijking σ μ 8.2 Vuistregels bij de normale verdeling bij een normale verdeling ligt 68% van de waarnemingsgetallen minder dan σ van het gemiddelde af 95% van de waarnemingsgetallen minder dan 2σ van het gemiddelde af 8.2 Vuistregel 1 tussen {μ - σ,μ + σ} ligt 68% van alle data f r e q buigpunt buigpunt 16% 16% σ μ-σ σ μ μ+σ lengte 8.2 Vuistregel 2 tussen {μ - 2σ,μ + 2σ} ligt 95% van alle data f r e q 2,5% 2,5% 2σ μ - 2σ 2σ μ μ + 2σ lengte 8.2 f r e q a b c 34% 34% 0,3 0,3 d 2,5% 0,3 13,5% 1,5 2,5% 13,5% 1,8 13,5% 0,3 zwaarder dan 2,7 kg 2,5% tussen 1,5 en 2,4 kg 13,5% + 68% = 81,5% 0,815 × 200 = 163 konijnen lichter dan 1,8 kg 2,5% + 13,5% = 16% 0,16 × 200 = 32 konijnen de 5 zwaarste konijnen 5/200 × 100% = 2,5% ze hebben een gewicht van meer dan 2,7 kg 2,1 34% 2,4 34% 2,7 gewicht in kg Toepassing van de vuistregels bij een groep mannen, waarvan de lengte normaal verdeeld is met μ = 178 cm en σ = 8 cm hoort de verdeling hiernaast de percentages volgen uit de vuistregels bij de normale verdeling tussen 162 en 178 cm hoort 47,5% van de mannen 2,5% van de mannen is korter dan 162 cm. 8.2 Normaal-waarschijnlijkheidspapier in figuur 8.20 is een normaalkromme getekend onder de normaalkromme is de bijbehorende relatieve cumulatieve frequentiepolygoon getekend in figuur 8.21 is de schaal op de verticale as veranderd vanaf 50% wordt de schaal zowel naar boven als naar beneden uitgerekt en wel zodanig, dat de grafiek een rechte lijn is papier met deze schaalverdeling heet normaal-waarschijnlijkheidspapier 8.2 werkschema : hoe onderzoek je of bij een verdeling een normale benadering is toegestaan en hoe schat je μ en σ ? 1 2 3 4 5 bereken van elke klasse de relatieve cumulatieve frequentie zet deze relatieve cumulatieve frequenties uit op normaal-waarschijnlijkheidspapier, telkens boven de rechtergrens van de klasse ga na of de punten bij benadering op een rechte lijn liggen zo ja, dan is de normale benadering toegestaan teken de lijn lees op de horizontale as μ af bij de relatieve cumulatieve frequentie 50 lees op de horizontale as μ + σ af bij de relatieve cumulatieve frequentie 84 hieruit volgt σ 8.2 opgave 32 a klasse frequentie 1,55-< 1,58 2 klasse cum.freq. rel.cum.freq. 1,58-< 1,61 8 -< 1,58 2 0,5 2/400x100 -< 1,61 10 2,5 10/400x100 -< 1,64 32 8,0 32/400x100 26,0 104/400x100 1,61-< 1,64 22 2+8 10 + 22 32 + 72 1,64-< 1,67 72 -< 1,67 104 1,67-< 1,70 116 -< 1,70 220 55,0 220/400x100 1,70-< 1,73 108 -< 1,73 328 82,0 328/400x100 -< 1,76 380 95,0 380/400x100 -< 1,79 398 99,5 398/400x100 -< 1,82 400 100 400/400x100 1,73-< 1,76 52 1,76-< 1,79 18 1,79-< 1,82 2 opgave 32 b 84 50 1,69 1,73 μ ≈ 1,69 mm μ + σ ≈ 1,73 mm σ ≈ 1,73 – 1,69 σ = 0,04 mm opgave 32 c 2,5% σ 1,65 σ 1,68 μ = 1,68 mm μ - 2σ = 1,65 -2σ = 1,65 – 1,68 2σ = 0,03 σ = 0,015 mm. 8.3 8.3 8.3 Oppervlakten berekenen met de GR 8.3 8.3 a b c kleiner dan 5,1 cm opp = normalcdf(-1099,5.1,5.8,0.4) ≈ 0,040 dus 4,0% groter dan 5,25 cm. opp = normalcdf(5.25,1099,5.8,0.4) ≈ 0,915 dus 91,5% ligt tussen 6,1 cm en 6,4 cm opp = normalcdf(6.1, 6.4, 5.8, 0.4) ≈ 0,160 dus 16,0% μ = 5,8 σ = 0,4 5,1 5,25 5,8 6,1 6,4 Grenzen berekenen met de GR de oppervlakte links van a is gelijk aan 0,56 je kunt de bijbehorende grens met de GR berekenen we gebruiken hierbij de notatie a = invNorm(0.56,18,3) -0.56 de oppervlakte links van a -18 het gemiddelde μ -3 de standaardafwijking σ is de oppervlakte onder de normaalkromme links van a bekend, dan is a = invNorm(opp links,μ,σ) 8.3 8.3 a b c 1 – 0,5 = 0,5 0,5/2 = 0,25 a = invNorm(0.25,18,2) ≈ 16,7 b = invNorm(0.75,18,2) ≈ 19,3 1 – 0,82 = 0,18 0,18/2 = 0,09 a = invNorm(0.09,150,12) ≈ 133,9 b = invNorm(0.91,150,12) ≈ 166,1 0,25 0,09 0,25 0,09 0,12/2 = 0,06 a = invNorm(0.06,58,6) ≈ 48,7 b = invNorm(0.94,58,6) ≈ 67,3 0,06 0,06 8.3 1 – 0,62 = 0,38 opp links van 2080 is 0,38/2 = 0,19 normalcdf(-1099,2080,2200,σ) = 0,19 voer in y1 = normalcdf(-1099,2080,2200,σ) en y2 = 0,19 optie intersect x ≈ 136,69 dus σ ≈ 140 μ = 2200 σ=? opp = 0,62 opp = 0,62 opp = 0,19 opp = 0,19 2080 2200 2320 Percentages en kansen bij de normale verdeling bij opgaven over de normale verdeling heb je te maken met de 5 getallen in het figuur van deze getallen zijn er 4 gegeven en moet je het 5e berekenen je gebruikt het volgende werkschema werkschema : opgaven over de normale verdeling 1 schets een normaalkromme en verwerk hierin μ, σ, l, r en opp. 2 kleur het gebied dat bij de vraag hoort 3 bereken met de GR het ontbrekende getal 4 beantwoord de gestelde vraag 8.4 opp = normalcdf(-1099,23,25,3) opp ≈ 0,252 dus 25,2% μ = 25 σ=3 opp = ? 23 25 opgave 53b opp = normalcdf(23.8,25.3,25,3) opp ≈ 0,195 de kans is 0,195 μ = 25 σ=3 opp = ? 23,8 25,3 opgave 53d opp = 2 . normalcdf(-1099,23.5,25,3) opp ≈ 0,617 dus 61,7% μ = 25 σ=3 opp = ? 26,5 29,5 opp = normalcdf(17,19,18,0.4) opp ≈ 0,988 dus 98,8% μ = 18 σ = 0,4 opp = ? 17 19 opgave 57b opp = 2 × normalcdf(-1099,17.3,18,0.4) opp ≈ 0,080 de kans is 0,080 μ = 18 σ = 0,4 opp = ? 17,3 18,7 opgave 57c a = invNorm(0.01,18,0.4) a ≈ 17,1 b = invNorm(0.99,18,0.4) b ≈ 18,9 de diameter is minder dan 17,1 mm of meer dan 18,9 mm. μ = 18 σ = 0,4 opp = 0,02 a b Gemiddelde en standaardafwijking berekenen (TI) Bij het berekenen van een onbekende μ of σ kun je de optie intersect gebruiken. TI 8.4 TI normalcdf(245,255,250,σ) = 0,90 voer in y1 = normalcdf(245,255,250,x) en y2 = 0,90 optie intersect x ≈ 3,04 dus maximaal σ ≈ 3,04 gram μ = 250 σ=? opp = 0,90 245 255 opgave 61b TI normalcdf(-1099,250,μ,4) = 0,10 voer in y1 = normalcdf(-1099,250,x,4) en y2 = 0,10 optie intersect x ≈ 255,1 dus op een gemiddelde van 255 gram μ=? σ=4 opp = 0,10 250 29/325 ≈ 0,0892 TI normalcdf(70,1099,68,σ) = 0,0892 voer in y1 = normalcdf(70,1099,68,x) en y2 = 0,0892 optie intersect x ≈ 1,486 dus σ ≈ 1,49% μ = 68 σ=? opp = 0,0892 70 opgave 66b opp = normalcdf(-1099,65.5,68,1.49) opp ≈ 0,0467 dat zijn er 0,0467 × 500 ≈ 23 μ = 68 σ = 1,49 opp = ? 65,5 Terugblik Terugblik