Kenmerk: Datum: File: EWI04/TW/SK/111/DM 13 augustus 2004 IS040813a.doc Deeltoets 1 van Inleiding Statistiek (196208) Vrijdag 13 augustus 2004 van 9.30 – 12.30 uur. NB. Laat steeds zien hoe je te werk gaat, een antwoord alleen is meestal niet voldoende. De gevolgde methode is belangrijker dan de cijfermatige uitkomst. Open boek! Het leerboek mag geraadpleegd worden. Opgaven De aantallen aanvragen (ni) om informatie bij een call-centrum bedroegen voor 37 opeenvolgende dagen: 104 364 136 215 259 280 16 308 326 270 443 294 296 200 420 547 248 245 167 201 99 295 133 346 186 357 515 155 88 138 271 220 378 546 214 122 144 Van deze aantallen is gegeven: ni = 9546 en (ni - ngem)2 = 597242 1. Maak een stamdiagram van de aantallen. 2. Geef de 5-getallensamenvatting en teken de box-plot (= doosdiagram). 3. Neem aan dat de aantallen een normale verdeling hebben, met als parameters = 260 en = 130 heeft. Bepaal de kans op meer dan 400 aanvragen om informatie op een dag en geef commentaar aan de hand van de gevonden data. _____________________________ 4. De werknemers van een groot instituut zijn als volgt verdeeld over opleiding en geslacht: opleiding lager middelbaar hoger academisch man 5 25 55 15 vrouw 30 95 72 3 . Bepaal voor zowel mannen als vrouwen de voorwaardelijke verdelingen van de opleidingen. Wat kun je hieruit concluderen? _____________________________ 5. Geef in een eenvoudige schets een situatie weer, waarin de correlatiecoëfficiënt tussen twee variabelen ongeveer 1 bedraagt. Geef ook een schets waarin weliswaar een zeer sterk verband is tussen de beide variabelen, maar de correlatiecoëfficiënt in de buurt van 0 ligt. _____________________________ Normering: elk vraagstuk 2 punten. Uitwerking IS021206 1. 3 0 | 189 12 1 | 023334568 (14) 2 | 00112445778999 11 3 | 024567 5 4 | 24 3 5 | 144 of: 2 12 (12) 13 5 3 0 | 29 1 | 0023444679 2 | 001225567789 3 | 00135668 4 | 24 5 | 255 2. Q0 = "1e" = 16 Q1 = "(9e+10e)/2" = (144+155)/2 = 149.5 Q2 = "19e" = 248 Q3 = "(28e+29e)/2" = (326+346)/2 = 336 Q4 = "37e" = 547 IKA = 336 – 149.5 = 186.5; D = 1.5*IKA = 279.75 Q1 – D = 149.5 – 279.75 = -130.25, dus geen uitschieter Q3 – D = 336.0 + 279.75 = 615.75, dus geen uitschieters 3. Het aantal X is normaal verdeeld, met verwachting 260 en standaardafwijking 130, dus P(X > 400) = P(Z>(400–260)/130) = 1– P(Z<14/13) = 1– P(Z<1.08) = 1– 0.8599 = 0.1401. Van de data verwachten we ca. 14% groter dan 400, dus 0.14*37 = 4.84 dus ca 5; het zijn er ook juist 5. 4. Voorwaardelijke verdelingen voor mannen en voor vrouwen: ( P(lager|man) = P(lager en man)/P(man) etc. ) man vrouw lager 0.05 0.15 opleiding middelbaar hoger 0.25 0.55 0.475 0.36 academisch 0.15 0.015 . deze verschillen aanzienlijk, dus (sterke) afhankelijkheid tussen opleiding en geslacht.