Monitoraatsoefening 1: beschrijvende statistiek Oefening 1: Onderstaande tabel geeft het aantal daders van diefstal met geweld weer per leeftijdsgroep die zijn geregistreerd bij de politie in Frankrijk. Bereken voor elke leeftijdsgroep het aantal daders per duizend inwoners (= rate per 1000): Leeftijd Aantal daders Totale populatie 14-18 79 961 6 892 570 19-25 87 348 6 687 150 26-37 89 122 8 397690 38-45 14 771 9 931 470 46–59 35 280 15 886 660 60-68 67 790 28 916 140 69 en meer 12 120 18 578 530 1 Oefening 2: Aan 75 gedetineerden werd gevraagd hoeveel misdrijven ze gedurende hun hele leven hebben gepleegd. Hieronder vind je het overzicht. Maak van onderstaande gegevens een gegroepeerde frequentieverdeling met inbegrip van frequenties, midden, proporties, percentages, cumulatieve frequenties, cumulatieve proporties en cumulatieve percentages. 22 13 24 15 17 30 16 27 17 12 14 12 13 18 21 27 19 18 25 18 19 11 30 30 11 28 23 14 35 28 13 26 22 21 8 20 15 39 15 17 24 16 26 31 26 25 24 23 6 31 32 29 38 36 15 16 12 34 12 34 12 33 35 34 20 21 11 37 43 7 21 20 19 35 11 2 Oefening 3: Geef aan om welk soort variabele (kwalitatief/kwantitatief EN nominaal/ordinaal/ interval of ratio) het gaat. Het aantal uren zon tijdens juni, juli en september Het gewicht van de gedetineerden in de gevangenis van Leuven Leeftijd van slachtoffers van seksueel geweld verdeeld in klassen (vb.< 10 j, 10-15j, 16-20j, 21-40j, > 40j) Nationaliteit Onveiligheidsgevoelens van ouderen (60 +) in Leuven, gaande van ‘ik voel me heel veilig in de stad Leuven’ tot ‘ik voel me helemaal niet veilig in de stad Leuven’. Temperatuur in september 2010 Oefening 4: De volgende lijst weerspiegelt het aantal veroordelingen voor seksuele delicten in 2000 per type beroep van de veroordeelde. De variabele die ons hier interesseert, is het beroep. Welk type variabele is dit? Welk(e) type(s) van grafische weergave(n) zou de meest geschikte zijn? Wat vertelt / vertellen deze over de variabele? Waarom kan je geen gemiddelde berekenen van deze variabele? Arbeider: 28 Bediende: 4 Kaderlid: 19 Geestelijke: 26 Werkloos: 14 3 Oefening 5: Interpreteer onderstaande grafiek. Bron: http://habe.hogent.be/stat/statistiek/basis/graphs.html Oefening 6: Interpreteer onderstaande grafiek. Waarom is dit een geschikte grafische voorstelling? Bron: Veiligheidsmonitor 2006, analyse van de enquête voor de provincie Antwerpen 4 Oefening 7: Bron: Veiligheidsmonitor 2006, analyse van de enquête voor de provincie Antwerpen Welke grafische voorstelling wordt hier gebruikt? Kan men spreken van een stijging of daling doorheen de jaren voor de variabele ‘delicten op persoonsniveau’? Als je zou beschikken over de ruwe cijfers, hoe zou je dan de procentuele daling en stijging kunnen berekenen? Oefening 8: Van een bepaalde verdeling kennen we de volgende eigenschappen: De modus is 88 De mediaan is 88 Het rekenkundig gemiddelde bedraagt 63 Welke conclusies kan je trekken in verband met de vorm van deze verdeling? 5 Oefening 9: Aan 18 daders van cyberpesten werd gevraagd hoe vaak zij anderen al hadden gepest via elektronische communicatiemiddelen. Hieronder vind je het overzicht. Bereken de mediaan en het gemiddelde. Welk centrumkenmerk geeft de beste samenvatting van onderstaande gegevens? Persoon Aantal keer gecyberpest 1 4 11 4 2 16 12 11 3 10 13 10 4 7 14 88 5 3 15 9 6 112 16 12 7 5 17 8 8 10 18 5 9 6 10 2 Persoon Aantal keer gecyberpest 6 Oefening 10: De volgende hypothetische data geven het percentage politieofficieren weer die onderzoek verrichten naar narcotica (en dit voor 100 Amerikaanse steden). Identificeer de modus, de mediaan en het gemiddelde. Wat is de meest geschikte grafische voorstelling en waarom? Percentage werkkrachten die betrokken zijn in narcotica onderzoek [0-10( [10-20( [20-30( [30-40( [40-50( [50-60( [60-70( [70-80( [80-90( [90-100( Frequentie 5 13 26 38 14 2 2 0 0 0 Oefening 11: De volgende data weerspiegelen het aantal personen die geëxecuteerd werden in de Verenigde Staten vanaf 1977 tot en met 1983. Jaar 1977 1978 1979 1980 1981 1982 1983 Aantal executies 1 0 2 0 1 2 5 Wat is het gemiddelde en de mediaan van het aantal executies over deze periode heen? Wat gebeurt er met het gemiddelde en de mediaan wanneer we het jaar 1984 toevoegen waarin er 21 executies plaatsvonden? Welke centrumkenmerk zou je gebruiken om de distributie 1977-1984 te beschrijven? 7 Oefening 12: De volgende data weerspiegelen het aantal misdrijven tegen de lichamelijke integriteit in het gerechtelijk arrondissement Leuven van 2000 tot 2009. Bereken voor ‘verkrachting’: (a) de range (b) de interkwartielafstand. (c) de variantie en de standaarddeviatie. Bron: http://www.polfed-fedpol.be/crim/crim_statistieken/2009_trim4/pdf/arrondissement/rapport_2009_trim4_arro_Leuven_nl.pdf Oefening 13: Aan een groep van 205 vrouwelijke studenten werd gevraagd hoeveel uren per week zij spendeerden op facebook. Hun antwoorden worden weergegeven in de volgende intervallen. Bepaal de standaarddeviatie en de variantie voor deze gegevens. Aantal uren Frequentie 0- 5 76 5 – 10 52 10 – 15 38 15 – 20 21 20 – 25 10 25 – 30 6 30 -35 2 Totaal 205 8 Oefening 14: Interpreteer onderstaande boxplots Bron: http://www.math.sfu.ca/~cschwarz/Stat-301/Handouts/node35.html Oefening 15: In hun uitgebreide studie over IQ en delinquentie vinden Hirschi en Hindelang (1977) dat een lager IQ systematisch samenhangt met het begaan van delicten. De volgende hypothetische data zijn de IQ-scores van een steekproef van 40 jongeren die voor een plaatselijk jongerengerechtshof verschenen. Construeer een boxplot voor deze data. Wat is de gemiddelde IQ-score? Is de verdeling scheef? 95 80 88 67 89 93 104 100 99 84 92 103 67 60 74 87 101 78 93 69 104 78 66 52 63 95 105 92 90 87 68 102 92 74 81 75 62 69 75 77 9 Oefening 16: Construeer een boxplot per staat voor de volgende werkgelegenheidscijfers van de politie. Wat is de mediaan voor het aantal werkende politieagenten per staat. Zitten er uitbijters in deze gegevensbank? Wat besluit je over de vorm van de verdeling? Voltijds werkende politieagenten geordend per staat en regio Geordend naar grootte, 1988 Noordoosten Vermont 1224.00 New Hampshire 2756.00 Maine Rhode Island Connecticut Massachusetts Pennsylvania New Jersey 2777.00 2803.00 9355.00 17881.00 28653.00 30476.00 New York 66261.00 Zuiden Delawara West Virginia District of Columbia 1769.00 3184.00 4594.00 Arkansas Mississippi Kentucky South Carolina Oklahoma Alabama Tennessee Lousiana 4782.00 5497.00 7326.00 8335.00 8632.00 9556.00 11435.00 12090.00 Maryland Virginia North Carolina Georgia Florida Texas 14041.00 14136.00 15728.00 16532.00 38583.00 42384.00 Midwesten North Dakota South Dakota Nebraska Iowa Kansas Minnesota Indiana Winsconsin Missouri Michigan Ohio Illinois Westen Alaska Wyoming Montana Idaho Hawaii Utah Nevada New Mexico Oregon Colorado Washington Arizona California 1303.00 1497.00 3619.00 5713.00 6520.00 8564.00 12306.00 12896.00 13665.00 23463.00 24947.00 38541.00 1562.00 1633.00 1811.00 2434.00 2959.00 3596.00 4101.00 4438.00 6174.00 8941.00 10081.00 10232.00 79868.00 10 11