Oefeningen Hoofdstuk 6 1. U meet het gewicht van een steekproef van 24 mannelijke langeafstandslopers. Het steekproefgemiddelde is x = 60 kg. Veronderstel dat de standaardafwijking van de populatie bekend is, en gelijk aan = 5 kg. (a) Wat is x, de standaardafwijking van x ? (b) Geef een 95%-betrouwbaarheidsinterval voor , de populatieverwachting van de populatie waaruit de steekproef is getrokken. Bent u er echt zeker van dat het (rekenkundig) gemiddelde gewicht van de populatie langeafstandslopers minder bedraagt dan 65 kg. 2. Bepaal een 99%-betrouwbaarheidsinterval voor het verwachte gewicht van de populatie langeafstandslopers in opgave 1. Is het 99%-interval breder of smaller dan het 95%-interval van opgave 1 ? Leg in eenvoudige termen uit waarom dit juist is. 3. Een test op het kaliumgehalte in het bloed is niet helemaal nauwkeurig. Bovendien varieert de feitelijke hoeveelheid kalium in iemands bloed van dag tot dag enigszins. Veronderstel dat herhaalde metingen op verschillende dagen bij dezelfde persoon normaal variëren met = 0.2. (a) Julie's kaliumniveau wordt éénmaal gemeten. Het resultaat is x = 3.2. Geef een 90%-betrouwbaarheidsinterval voor haar verwachte kaliumniveau. (b) Als er op drie verschillende dagen metingen werden gedaan met gemiddelde x = 3.2, wat is dan het 90%-betrouwbaarheidsinterval voor Julie's verwachte kaliumniveau. 4. Men is een onderzoek van plan naar de leesvaardigheid van achtjarigen; de onderzoekers willen een 95%-betrouwbaarheidsinterval zien te verkrijgen voor de populatieverwachting van de score bij een leestoets, met een foutmarge die niet meer bedraagt dan 5 punten. Ze verrichten een klein proefonderzoek om de variabiliteit van de toetsscores te schatten. In het proefonderzoek is de standaardafwijking van de steekproef s = 12 punten, en daarom gaan de onderzoekers bij de eerste berekeningen uit van een standaardafwijking in de populatie van = 12. (a) Het onderzoeksbudget maakt het mogelijk 100 leerlingen te kiezen. Bereken de foutmarge van het 95%-betrouwbaarheidsinterval voor de populatieverwachting, gebaseerd op n = 100. (b) Op het onderzoeksbudget drukken nog vele andere lasten. Als die allemaal bekostigd werden, zou er nog maar geld voor een onderzoek van 10 leerlingen beschikbaar zijn. Wat is de foutmarge voor het betrouwbaarheidsinterval als we uitgaan van n = 10 metingen ? (c) Bepaal de kleinste waarde van n waarvoor kan worden voldaan aan de eis van een 95%-betrouwbaarheidsinterval met een foutmarge van 5 of minder. Kan deze steekproefomvang van het beschikbare budget worden bekostigd ? 1 5. Formuleer voor elk van de volgende situaties een geschikte nulhypothese H0 en tevens een alternatieve hypothese Ha. Identificeer de parameters die worden gebruikt om de hypothesen te formuleren. (We hebben nog niet geleerd hoe deze hypothesen moeten worden getoetst). (a) Een sociologe vraagt aan een grote steekproef middelbare schoolleerlingen aan welk wetenschappelijk onderwerp zij de voorkeur geven. Ze vermoedt dat het percentage dat 'wiskunde' zal noemen bij de mannen hoger zal liggen dan bij de vrouwen. (b) Een onderwijsdeskundige verdeelt gerandomiseerd elfjarigen in twee groepen voor de gymnastiekles. Hij brengt beide groepen vaardigheden voor basketbal bij, en daarbij gebruikt hij in beide groepen dezelfde onderwijsmethoden. Groep A moedigt hij aan met complimenten en een alleszins positieve houding, terwijl hij zich tegenover groep B koel en neutraal opstelt. Hij hoopt aan te kunnen tonen dat aan positieve houding van de leraar bij een test over basketbalvaardigheden een hogere verwachte score zal opleveren dan een neutrale houding van de leraar. (c) Een econoom gelooft dat er onder jonge volwassen werkenden een positieve correlatie bestaat tussen het inkomen en het percentage van het besteedbare inkomen dat wordt gespaard. Om dit te toetsen, verzamelt hij gegevens over inkomen en spaargelden van een steekproef werkenden uit zijn stad, in de leeftijd van 25 tot 34 jaar. 6. De Survey of Study Habits and Attitudes (SSHA) is een psychologische test die bij studenten hun motivatie meet, hun attitude ten aanzien van de leerinstelling en hun studiegewoonten. De scores lopen van 0 tot 200. De verwachte score voor universiteitsstudenten in de VS is ongeveer 115, en de standaardafwijking ongeveer 30. Een docent die vermoedt dat oudere studenten ten aanzien van de leerinstelling een betere attitude hebben, geeft de SSHA aan 25 studenten van 30 jaar of ouder. Hun gemiddelde score is x = 125.2. (a) Neem aan dat voor de populatie oudere studenten geldt dat = 30, en voer een toets uit met: H0 : = 115 Ha : > 115 Geef de overschrijdingskans voor uw toets en formuleer helder uw conclusie. (b) Uw toets in onderdeel (a) vereiste twee belangrijke aannames, naast de aanname dat de waarde van bekend is. Welke zijn dat ? Welk van deze aannames is het belangrijkst voor de geldigheid van de onder (a) bereikte conclusie ? 2 7. De hoeveelheid calcium in het bloed van jonge, gezonde volwassenen varieert met een verwachting van ongeveer 9.5 milligram per deciliter en een standaardafwijking van ongeveer = 0.4. Een kliniek op het platteland van Guatemala meet bij hun eerste bezoek voor prenatale zorg de hoeveelheid calcium in het bloed van 180 gezonde zwangere vrouwen. Het gemiddelde is x = 9.57. Is dit een aanwijzing dat de verwachte hoeveelheid calcium in de populatie waar deze vrouwen vandaan komen, verschillend is van 9.5 ? (a) Formuleer H0 en Ha (b) Voer de toets uit en geef de overschrijdingskans, terwijl u aanneemt dat in deze populatie geldt : = 0.4. (c) Geef een 95%-betrouwbaarheidsinterval voor de verwachte hoeveelheid calcium, , in deze populatie. We hebben er vertrouwen in dat heel dicht ligt bij 9.5. Dit illustreert het feit dat een grote steekproef (hier is n = 180) vaak een zelfs kleine afwijking van H0 statistisch significant zal doen zijn. 8. Om vast te stellen of het verwachte nicotinegehalte van de sigaretten van een bepaald merk hoger is dan de geadverteerde waarde van 1.4 milligram, toets een groep gezondheidspropagandisten : H0 : = 1.4 Ha : > 1.4 De berekende waarde voor de toetsingsgrootheid is z = 2.42. (a) Is het resultaat significant op het 5%-niveau ? (b) Is het resultaat significant op het 1%-niveau ? 9. Tussen welke twee waarden van tabel D ligt de overschrijdingskans voor de uitkomst z = -1.37 van opgave 6.36 ? (Bedenk dat Ha tweezijdig is). Bereken de overschrijdingskans met tabel A, en verifieer dat hij inderdaad ligt tussen de twee uit tabel D gevonden waarden. 10. Een steekproef van 24 langeafstandslopers heeft als hun gemiddelde gewicht x = 60 kg. Opgave 1 vroeg een 95%-betrouwbaarheidsinterval te geven voor het verwachte gewicht in de populatie van al dergelijke langeafstandslopers, aannemend dat de standaardafwijking gelijk is aan = 5 kg. (a) Vermeld het interval uit die opgave, of bereken dat interval als u die opgave hebt overgeslagen. (b) Zal, uitgaande van dit betrouwbaarheidsinterval, een toets van H0 : = 61.5 Ha : > 61.5 H0 op het 5%-niveau verwerpen ? (c) Als H0 : = 63 tegen een tweezijdig alternatief wordt getoetst, zal H0 dan op het 5%-niveau worden verworpen ? 3 11. Een onderzoeker die op zoek is naar bewijs voor paranormale begaafdheid test 500 proefpersonen. Vier van die personen doen significant beter (P < 0.01) dan 'gokken'. (a) Is het juist te concluderen dat deze vier personen paranormale begaafdheid bezitten ? Licht uw antwoord toe. (b) Wart moet de onderzoeker nu doen om te testen of er onder deze vier personen individuen zijn met paranormale begaafdheid ? 12. In een onderzoek naar mogelijk ijzergebrek bij zuigelingen, vergeleken de onderzoekers verscheidene groepen zuigelingen met verschillende voedingswijzen. Een groep van 26 zuigelingen kreeg borstvoeding. Toen ze zes maanden oud waren, hadden die zuigelingen een gemiddeld hemoglobineniveau van x = 12.9 gram per 100 millimeter bloed, en een standaardafwijking van 1.6. Neem aan dat die standaardafwijking de van de populatie is, en bereken een 95%betrouwbaarheidsinterval voor het verwachte hemoglobineniveau van zuigelingen met borstvoeding. Welke voorwaarden zijn vereist voor de geldigheid van de methode die u voor het betrouwbaarheidsinterval hebt gebruikt ? 13. Statistici geven de voorkeur aan grote steekproeven. Beschrijf in het kort het effect van vergroting van de steekproefomvang (of van het aantal proefpersonen in een experiment) op elk van de volgende grootheden. (a) De breedte van een betrouwbaarheidsinterval van niveau C. (b) De overschrijdingskans van de toets, als H0 onwaar is en alle feiten omtrent de populatie onveranderd blijven bij toenemende n. (c) Het onderscheidingsvermogen van de toets bij een vast niveau , als , de alternatieve hypothese en alle feiten omtrent de populatie ongewijzigd blijven. 4