Antwoorden opgaven

advertisement
1
Antwoorden gemengde opgaven BSK, studiejaar 03/04
G.1
a. Binomiaal model: het gaat om het percentage kiezers met vertrouwen onder de
CDA-ers VVD-ers en D66’ers tezamen: 144+ 105+ 28 = 277 van de
342+210+84=636. Het 95%-betrouwbaarheidsinterval voor het percentage van de
kiezers van de coalitiepartijen, die vertrouwen hebben in het kabinet, vinden we
door 95%-BI(p) met 100 te vermenigvuldigen.
b. Binomiaal model: het is een rechtseenzijdige z-toets op de fractie p (van kiezers
op CDA/VVD/D66, die vertrouwen hebben in het kabinet). 144 + 105 + 28 = 277
kiezers hebben vertrouwen van de van de 304 +193 + 65 = 562 kiezers die
daarover een mening hebben. Omdat minder dan de helft in de steekproef
vertrouwen heeft in het kabinet, zal de nulhypothese dat de helft of minder
vertrouwen heeft (H0: p ≤ 0.5) niet verworpen worden: de toetsingsgrootheid z is
negatief, dus de rechteroverschrijdingskans is groter dan 50%
G.2
a. Voor beide steekproeven afzonderlijk wordt aangenomen dat de aantallen fouten
onafhankelijk en normaal verdeeld zijn, met onbekende μ en σ: de één steekproef
t-procedure wordt twee keer toegepast om een 95%-BI(μ) te bepalen.
b. Het gaat hier om twee afhankelijke steekproeven (oud en nieuw betreffen steeds
dezelfde centrale: gepaarde waarnemingen): de (eenzijdige) één steekproef ttoets wordt toegepast op de verschillen, die onafhankelijk en normaal verdeeld
zijn (normaliteitsaanname is noodzakelijk: n = 14 is “klein”).
De tekentoets is een parametervrij alternatief als normaliteit niet geldt: het aantal
positieve verschillen wordt geteld: 11 van de 14.
c. Dit is geen correcte methode omdat de twee betrouwbaarheidsintervallen
afhankelijk zijn (per centrale 2 gepaarde waarnemingen). We zijn geïnteresseerd
in de verschillen tussen de twee programma’s, in de twee
betrouwbaarheidsintervallen zit ook de variantie in het aantal fouten bij elk van de
programma’s verwerkt.
G.3
Het gaat hier om twee afhankelijke steekproeven (de gewichtsmetingen betreffen
steeds dezelfde vrouw: gepaarde waarnemingen): de één steekproef t-toets wordt
toegepast op de verschillen, die onafhankelijk en normaal verdeeld zijn (aanname is
noodzakelijk: n=17). We moeten dus een derde rij van verschillen aan de tabel
toevoegen en daarop de t-toets toepassen.
G.4
a. Twee onafhankelijke steekproeven (de nummering houdt geen koppeling in!) en
een kwantitatieve variabele (leges)
Twee steekproeven t-toets (eenzijdig) voor het verschil in verwachte legeskosten.
Veronderstellingen: twee aselecte steekproeven uit normale verdelingen met
onbekende en verschillende μ’s en σ’s. (Eventueel kan verondersteld worden dat
de σ’s gelijk zijn en de t-toets voor de samengetelde variantie worden uitgevoerd:
de s-en verschillen in deze twee kleine steekproeven immers niet al te veel. De
toets op gelijkheid van varianties kan dat uitwijzen)
Opmerking: in principe kan op deze gegevens de t-procedure voor gepaarde
2
waarnemingen worden uitgevoerd, maar deze t-toets is minder onderscheidend en
dus een slechte keuze.
b. Eén steekproef t-procedure voor een 95%-betrouwbaarheidsinterval voor μ, de
gemiddelde legeskosten voor verbouwplannen van € 20.000 in de grote steden.
G.5
a. Nee, het zijn schattingen van μ en σ en worden daarom aangeduid met x en s.
b. Eén steekproef t-procedure voor een 90%-betrouwbaarheidsinterval voor de
verwachte levensduur μ van een paar lenzen. Veronderstellingen: de 6
levensduren zijn onafhankelijke en normaalverdeeld met onbekende μ en σ.
Resultaat: (4.20, 5.00)
c. Nee, μ = 5 ligt (net) in het interval, dus H0 : μ = 5 niet verwerpen (op 10%niveau)
G.6
a. Het gaat hier om twee onafhankelijke steekproeven waarbij een kwantitatieve
variabele (besteed bedrag wordt gemeten). Twee aselecte steekproeven uit
normale verdelingen met onbekende en verschillende μ’s en σ’s. Gezien de
omvang van de steekproeven is de normaliteit van beide verdelingen niet
noodzakelijk en gezien de waarden van de steekproefstandaardafwijkingen lijkt de
veronderstelling van gelijke varianties niet onredelijk (De daarvoor geschikte toets
wijst dat ook uit). Dus te twee-steekproeven t-toets met gelijke varianties is
toepasbaar. Maar ook de twee-steekproeven t-toets met onbekende en ongelijke
varianties is een correcte aanpak.
b. Zie a.
G.7
a. Eén steekproef t-procedure
b en c uitgewerkt met deze procedure (rechtseenzijdige 1 steekproef t-toets):
b. 1. De aantallen aanslagen X1 ,….., X5 zijn onafhankelijk en (bij benadering)
N(, )-verdeeld met onbekende  en .
2. Toets H0 :  = 100 tegen Ha :  > 100 met = 0.01
3. Toetsingsgrootheid
4. t is t(5-1)-verdeeld als  = 100
5. Waargenomen = 110 en s = 5 , dus t  4.47
6. Rechtseenzijdige toets: t  c, dan verwerpen
P( T(4)  c) = 0.01 =  dus c = 3.75
7. t = 4.47 > c dus verwerpen.
8. Het verbruikte bedrag per klant is significant hoger dan voor de gratis verstrekking
van de creditcard, op 1%-niveau.
(Met P-waarde: P( T(4)  4.47) tussen 0.5% en 1%, dus P-waarde < 0.01 = :
verwerpen.)
G.8
a. Eén steekproef z-procedure: een 99%-betrouwbaarheidsinterval voor μ, de
verwachte arbeidssatisfactiescore op de betreffende afdeling, bij bekende σ = 1.2.
b. Ja, indien 7.6 niet in het interval bij b. ligt en wel op 0.5%-niveau: het is een
eenzijdige z-toets terwijl het 99%-BI(μ) tweezijdig is.
3
c. Steekproefomvang n bij een één steekproef probleem, normaal model met
bekende σ =1.2, en m = 0.1 en z* uit de N(0,1)-tabel bij 0.995
G.9
a. Een steekproef model met een normale verdeling met bekende σ = 2: z-toets.
Gezien de waarde van n=25 is de normale verdeling voor de prijsverhogingen niet
strikt noodzakelijk en kan de z-toets ook toegepast worden indien de verdeling
niet scheef is.
b. Bij een kleiner aantal waarnemingen neemt het onderscheidingsvermogen van de
toets af.
G.10
a. Binomiaal model: 90%-BI(p) bepalen voor p̂ = 92/290.
b. Binomiaal model: rechtseenzijdige z-toets op H0: p = 1/2
c. Intervalgrenzen met 150 vermenigvuldigen
d. Indien 18.2% buiten het interval ligt kunnen we de nulhypothese dat de VVDaanhang niet is veranderd op 10%-niveau verwerpen tegen het alternatief dat die
aanhang wel is gewijzigd.
G.11
a. Gevraagd wordt naar een betrouwbaarheidsinterval voor het verwachte aantal
kopers, 2250p. Hierin is p de kans dat een bezoeker koper wordt. Door de
grenzen van het 95%-BI(p) (binomiaal model) met 2250 te vermenigvuldigen
vinden we het gevraagde interval: (1238, 1462).
b. We passen de één steekproef t-procedure voor het bepalen van μ = “de
gemiddelde omzet per koper” te bepalen. Vervolgens is het gevraagde interval
95%-BI( 1350μ ) = (52227, 55773)
G.12
a. Het gaat hier om gepaarde waarnemingen (afhankelijke steekproeven).
Eén steekproef t-procedure voor de verschillen: de p-waarde is 0.02
b. Bepaal een 90%-BI ( μ ), waarin μ het verwachte verschil in waarde is. Verwerp
H0: μ = 0 ten gunste van Ha: μ ≠ 0, indien 0 niet in het interval ligt (met α = 10%).
G.13
a. Niet waar.
b. Waar.
c. Waar.
d. Niet waar (Een kleine steekproef kan ook sterk bewijs opleveren).
Download