1 Antwoorden gemengde opgaven BSK, studiejaar 03/04 G.1 a. Binomiaal model: het gaat om het percentage kiezers met vertrouwen onder de CDA-ers VVD-ers en D66’ers tezamen: 144+ 105+ 28 = 277 van de 342+210+84=636. Het 95%-betrouwbaarheidsinterval voor het percentage van de kiezers van de coalitiepartijen, die vertrouwen hebben in het kabinet, vinden we door 95%-BI(p) met 100 te vermenigvuldigen. b. Binomiaal model: het is een rechtseenzijdige z-toets op de fractie p (van kiezers op CDA/VVD/D66, die vertrouwen hebben in het kabinet). 144 + 105 + 28 = 277 kiezers hebben vertrouwen van de van de 304 +193 + 65 = 562 kiezers die daarover een mening hebben. Omdat minder dan de helft in de steekproef vertrouwen heeft in het kabinet, zal de nulhypothese dat de helft of minder vertrouwen heeft (H0: p ≤ 0.5) niet verworpen worden: de toetsingsgrootheid z is negatief, dus de rechteroverschrijdingskans is groter dan 50% G.2 a. Voor beide steekproeven afzonderlijk wordt aangenomen dat de aantallen fouten onafhankelijk en normaal verdeeld zijn, met onbekende μ en σ: de één steekproef t-procedure wordt twee keer toegepast om een 95%-BI(μ) te bepalen. b. Het gaat hier om twee afhankelijke steekproeven (oud en nieuw betreffen steeds dezelfde centrale: gepaarde waarnemingen): de (eenzijdige) één steekproef ttoets wordt toegepast op de verschillen, die onafhankelijk en normaal verdeeld zijn (normaliteitsaanname is noodzakelijk: n = 14 is “klein”). De tekentoets is een parametervrij alternatief als normaliteit niet geldt: het aantal positieve verschillen wordt geteld: 11 van de 14. c. Dit is geen correcte methode omdat de twee betrouwbaarheidsintervallen afhankelijk zijn (per centrale 2 gepaarde waarnemingen). We zijn geïnteresseerd in de verschillen tussen de twee programma’s, in de twee betrouwbaarheidsintervallen zit ook de variantie in het aantal fouten bij elk van de programma’s verwerkt. G.3 Het gaat hier om twee afhankelijke steekproeven (de gewichtsmetingen betreffen steeds dezelfde vrouw: gepaarde waarnemingen): de één steekproef t-toets wordt toegepast op de verschillen, die onafhankelijk en normaal verdeeld zijn (aanname is noodzakelijk: n=17). We moeten dus een derde rij van verschillen aan de tabel toevoegen en daarop de t-toets toepassen. G.4 a. Twee onafhankelijke steekproeven (de nummering houdt geen koppeling in!) en een kwantitatieve variabele (leges) Twee steekproeven t-toets (eenzijdig) voor het verschil in verwachte legeskosten. Veronderstellingen: twee aselecte steekproeven uit normale verdelingen met onbekende en verschillende μ’s en σ’s. (Eventueel kan verondersteld worden dat de σ’s gelijk zijn en de t-toets voor de samengetelde variantie worden uitgevoerd: de s-en verschillen in deze twee kleine steekproeven immers niet al te veel. De toets op gelijkheid van varianties kan dat uitwijzen) Opmerking: in principe kan op deze gegevens de t-procedure voor gepaarde 2 waarnemingen worden uitgevoerd, maar deze t-toets is minder onderscheidend en dus een slechte keuze. b. Eén steekproef t-procedure voor een 95%-betrouwbaarheidsinterval voor μ, de gemiddelde legeskosten voor verbouwplannen van € 20.000 in de grote steden. G.5 a. Nee, het zijn schattingen van μ en σ en worden daarom aangeduid met x en s. b. Eén steekproef t-procedure voor een 90%-betrouwbaarheidsinterval voor de verwachte levensduur μ van een paar lenzen. Veronderstellingen: de 6 levensduren zijn onafhankelijke en normaalverdeeld met onbekende μ en σ. Resultaat: (4.20, 5.00) c. Nee, μ = 5 ligt (net) in het interval, dus H0 : μ = 5 niet verwerpen (op 10%niveau) G.6 a. Het gaat hier om twee onafhankelijke steekproeven waarbij een kwantitatieve variabele (besteed bedrag wordt gemeten). Twee aselecte steekproeven uit normale verdelingen met onbekende en verschillende μ’s en σ’s. Gezien de omvang van de steekproeven is de normaliteit van beide verdelingen niet noodzakelijk en gezien de waarden van de steekproefstandaardafwijkingen lijkt de veronderstelling van gelijke varianties niet onredelijk (De daarvoor geschikte toets wijst dat ook uit). Dus te twee-steekproeven t-toets met gelijke varianties is toepasbaar. Maar ook de twee-steekproeven t-toets met onbekende en ongelijke varianties is een correcte aanpak. b. Zie a. G.7 a. Eén steekproef t-procedure b en c uitgewerkt met deze procedure (rechtseenzijdige 1 steekproef t-toets): b. 1. De aantallen aanslagen X1 ,….., X5 zijn onafhankelijk en (bij benadering) N(, )-verdeeld met onbekende en . 2. Toets H0 : = 100 tegen Ha : > 100 met = 0.01 3. Toetsingsgrootheid 4. t is t(5-1)-verdeeld als = 100 5. Waargenomen = 110 en s = 5 , dus t 4.47 6. Rechtseenzijdige toets: t c, dan verwerpen P( T(4) c) = 0.01 = dus c = 3.75 7. t = 4.47 > c dus verwerpen. 8. Het verbruikte bedrag per klant is significant hoger dan voor de gratis verstrekking van de creditcard, op 1%-niveau. (Met P-waarde: P( T(4) 4.47) tussen 0.5% en 1%, dus P-waarde < 0.01 = : verwerpen.) G.8 a. Eén steekproef z-procedure: een 99%-betrouwbaarheidsinterval voor μ, de verwachte arbeidssatisfactiescore op de betreffende afdeling, bij bekende σ = 1.2. b. Ja, indien 7.6 niet in het interval bij b. ligt en wel op 0.5%-niveau: het is een eenzijdige z-toets terwijl het 99%-BI(μ) tweezijdig is. 3 c. Steekproefomvang n bij een één steekproef probleem, normaal model met bekende σ =1.2, en m = 0.1 en z* uit de N(0,1)-tabel bij 0.995 G.9 a. Een steekproef model met een normale verdeling met bekende σ = 2: z-toets. Gezien de waarde van n=25 is de normale verdeling voor de prijsverhogingen niet strikt noodzakelijk en kan de z-toets ook toegepast worden indien de verdeling niet scheef is. b. Bij een kleiner aantal waarnemingen neemt het onderscheidingsvermogen van de toets af. G.10 a. Binomiaal model: 90%-BI(p) bepalen voor p̂ = 92/290. b. Binomiaal model: rechtseenzijdige z-toets op H0: p = 1/2 c. Intervalgrenzen met 150 vermenigvuldigen d. Indien 18.2% buiten het interval ligt kunnen we de nulhypothese dat de VVDaanhang niet is veranderd op 10%-niveau verwerpen tegen het alternatief dat die aanhang wel is gewijzigd. G.11 a. Gevraagd wordt naar een betrouwbaarheidsinterval voor het verwachte aantal kopers, 2250p. Hierin is p de kans dat een bezoeker koper wordt. Door de grenzen van het 95%-BI(p) (binomiaal model) met 2250 te vermenigvuldigen vinden we het gevraagde interval: (1238, 1462). b. We passen de één steekproef t-procedure voor het bepalen van μ = “de gemiddelde omzet per koper” te bepalen. Vervolgens is het gevraagde interval 95%-BI( 1350μ ) = (52227, 55773) G.12 a. Het gaat hier om gepaarde waarnemingen (afhankelijke steekproeven). Eén steekproef t-procedure voor de verschillen: de p-waarde is 0.02 b. Bepaal een 90%-BI ( μ ), waarin μ het verwachte verschil in waarde is. Verwerp H0: μ = 0 ten gunste van Ha: μ ≠ 0, indien 0 niet in het interval ligt (met α = 10%). G.13 a. Niet waar. b. Waar. c. Waar. d. Niet waar (Een kleine steekproef kan ook sterk bewijs opleveren).