Voortgangstoets KReS 2, 21 mei 2010. 1 Een machine hoort afgesteld te zijn op productie met μ = 20 en variantie 4. Een steekproef van 16 waarnemingen had als gemiddelde 19. Veronderstel dat de standaardafwijking ook bij variërende constant blijft, en dat de waarnemingen normaal verdeeld zijn. [15] a Toets H0: μ = 20 tegen H1: μ 20 bij α = 5% door a1 zowel het verwerpingsgebied voor X te bepalen, en hiermee de conclusie te trekken, a2 als de p-waarde te bepalen en de conclusie hierop te baseren, a3 als het 95% betrouwbaarheidsinterval te bepalen en de conclusie hierop te baseren. [5] b Bepaal de kans op de fout van de tweede soort als μ = 21 H1. 2 Uit twee steekproeven kwamen de volgende resultaten te voorschijn: nx = 13 x = 250 sx2 = 441 ny = 8 y = 200 sy2 = 484 a [10] Bepaal het (2-zijdig ) 90% betrouwbaarheidsinterval (BI) voor 2X / Y2 indien de steekproeven uit normaal verdeelde populaties komen. Je kunt hierbij gebruik maken van het feit dat S X2 Y2 SY2 2X ~ F (nx 1, n y 1). Is er op basis van dit 90% BI voldoende bewijs om de hypothese H 0 : 2X Y2 te verwerpen versus het alternatief H1 : 2X Y2 (bij α = 10%)? Motiveer je antwoord. b [10] Toets de nulhypothese H 0 : X Y tegen H1 : X Y onder de veronderstelling dat 2X Y2 met α = 1%. Geef de toetsingsgrootheid+verdeling, kritiek gebied, waarde toetsingsgrootheid, beslissing en conclusie in woorden. 3 De steekproef X1 , X 2 ,L , X n is getrokken uit een normale verdeling met verwachting X en variantie 2 , en de steekproef Y1 , Y2 ,L , Ym uit een normale verdeling met verwachting Y en dezelfde variantie 2 . De twee verdelingen waaruit is getrokken zijn onafhankelijk van elkaar. Het doel van deze ( X Y ) ( X Y ) opgave is om stapsgewijs te bewijzen dat een Student t verdeling heeft met Sp 1 1 n m (m 1) SY2 , en waarbij X , Y , S X2 , SY2 de nm2 gebruikelijke betekenis hebben. Elke stap hieronder borduurt voort op de voorafgaande stappen, en kan ook afzonderlijk gemaakt worden. Maak gebruik van de zes stellingen die aan het einde van de opgave zijn gegeven. Voor de duidelijkheid: deze stellingen hoeven hier niet bewezen te worden, maar geef in de bewijzen van de onderstaande stappen wel nauwkeurig aan welke stellingen worden gebruikt en hoe ze toegepast moeten worden. n+m-2 vrijheidsgraden, en waarbij S p2 a [5] Bewijs dat X ~ N X , b [5] Bewijs dat 2 n ( X Y ) ( X Y ) 1 1 n m (n 1) S X2 ~ N(0,1) (bepaal eerst verdeling van X Y ) c [5] Bewijs dat d [5] Bewijs dat (n m 2) S p2 ~ 2n m 2 ( X Y ) ( X Y ) 2 Sp 1 1 n m (Zie definitie van S p2 hierboven) ~ tn m 2 2 2 Stelling 1: Als V ~ N(V , V2 ) en W ~ N(W , W ) en onafh., dan is V W ~ N(V W , V2 W ) 2 Stelling 2: Als W ~ N W , W , dan is 2 a W W a ~N W , 2 b b b (voor willekeurige a en b 0 ) Stelling 3: Voor een steekproef ter grootte n uit een normale verdeling met variantie 2 geldt: (n 1)S 2 ~ 2n1 2 Stelling 4: Als V ~ 2j en W ~ 2k en onafh., dan is V W ~ 2j k Stelling 5: Als Z ~ N(0,1) en W ~ 2k en onafh., dan is Stelling 6: X en S X2 zijn onafhankelijke stochasten. Z W k ~ tk Uitwerkingen Verwerpinggebied is: Z 1 X 20 2 / 16 z2.5% 1.96 Z z2.5% 1.96 X 20 1.96 2 16 19.02 X 20 1.96 2 16 20.98 We zien dat x 19 VG H 0 verwerpen Conclusie: gegeven 5% is er voldoende bewijs om te concluderen dat het populatie gemiddelde ongelijk is aan 20. X 20 19 20 P[ X 19] P P[ Z 2] 1 (2) 0.0228 2 / 16 2 / 16 p-waarde 2 0.0228 0.0456 [want 2-zijdig alternatief] p-waarde 5%, dus H 0 verwerpen. Dezelfde conclusie als bij a1. a2 a3 95% betrouwbaarheidsinterval 2 2 , X z / 2 ,19 1.96 X z / 2 19 1.96 (18.02,19.98) n n 16 16 De waarde 20 ligt niet in het 95% BI, dus H0: μ = 20 verwerpen. Dezelfde conclusie als bij a1. Een fout van de tweede soort wordt gemaakt, als H0 niet wordt verworpen (dus als 19.02 < X < 20.98), èn als de werkelijke niet die van de nulhypothese is, dus bv. als = 21. De kans dat dit gebeurt is: b 19.02 21 X 20.98 21 P(19.02 X 20.98 | 21) P / n 2 / 16 2 / 16 P(3.96 Z 0.04) 1 (0.04) 0.4840 2a F / 2 (12, 7) S X2 Y2 SY2 2X F1 / 2 (12, 7) S 2 2 1 1 Y2 X2 F0.975 (12, 7) S X Y F.025 (12, 7) S X2 SY2 2 S2 1 X2 X2 F0.975 (7,12) F0.975 (12, 7) Y SY 2X 2X 441 1 441 2.91 0.255 2 2.651 484 3.57 Y2 484 Y Nee, er is niet voldoende bewijs om de nulhypothese H 0 : 2X Y2 te verwerpen want de waarde 1 bevindt zich in het 95% BI voor de ratio van de varianties (merk op dat de nulhypothese impliceert 2X / Y2 1 ). b Hypothesen: H 0 : X Y versus H1 : X Y (X Y ) ~ t( n1 n2 219) 1 1 Sp n1 n2 Toetsingsgrootheid: T Kritiek gebied: [t (19) 2.539, ) 7 484 456.84 Waarde&beslissing: S 2p 12 441 19 19 (250 200) 5.206 K .G. verwerp H 0 1 1 456.84 13 8 t Conclusie: Gegeven 1% is er voldoende bewijs om te concluderen dat het gemiddelde van X groter is dan het gemiddelde van Y. 3a Gegeven is dat X i ~ N X , 2 (i 1,L , n) . X i is onafhankelijk van X j (i j ) , dus herhaalde toepassing van Stelling 1 geeft dan: resultaat: X b X i ~ N nX , n2 . Vervolgens levert Stelling 2 het gewenste 2 1 . X i ~ N X , n n , en dus ook (Stelling 2): Y ~ N , . Uit stelling 1 volgt dan: X Y ~ N , . m n m Uit deel a. volgt door analogie ook dat Y ~ N Y , 2 m 2 2 Y X 2 Y Tenslotte volgt dan het resultaat eenvoudig mbv Stelling 2 (neem a X Y en b 1 n 1 m ) c Uitschrijven: Stelling 3: (n m 2) S p2 2 (n 1)S X2 (n 1) S X2 (m 1) SY2 2 ~ 2n1 en (n 1)SY2 (n 1) S X2 2 (m 1) SY2 2 ~ 2m1 . Uit de onafhankelijkheid van de twee verdelingen waaruit is getrokken volgt dat we nu Stelling 4 mogen toepassen, die het gewenste resultaat geeft. d 2 2 Stelling 6: X en S X2 zijn onafhankelijk, dus naar analogie ook Y en SY2 . Uit onafhankelijkheid van de twee verdelingen volgt tevens dat X en SY2 onafh. zijn, evenals Y en S X2 . Dus zijn ook X Y en SP2 onafhankelijk, en kunnen we Stelling 5 toepassen met Z ( X Y ) ( X Y ) 1 1 n (zie deel b), en met W n m ( n m 2) S p2 2 m ( X Y ) ( X Y ) 1 1 (n m 2) S p2 (n m 2) 2 ~ 2n m 2 (zie c)): ( X Y ) ( X Y ) 1 1 n S p2 2 m ( X Y ) ( X Y ) Sp 1 1 n m ~ tn m 2