Hypothese toetsen Moderne Wiskunde MW B1 deel 5, hoofdstuk S3 Het is vaak onmogelijk om een volledige populatie te onderzoeken. Dan moet je je behelpen met een steekproef uit de populatie. Op grond van de resultaten van de steekproef moet een uitspraak gedaan of een beslissing genomen worden over de volledige populatie. Dat houdt een risico op verkeerde uitspraken of beslissingen in. Dat risico moet acceptabel blijven. Voorbeeld 1. (Binomiale verdeling) Een fabrikant wenst een nieuw product uitsluitend op de markt te brengen als het marktaandeel groter zal zijn dan 60%. Als dat niet het geval is, vindt hij de noodzakelijke investeringen te groot. Om te kunnen beslissen wordt een onderzoeksbureau ingeschakeld. Men gaat een aselecte steekproef van 100 potentiële gebruikers ondervragen. Hoeveel toekomstige kopers zullen er in de steekproef van 100 minimaal moeten zijn, wil de fabrikant het nieuwe product op de markt brengen? De fabrikant wil dat de kans dat hij een verkeerde beslissing neemt, niet groter is dan 5%. Uit de steekproef zal blijken hoeveel van de 100 ondervraagden toekomstige gebruikers zullen zijn. Als het er 60 of minder zijn, dan wordt het nieuwe product zeker niet op de markt gebracht. Zijn het er meer dan 60 dan zou het product wél op de markt gebracht kunnen worden. Alhoewel: als er 61 toekomstige gebruikers (van de 100 ondervraagden) zijn, dan is de kans groot dat de fabrikant een verkeerde beslissing neemt, als hij het product op de markt brengt. Op grond van steekproefresultaten wordt er een beslissing genomen. Bij een zg. toetsingsprobleem gaat het er om welke beslissing genomen wordt. We noemen een veronderstelling of een bewering een hypothese. Stel, we gaan uit van de veronderstelling dat het marktaandeel kleiner of gelijk aan 60% is, m.a.w. de fabrikant brengt dan geen nieuw middel op de markt. In dit geval noemen we deze veronderstelling de nulhypothese H0. Voor H0 geldt dan: p ≤ 0,60. Wordt de nulhypothese verworpen, dan betekent dat dat je de tegenovergestelde veronderstelling, de alternatieve hypothese H1 accepteert. Voor H1 geldt: p > 0,60. Laten we nu eens kijken hoe groot de kans is dat in de steekproef meer dan 60 toekomstige gebruikers zullen zijn. De stochast X is het aantal toekomstige gebruikers in de steekproef. We hebben te maken met een binomiale verdeling. P( X ≥ 61) = 1 − P( X ≤ 60) = 1 − 0,5379 = 0,4621 (binomcdf (100 , 0.60 , 60) = 0,5379) Als de fabrikant bij 60 of meer toekomstige gebruikers in de steekproef besluit tot het op de markt brengen van het nieuwe middel, dan gaat hij ervan uit dat er in de populatie ook minstens 60% van de mensen het nieuwe middel zullen gaan kopen. Maar de steekproef zou best wel eens een verkeerd beeld van de werkelijkheid kunnen geven (60 toekomstige gebruikers in de steekproef hoeft nog niet te beteken dat er ook werkelijk 60% van de mensen het nieuwe middel gaan gebruiken). De kans op een verkeerde beslissing (nl. dat de fabrikant op grond van de steekproef toch besluit tot het nieuwe middel, maar dat er in werkelijkheid geen 60% van de potentiële gebruikers te vinden is) is 0,4621 (46,21%). Deze kans is zelfs vrij groot. We zeggen: de kans dat H0 ten onrechte wordt verworpen is 0,4621. De kans zelf heet de overschrijdingskans. Hypothese toetsen – G.D. Bouwman 1/10 De fabrikant wil meer zekerheid en zegt dat er meer dan 60% potentiële gebruikers zullen zijn, als er in de steekproef 64 toekomstige gebruikers voorkomen. P( X ≥ 64) = 1 − P( X ≤ 63) = 1 − 0,7614 = 0,2386. (binomcdf (100 , 0.60 , 63) = 0,7614) De fabrikant vindt waarschijnlijk deze overschrijdingskans ook nog te groot. (23,86%!). Je zult wel begrijpen dat de fabrikant nooit volledige zekerheid over de gehele populatie kan krijgen op grond van de steekproefresultaten. Toch kan het risico op een verkeerde beslissing (H0 wordt dus ten onrechte verworpen) op een aanvaardbaar niveau gebracht worden. De fabrikant zou een overschrijdingskans van 5% kunnen accepteren. We zeggen: het significantieniveau α = 0,05. (Het gedeelte dat bij het significantieniveau hoort wordt ook wel kritieke gebied genoemd.) We moeten nu proberen uit te vinden, bij welk aantal in de steekproef de overschrijdingskans lager wordt dan het significantieniveau, dus voor welke k geldt: P ( X ≥ k ) ≤ 0,05 . We kunnen dit uitproberen met de GR, of m.b.v. het programma VU-Stat: P( X ≥ 68) = 1 − P( X ≤ 67) = 1 − 0,9385 = 0,0615. (binomcdf (100 , 0.60 , 67) = 0,9385) P( X ≥ 69) = 1 − P( X ≤ 68) = 1 − 0,9602 = 0,0398. (binomcdf (100 , 0.60 , 68) = 0,9602) Pas wanneer er minimaal 69 toekomstige gebruikers in de steekproef zijn, is de fabrikant zeker van een voldoend aantal potentiële gebruikers van de volledige populatie en zal hij dus het nieuwe middel op de markt brengen. Als de fabrikant staat te springen om het nieuwe middel op de markt te kunnen brengen, zal hij het significantieniveau eerder bij 10% leggen. De keuze van het significantieniveau is dus arbitrair. Omdat voor de alternatieve hypothese geldt: p > 0,60, noemen we bovenstaande toets een rechtszijdige toets. Een andere manier om het getal 69 te vinden gaat als volgt: P( X ≥ k ) ≤ 0.05 ⇒ 1 − P( X ≤ k − 1) ≤ 0,05 . Toets op je GR in: Y1 = 1 − binomcdf (100 , 0.6 , x − 1) . Neem TblStart = 60 en ΔTbl = 1. Als je nu bij TABLE (2nd GRAPH) kijkt, zie je dat voor k = 69 bovenstaande bewering klopt. Hypothese toetsen – G.D. Bouwman 2/10 Voorbeeld 2 (Binomiale verdeling) Als een productieproces niet minstens 90% eerste kwaliteits artikelen aflevert, moet het worden bijgesteld. Dit bijstellen is een tijdrovende en kostbare zaak. Daarom neemt men een steekproef van 50 artikelen, waarbij gekeken wordt naar het aantal goede artikelen. Is de uitkomst 41 bij een significantieniveau van 5% reden om het proces bij te stellen? De stochast X is het aantal goede artikelen in een steekproef van lengte 50. X is binomiaal verdeeld. We hebben hier te maken met een linkszijdige toets. H0 : p ≥ 0,90 (bijstellen hoeft niet) De hoogste staaf zal dan bij 45 liggen. Immers 90% van 50 is 45. H1 : p < 0,90 (wel bijstellen) P( X ≤ 41) = 0,0579 (binomcdf (50 , 0.9 , 41) = 0,0579) Deze kans is groter dan 0,05. Conclusie: de nulhypothese H0 wordt niet verworpen; de uitkomst 41 is geen reden om het proces bij te stellen. Voorbeeld 3 (Binomiale verdeling, tweezijdige toets) Bij een onderzoek naar de invloed van alcohol op het rijgedrag, dronken 100 proefpersonen in vijf minuten tijd twee glazen bier. Na een kwartier kregen ze de opdracht een bepaald traject te rijden en zich steeds aan de maximumsnelheid te houden. Van 'alcoholvrije' proefautomobilisten is uit een groot aantal proefritten bekend dat zij dit traject afleggen met een gemiddelde snelheid van 82,3 km/u. Van de proefpersonen bleken er 59 het traject af te leggen met een gemiddelde snelheid van meer dan 82,3 km/u, de overige reden gemiddeld langzamer dan 82,3 km/u. Verschilt de 59 op 10%-niveau significant van de helft? M.a.w. heeft alcohol invloed op het rijgedrag, uitgaande van 10%-significantieniveau? De stochast X is het aantal proefpersonen uit een steekproef van 100 die sneller of langzamer dan de gemiddelde snelheid van 82,3 km/u rijden. X is binomiaal verdeeld. H0 : p = 0,50 (alcohol heeft geen invloed op het rijgedrag) Dat de kans p = 0,50 is, komt omdat wanneer alcohol geen invloed heeft op het rijgedrag, we er van uit kunnen gaan dat er evenveel proefpersonen sneller als langzamer dan de gemiddelde snelheid van 82,3 km/u zullen rijden. Immers dan verwachten we dat 50% van de proefpersonen sneller en 50% van de proefpersonen langzamer dan 82,3 km/u rijden. H1 : p ≠ 0,50 (alcohol heeft wel invloed op het rijgedrag) We hebben hier te maken met een tweezijdige toets. In dit geval spreken we af dat we H0 verwerpen als P( X ≤ k ) ≤ 12 α en ook als P( X ≥ k ) ≤ 12 α . We nemen dus zowel aan de linkerkant als aan de rechterkant de helft van het significantieniveau. P ( X ≥ 59) = 1 − P ( X ≤ 58) = 1 − 0,9557 = 0,0443 (< 0,05!!). (binomcdf (100 , 0.50 , 58) = 0,9557) Conclusie: H0 wordt verworpen; alcohol heeft wel invloed op het rijgedrag. Het rekenwerk bij kansen met 'trekken zonder terugleggen' is vaak vervelend. Als de populatie echter groot genoeg is (meer dan 60 elementen) en de steekproef relatief klein (minder dan 10% van de populatie) dan speelt het niet-terugleggen geen belangrijke rol en mag de binomiale formule gebruikt worden. Een binomiale verdeling is meestal goed te benaderen door een normale verdeling. Het gaat goed als n ⋅ p > 5 èn n(1 − p) > 5 . Bovendien moet er dan een continuïteitscorrectie plaatsvinden. Hypothese toetsen – G.D. Bouwman 3/10 Bij een binomiaal verdeelde stochast gelden de volgende formules: μ = n ⋅ p en σ = n ⋅ p ⋅ (1 − p) . Voorbeeld 4 (Benaderen van een binomiale verdeling met een normale verdeling) In een zeker land zullen over een jaar verkiezingen worden gehouden. De oppositie beweert dat als er nu zou worden gekozen, 40% van de kiezers op hen zou stemmen. Het onderzoeksbureau van een van de regeringspartijen denkt dat dit percentage lager ligt. Zij willen controle met behulp van een aselecte steekproef van 1000 kiesgerechtigden. a) Ga na dat het onderzoeksbureau niet gelijk heeft als er van de steekproef 370 mensen op de oppositie zouden stemmen. Het significantieniveau is 1%. b) Bereken bij welk aantal in de steekproef van 1000 kiesgerechtigden het onderzoeksbureau niet gelijk heeft bij een significantieniveau van 1%. De stochast X is het aantal oppositiestemmers in de steekproef van 1000. (oppositie heeft gelijk) H0 : p = 0,40 en dus ook p ≥ 0,40 (oppositie heeft gelijk) H1 : p < 0,40 (onderzoeksbureau regeringspartij heeft gelijk) Hier dus een linkszijdige toets. a) Met de nieuwste grafische rekenmachines kan deze opgave opgelost worden m.b.v. de binomiale verdeling. Sommige oudere rekenmachines accepteren niet dat je bij binomcdf een getal > 999 invult. Intoetsen in de GR geeft dan de foutmelding: ERROR: DOMAIN. (De steekproef van 1000 is te groot.) Hieronder staat een voorbeeld hoe we dan te werk gaan: We stappen over naar de normale verdeling. Aan de voorwaarden (zie eerder) is wel voldaan. μ = 1000 ⋅ 0,4 = 400 σ = 1000 ⋅ 0,4 ⋅ 0,6 ≈ 15,49 H0 : μ ≥ 400 H1: μ < 400. Denk aan de continuïteitscorrectie!! Nu geldt dus: P ( X ≤ 370) = P ( X ≤ 370,5) = 0,0284 > 0,01 Conclusie: de nulhypothese wordt niet (normalcdf (−1E99 , 370.5 , 400 ,15.49) = 0,0284) verworpen. Vooralsnog heeft de oppositie gelijk. b) Met de nieuwste rekenmachines kun je deze opgave gewoon oplossen met de binomiale verdeling. Hier geven we een voorbeeld hoe je moet handelen als je een benadering met de normale verdeling wilt. P ( X ≤ k ) = P ( X ≤ k + 12 ) ≤ 0,01 Op GR toets je het volgende in : Y1 = normalcdf ( −1E99 , X + 0.5 , 400 , 15.49) en X min = 300, Y2 = 0.01 X max = 400, Ymin = 0, Ymax = 0.02. Via GRAPH Æ CALC Æ INTERSECT krijg je voor k ≈ 363,46. Conclusie: bij 363 of minder kiesgerechtigden in de steekproef heeft het onderzoeksbureau gelijk met haar bewering, de nulhypothese wordt dus verworpen. Hypothese toetsen – G.D. Bouwman 4/10 De z-toets Bij een toetsprobleem kan de toetsingsgrootheid normaal verdeeld zijn met een bekende standaardafwijking. Een vermoeden omtrent het gemiddelde van de verdeling kun je toetsen d.m.v. een steekproef. De vraag is dan of er teveel of te weinig afgeweken wordt van het gemiddelde μ. Zo ja, dan wordt de nulhypothese verworpen. Voorbeeld 5 In een bedrijf is de totale tijd X in uren die per dag wordt overgewerkt normaal verdeeld met μ x = 9,3 en σx = 2,1. Sinds kort is een systeem van flexibele werktijden ingevoerd. In een periode van 25 werkdagen bleek de gemiddelde totale overwerktijd 8,3 uur per dag te zijn. Onderzoek of bij een significantieniveau van 1% geconcludeerd kan worden dat het nieuwe systeem invloed op de overwerktijd heeft. De stochast X is de overwerktijd per dag in uren. We hebben hier te maken met een tweezijdige toets, want er kan minder of juist meer overgewerkt worden. In beide gevallen heeft het nieuwe systeem invloed op de overwerktijd. Merk op dat er niet gevraagd wordt of het nieuwe systeem beter is dan het oude systeem! H0 : μ = 9,3 H1: μ ≠ 9,3 De stochast X is het gemiddelde aantal uren overwerktijd per dag in de steekproef. De stochast X is normaal verdeeld met μ x = 9,3 en σ x = 2,1 25 = 0,42 . We berekenen de overschrijdingskans: P ( X ≤ 8,3) = 0.0086 (> 12 α !!) (normalcdf (−1E99 , 8.3 , 9.3 , 0.42) = 0,0086) Conclusie: H0 wordt niet verworpen: het nieuwe systeem heeft geen invloed op de overwerktijd. De GR bezit een optie om hypothesen te toetsen. Om dit uit te leggen, gebruiken we het bovenstaande voorbeeld. STAT Æ TESTS Æ 1:Z-Test… Æ Zorg dat achter Inpt (=Input) niet Data, maar Stats knippert. Vul in: μ0 : 9.3 σ : 2.1 (je vult dus de standaarddeviatie van de populatie in!) x : 8.3 n : 25 Bij de regel [μ: ≠μ0 <μ0 > μ0] laat je ' <μ0 ' knipperen. De conclusie m.b.t. het significantieniveau van de tweezijdige toets laat de GR aan jezelf over. Als je nu Calculate activeert, rekent de GR de kans voor je uit. Wil je bovendien ook nog een schets, dan activeer je Draw. De GR voert de toets voor het gemiddelde niet uit door middel van overschrijdingskansen, maar gebruikt een z-waarde op grond waarvan je dus een conclusie moet trekken. De z-waarde is het getal dat je krijgt als je overgaat van de normale verdeling naar de standaardnormale verdeling. Het gemiddelde is dan 0 en de standaarddeviatie 1. De formule voor z is: z = g−μ , waarbij g de grens is, μ het gemiddelde en σ de standaarddeviatie. σ Hypothese toetsen – G.D. Bouwman 5/10 Bij het toetsen van hypothesen doe je op grond van een steekproefgemiddelde een uitspraak over het al dan niet verwerpen van de nulhypothese. Je hebt bij de berekening, zoals je zag, te maken met een linkszijdige, rechtszijdige of tweezijdige toets. In het laatste geval neem je voor elke zijde van de grafiek de helft van het significantieniveau. Om duidelijk te maken welke soort toets we moeten gebruiken, nog enkele voorbeelden: Voorbeeld 6 In een koffiebranderij worden pakken gevuld met koffiebonen. Het gewicht X in gram van de pakken is normaal verdeeld met σx = 4 gram. De fabrikant beweert dat de vulmachine zo is ingesteld dat een pak gemiddeld 505 gram weegt. Toets onderstaande beweringen als gekozen is voor α = 0,05 en voor de steekproeflengte n = 25. a) Een consumenten organisatie zegt dat de pakken gemiddeld minder dan 505 gram wegen. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 504 gram is. b) De afdeling controle beweert dat t.g.v. een defect van de vulmachine het gemiddelde gewicht niet 505 gram is. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 506,5 gram is. c) Het hoofd van de calculatie-afdeling beweert dat het gemiddelde gewicht meer dan 505 gram is. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 506,4 gram is. De stochast X is normaal verdeeld met μ x = 505 en σ x = a) H0 : μ ≥ 505 H1: μ < 505 4 25 = 0,8 . P ( X < 504) = 0.1056 (> α ) (normalcdf (−1E99 , 504 , 505 , 0.8) = 0,1056) Conclusie: H0 wordt niet verworpen: de consumentenorganisatie heeft geen gelijk. b) H0 : μ = 505 H1: μ ≠ 505 P ( X ≥ 506,5) = 0.0304 (> 12 α !!) (normalcdf (506,5 , 1E99 , 505 , 0.8) = 0,0304) Conclusie: H0 wordt niet verworpen: de afdeling controle heeft geen gelijk. c) H0 : μ ≤ 505 H1: μ > 505 P ( X ≥ 506,4) = 0.0401 (< α ) (normalcdf (506,4 , 1E99 , 505 , 0.8) = 0,0401) Conclusie: H0 wordt verworpen: het hoofd van de calculatieafdeling heeft wel gelijk. Hypothese toetsen – G.D. Bouwman 6/10 ================================== Nu eerst even een stukje geschiedenis: Carl Friedrich Gauss (1777 - 1855) heeft de theorie van de normale verdeling ontwikkeld. Hij kwam de theorie op het spoor toen hij zich ging bezighouden met de astronomie. Gauss slaagde erin, uitgaande van een gering aantal gegevens, de baan van de eerste ontdekte planetoïde, Ceres, te berekenen. De formule voor de grafiek van de normale verdeling is: f ( x) = 1 σ 2π ⋅e 1 ⎛ x−μ ⎞ − ⎜ ⎟ 2⎝ σ ⎠ 2 . Hierbij is μ het gemiddelde en σ de standaarddeviatie. De normaalkromme die bij deze functie hoort wordt ook wel Gauss-kromme genoemd. De Belg Adolphe Quetelet (1796 - 1874) ontdekte echter dat de normaalkrommen goed gebruikt konden worden om allerlei menselijke kenmerken, zoals lichaamslengte, te besschrijven. Niet alle verdelingen waren normale verdelingen. De Franse wiskundige Pierre-Simon Laplace (1749 - 1827) herontdekte de zg. centrale limietstelling. (Deze stelling was al eerder ontdekt door de Engelse wiskundige Abraham de Moivre (1667 - 1754) en luidt: de som van een groot aantal onafhankelijke stochasten, die zelf niet normaal verdeeld hoeven te zijn, is nagenoeg normaal verdeeld.) Hij publiceerde hierover in zijn werk dat in 1812 verscheen. Laplace benaderde hierin binomiale kansverdelingen door normale verdelingen. Pas in 1901 werd een exact bewijs gegeven door Aleksandr Lyapunov uit Rusland. De stelling die hij bewees luidt: Voor een binomiale toevalsvariabele X met parameters n en p, verwachtingswaarde μ en standaarddeviatie σ geldt: x P( X ≤ x) = ∫σ −∞ 1 2π ⋅e 1 ⎛ t −μ ⎞ − ⎜ ⎟ 2⎝ σ ⎠ 2 dt . ================================== Hypothese toetsen – G.D. Bouwman 7/10 Opgave I (MWB1 dl 5, blz 223, opg 25) In een bepaald land heeft 42,4% van de inwoners bloedgroep A. Een onderzoeker vermoedt dat onder de lijders aan een bepaalde maagziekte dit percentage hoger ligt en laat een aselecte steekproef uitvoeren. In de steekproef van 967 lijders aan de maagziekte blijken 451 personen bloedgroep A te hebben. a) Formuleer het toetsingsprobleem. b) Wat is de conclusie met significantieniveau 1%? Opgave II (MWB1 dl 5, blz 226, opg T-1) In hotel De Witte Brug wordt bij het ontbijt altijd wit en bruin brood geserveerd in de verhouding 4 : 1. Men gaat er vanuit dat er meer wit dan bruin brood wordt gegeten. Omdat er de laatste tijd nogal wat klachten over een tekort aan bruin brood komen, besluit men een onderzoekje te doen. Aan 20 aselect getrokken gasten wordt gevraagd waaraan zij de voorkeur geven: wit of bruin brood. a) Hoe luiden de hypotheses in termen van de kansverdeling van X? b) Hoe groot is de overschrijdingskans bij x = 10? c) Is de uitkomst x = 8 op 10%-niveau significant? (MWB1 dl 5, blz 229, opg E-6) Golfballen van een bepaalde kwaliteit worden getest met een slagmachine. De ballen moeten met een marge van 2 meter een bepaalde afstand afleggen. Als er geen storingen in het productieproces zijn opgetreden, is 90% van de geproduceerde ballen goed. Wekelijks wordt er een steekproef van 150 ballen getest. Als er teveel ballen moeten worden afgekeurd, wordt de hele weekproductie gecontroleerd. In zeker week bleken er in de steekproef 13 ballen niet ver genoeg en 10 ballen te ver geslagen te zijn. a) Is het resultaat van de steekproef reden genoeg om actie te ondernemen? Neem α = 0,05. b) Wat verandert er als alleen ballen die die niet ver genoeg komen worden afgekeurd? Opgave III Opgave IV (MWB1 dl 5, blz 227, opg T-5) Een fabrikant garandeert dat minstens 95% van de door hem geleverde producten voldoet. Om dit te controleren telt een consument in een aselecte steekproef van 100 hoeveel exemplaren niet deugen. Dat blijken er 8 te zijn. a) Formuleer het toetsingsprobleem. b) Is het gevonden resultaat op 5%-niveau significant? c) Geef het kritieke gebied. (Het gebied dat bij het significantieniveau hoort.) (MWB1 dl 5, blz 221, opg 18) Opgave V Voor een beschermd broedgebied van wadvogels geldt dat het aantal nesten per 100 m2 bij benadering normaal verdeeld is met een gemiddelde 15,3 en standaardafwijking 3,9. Bij wijze van proef wordt het gebied opengesteld voor wandelaars. In het broedseizoen worden op een stuk terrein van 100 m2 negen nesten geteld. Is dit aantal op significantieniveau 10% aanleiding om te veronderstellen dat de openstelling invloed heeft op de broedintensiteit? (MWB1 dl 5, blz 303, opg 25) Bij veel computerkaartspelletjes wordt een simulatieprogramma gebruikt om te schudden en te delen. Marjanne heeft een simulator geprogrammeerd en test dit programma uit. Marjanne heeft de indruk dat hartenboer te vaak wordt getrokken. Zij laat nu 10000 trekkingen uitvoeren en telt 229 keer hartenboer. a) Toets met significantieniveau 1% of dit teveel is. b) Het lijkt erop dat het programma in het algemeen een hartenvoorkeur heeft. Stel dat bij 100 trekkingen X harten worden getrokken. Welke waarden van X zijn dan op 5%-niveau significant groot? Opgave VI Hypothese toetsen – G.D. Bouwman 8/10 Opgave VII (MWB1 dl 5, blz 220, opg 16) De lengte van 18-jarige jongens was in 1990 Norm(183,12)-verdeeld. In 2000 werd een aselecte steekproef van honderd 18-jarige jongens gehouden om te onderzoeken of de gemiddelde lengte toegenomen was. De gemiddelde lengte bleek 185 cm te zijn. Neem aan dat de standaardafwijking gelijk bleef. a) Ga na dat de gemiddelde lengte L van de steekproef Norm(μ;1,2)-verdeeld is. b) Formuleer het bovenstaande als een z-toets. Schrijf daarbij zorgvuldig de onderdelen op. c) Bereken de overschrijdingskans. d) Wat is op 5%-niveau nu de conclusie? e) Ga na of je deze toets kunt uitvoeren op je rekenmachine. Opgave VIII (MWB1 dl 5, blz 218, opg 12) Het gewicht van pakken koffie is normaal verdeeld. Bij een vulmachine is de standaardafwijking van de gewichten 16 gram. De machine moet ingesteld staan op 255 gram. De fabrikant neemt dagelijks aselect 100 pakken uit de productie en weegt ze. Op een dag wordt bij een steekproef een gemiddeld gewicht gemeten van 251 gram. De vraag is of dit gemiddelde aanleiding geeft om de machine opnieuw in te stellen. De stochast G is het gemiddeld gewicht van de pakken van de steekproef. Is de uitkomst g = 251 bij een significantieniveau van 5% reden om de machine opnieuw in te stellen? Opgave IX (MWB1 dl 5, blz 219, opg 15) Vijftien jaar geleden hebben metingen in een deel van de oceaan een gemiddelde diepte van 56,4 vadem* met een standaardafwijking van 4,9 opgeleverd. Een oceanograaf wilde nu testen of de gemiddelde diepte is afgenomen. Hij nam een aselecte steekproef van 8 metingen. De gemiddelde diepte in de steekproef is 51,2 vadem. Welke conclusie kan de oceanograaf trekken omtrent de diepte van dit deel van de oceaan? Neem α = 0,15. * 1 vadem = 6 voet; 1 Amsterdamse vadem = 1,698 meter; 1 Engelse vadem = 1, 829 meter. Opgave X (MWB1 dl 5, blz 220, opg 17) Op een landelijk examen Engels kan een deelnemer een aantal punten scoren van 10 tot en met 100. Uit ervaring weet men dat het examenresultaat van alle deelnemers bij benadering normaal verdeeld is met een standaardafwijking σ = 12. Omdat het niet goed mogelijk is om elk jaar dezelfde moeilijkheidsgraad aan te houden, verschilt de gemiddelde score van de deelnemers van jaar tot jaar. Daarom wordt het cijfer naar boven gecorrigeerd als de gemiddelde score van alle deelnemers lager is dan 65. Anders is het cijfer de score gedeeld door 10. In een zeker jaar blijkt in een aselecte steekproef van 25 examenkandidaten de gemiddelde score 60,2 punten te zijn. De vraag is nu of dit significant te weinig is en er dus moet worden gecorrigeerd. Bereken de overschrijdingskans bij g = 60,2. Wat is de conclusie op significantieniveau 5%? Opgave XI (MWB1 dl 5, blz 221 opg 19) In een ziekenhuis wordt verondersteld dat de wachttijd in een polikliniek Norm(15, 6)-verdeeld is, met de tijd in minuten. Een patiënt twijfelt aan de verwachtingswaarde van deze verdeling en voert een aselecte steekproef uit. Het resultaat staat in de tabel hieronder. wachttijden polikliniek: 14,1 13,7 17,0 19,6 2,0 19,7 10,6 29,4 18,7 14,1 18,0 De patiënt denkt dat de gemiddelde wachttijd groter is dan men in de polikliniek zegt. Ga na of deze resultaten significant afwijken van de verwachtingswaarde. Neem α = 0,05. (Internet) Zoek op internet naar examens VWO-wb1 die vragen naar het toetsen van hypothesen. Opgave XII Hypothese toetsen – G.D. Bouwman 9/10 Verkort traject "Toetsen van hypothesen". Voorbeeld 1 Een fabrikant wenst een nieuw product uitsluitend op de markt te brengen als het marktaandeel groter zal zijn dan 60%. Als dat niet het geval is, vindt hij de noodzakelijke investeringen te groot. Om te kunnen beslissen wordt een onderzoeksbureau ingeschakeld. Men gaat een aselecte steekproef van 100 potentiële gebruikers ondervragen. Voorbeeld 2. Als een productieproces niet minstens 90% eerste kwaliteits artikelen aflevert, moet het worden bijgesteld. Dit bijstellen is een tijdrovende en kostbare zaak. Daarom neemt men een steekproef van 50 artikelen genomen, waarbij gekeken wordt naar het aantal goede artikelen. Is de uitkomst 41 bij een significantieniveau van 5% reden om het proces bij te stellen? Voorbeeld 3 Bij een onderzoek naar de invloed van alcohol op het rijgedrag, dronken 100 proefpersonen in vijf minuten tijd twee glazen bier. Na een kwartier kregen ze de opdracht een bepaald traject te rijden en zich steeds aan de maximumsnelheid te houden. Van 'alcoholvrije' proefautomobilisten is uit een groot aantal proefritten bekend dat zij dit traject afleggen met een gemiddelde snelheid van 82,3 km/u. Van de proefpersonen bleken er 59 het traject af te leggen met een gemiddelde snelheid van meer dan 82,3 km/u, de overige reden gemiddeld langzamer dan 82,3 km/u. Verschilt de 59 op 10%-niveau significant van de helft? M.a.w. heeft alcohol invloed op het rijgedrag, uitgaande van 10%-significantieniveau? Voorbeeld 4 In een zeker land zullen over een jaar verkiezingen worden gehouden. De oppositie beweert dat als er nu zou worden gekozen, 40% van de kiezers op hen zou stemmen. Het onderzoeksbureau van een van de regeringspartijen denkt dat dit percentage lager ligt. Zij willen controle met behulp van een aselecte steekproef van 1000 kiesgerechtigden. a) Ga na dat het onderzoeksbureau niet gelijk heeft als er van de steekproef 370 mensen op de oppositie zouden stemmen. Het significantieniveau is 1%. b) Bereken bij welk aantal in de steekproef van 1000 kiesgerechtigden het onderzoeksbureau niet gelijk heeft bij een significantieniveau van 1%. Voorbeeld 5 In een bedrijf is de totale tijd X in uren die per dag wordt overgewerkt normaal verdeeld met μ x = 9,3 en σx = 2,1. Sinds kort is een systeem van flexibele werktijden ingevoerd. In een periode van 25 werkdagen bleek de gemiddelde overwerktijd 8,3 uur per dag te zijn. Onderzoek of bij een significantieniveau van 1% geconcludeerd kan worden dat het nieuwe systeem invloed op de overwerktijd heeft. Voorbeeld 6 In een koffiebranderij worden pakken gevuld met koffiebonen. Het gewicht X in gram van de pakken is normaal verdeeld met σx = 4 gram. De fabrikant beweert dat de vulmachine zo is ingesteld dat een pak gemiddeld 505 gram weegt. Toets onderstaande beweringen als gekozen is voor α = 0,05 en voor de steekproeflengte n = 25. a) Een consumenten organisatie zegt dat de pakken gemiddeld minder dan 505 gram wegen. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 504 gram is. b) De afdeling controle beweert dat t.g.v. een defect van de vulmachine het gemiddelde gewicht niet 505 gram is. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 506,5 gram is. c) Het hoofd van de calculatie-afdeling beweert dat het gemiddelde gewicht meer dan 505 gram is. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 506,4 gram is. Hypothese toetsen – G.D. Bouwman 10/10