Toetsen(*)

advertisement
Netwerk boek B1 (deel 5) Hoofdstuk 4
Opmerking vooraf: alle gevraagde kansen kunnen in de tabel worden opgezocht dan wel m.b.v. de GR worden
bepaald.
Vanwege de (vermoedelijk) iets grotere precisie van de GR kunnen er soms
kleine verschillen optreden.
Som 1
a) Het percentage ligt vrij veel onder hetgeen men verwachtte. De olie is dus misschien toch niet van het schip
afkomstig.
b) Het zou dan olie kunnen zijn die van het schip afkomstig is, want het zwavelpercentage ligt dicht bij de
verwachte 4,5 %
c) Het percentage ligt onder de 4,5 %, maar ook weer niet zoveel dat de kapitein van het schip automatisch vrijuit
gaat.
Som 2
H :   1500
H :   1500
0
1
a)
b) De toetsingsgrootheid X is het aantal uren zon dat geregistreerd wordt.
Som 3
P( X  4,2 |   4,5 ;   0,2 )  (
a)
4,2  4,5
)  ( 1,5 )  0,0668
0,2
Vanwege de symmetrie is de totale kans dan twee keer zo groot, dus 0,1336
Met de Gr wordt het:
P( X  4,2  X  4,8 )  2  normalcdf ( 1000,4.2,4.5,0.2 )  2  0,0668  0,1336
b) De nulhypothese wordt dus niet verworpen (want 13,36 > 5). In gewoon nederlands betekent dit dat
Rijkswaterstaat er, op grond van hun meting, vanuit gaat dat de olie van het gehalte 4,5 % is (maar: er is geen
sprake van zekerheid!)
Som 4
P( X  1330  X  1670 )  2  P( X  1330 )  2   (
a)
1330  1500
)  2   ( 1,7 )  2  0,0446  0,0892
100
Met de GR wordt het: 2 . Normalcdf (-1000 , 1330 , 1500 , 100) = 2 . 0,0446 = 0,0891
b) Het zojuist berekende percentage ligt nog boven de grens van 5 %. Dan wordt de nulhypothese niet verworpen.
c) Het gegeven aantal zonne-uren ligt 251 uren hoger dan hetgeen je kon verwachten. De vraag is nu of dit
significant veel hoger is, of dat het een vrij normaal verschijnsel genoemd moet worden. Reken daarom de kans
uit dat je minstens 251 onder of boven het te verwachten aantal van 1500 uren komt. Je krijgt de volgende
berekening:
P( X  1249  X  1751 )  2  P( X  1249 )  2  (
1249  1500
)  2  ( 2,51 )  2  0,0060  0,012
100
Omdat je nu onder de 5 % zit is het gerechtvaardigd om de nulhypothese te verwerpen. Met andere woorden:
er lijkt een verandering in het aantal zonne-uren te zijn opgetreden.
Met de GR: P = 2 . normalcdf (-1000 , 1249 , 1500 , 100) = 2 . 0,0060 = 0,0121
d) Hij verwerpt de nulhypothese zodra hij onder de grens  komt te zitten. Door die grens kleiner te nemen kan
hij het te snel verwerpen van de nulhypothese voorkomen. Hij zal dit bijv. doen als hij heel erg zeker van zijn
bewering wil zijn.
In de praktijk werkt men vaak met drempels van 5 % of 2,5 % of 1%.
Maar alles hangt af van de vraag hoe zeker men van zijn zaak wil zijn voordat men de H 0 prijsgeeft.
Som 5
a) Bepaal de kans op een afwijking van minstens 73 mm. Je krijgt:
P( X  727  X  873 )  2   (
727  800
)  2   ( 1,46 )  2  0,0721  0,1442
50
Je zit boven de 5 % en dus wordt H0 verworpen: het neerslagpatroon is met minstens 95 % zekerheid
veranderd.
Met de Gr: 2 . normalcdf (-1000 , 727 , 800 , 50) = 2 . 0,0721 = 0,1443
2  P( X  712 )  2   (
b)
712  800
)  2   ( 1,76 )  2  0,0392  0,0784
50
Met de GR: 2 . normalcdf (-1000 , 712 , 800 , 50) = 2 . 0,0392 = 0,0784
Je zit nog steeds boven de 5 % en dus blijf je nog steeds van mening dat er geen wijziging in de neerslag is
aangetoond.
Maar vergeleken met de a-vraag zit je wel dichter bij de grens van 5 % en dus ben je ook dichter bij verwerpen
van de nulhypothese. De logische vraag is nu dan ook: vanaf welke grens ga je H 0 nu wel verwerp daarvoor
vraag c.
c) De meteoroloog trekt aan beide kanten van het getal 800 een grens. De grenzen worden in het algemeen op
gelijke afstanden van het verwachte gemiddelde genomen. Laten we de linkergrens a noemen en de
rechtergrens b.
De nulhypothese gaat verworpen worden zodra X  a of X  b . Als we a gevonden hebben, dan is b ook
bekend.
We bepalen het grensgetal a door te bepalen wanneer geldt dat P( X  a) = 0,025
Als je met de tabel werkt wordt het nu:
(
a  800
)  0,025   ( 1,96 )
50

a  800  50  1,96  702
De rechtergrens b ligt dan bij 898 (vanwege het feit dat a en b even ver van 800 worden gekozen) .
De conclusie wordt nu: als de neerslag minder is dan 702 mm of meer dan 898 mm dan kan de meteoroloog
met minstens 95 % zekerheid aannemen dat het neerslagpatroon veranderd is.
Als je met de GR werkt, dan gaat het als volgt: voer in je functiescherm normalcdf(-1000 , X , 800 , 50) in en
genereer nu een tabel. Met “tablesetup” kies je een redelijk startpunt en vervolgens kun je dan zien dat er bij
702 de kans 0,025 staat.
Overigens: als je in tablesetup de Auto-functie op Ask zet hoef je niet de hele tabel te laten maken.
Nu de grenzen a en b bekend zijn kun je trouwens de antwoorden op de eerste twee vragen in een keer geven!
Som 6
a) Het gecursiveerde stukje ten onrechte betekent: er is in feite helemaal niets aan de hand, maar omdat de
meteoroloog toevallig een meting doet die nogal onder of boven het gemiddelde van 21,1 0 C ligt, gaat hij
denken dat er wél iets aan de hand is. Hij trekt dus een onjuiste conclusie! Deze kans op een onjuiste beslissing
wil hij juist beperken tot maximaal 5 %.
b) Als hij de onbetrouwbaarheidsdrempel laag gaat kiezen, bijv. 1 % , dan kan het zijn dat hij bij sterk van de 21,1 0
C afwijkende metingen toch moet gaan beweren dat er helemaal niets aan de hand is. En ook dat is dan
misschien een onjuiste conclusie. In deze twee vragen kun je zien dat je altijd een zeker risico zal lopen om een
foute conclusie te trekken; absolute zekerheid is gewoon niet te verkrijgen.
c) Met slechts 1 meting is een veilige conclusie niet te trekken. Pas met metingen over een langere periode zou je
meer zekerheid kunnen verwachten. Maar zelfs dan kan er toeval in het spel zijn!
Som 7
a) Men gaat er van uit dat er sprake is van een zwavelpercentage van 4,5 % en men moet dus bij een meting van
4,2 % kijken of men die aanname wel of niet wil handhaven. Maar misschien is het wel olie van een heel ander
zwavelgehalte!
b) Volgens de zogenaamde
n
-wet wordt de spreiding nu
0,2
4

0,2
 0,1
2
Som 8
2  P( X  4,2 )  2   (
a)
4,2  4,5
)  2   ( 3 )  2  0,0013  0,0026
0,1
Met de GR: 2 . normalcdf (-1000 , 4.2 , 4.5 , 0,1) = 2 . 0,0013 = 0,0027
b) De zojuist berekende kans is ruim minder dan de opgegeven drempel van 1 % en dus wordt H 0 nu wel
verworpen.
Dit sluit natuurlijk goed aan bij de intuïtie: hoe meer metingen, hoe betrouwbaarder de uitslag.
Som 9
a) De spreiding wordt weer gehalveerd, want er zijn 4 metingen verricht. Zodoende krijg je nu:
2  P( X  1420 )  2   (
1420  1500
)  2   ( 1,6 )  2  0,0548  0,1096.
50
Omdat dit meer is dan 5 % , wordt de nulhypothese niet verworpen.
b) Bepaal de linkergrenswaarde a als volgt:
2 (
a  1500
a  1500
)  0,05   (
)  0,025   ( 1,96 )  a  1402 uur.
50
50
De rechtergrenswaarde b is dan 1598 uur.
Dus: bij gemiddelde meetresultaten onder de 1402 uur of boven de 1598 uur verwerpen we de
nulhypothese.
Met de GR als volgt: tik als functie in normalcdf (-1000 , X , 1500 , 50) en genereer een tabel. Je vindt precies
dezelfde grensgetallen.
c) Verander in bovenstaande berekening het getal 0,05 in 0,01. Je krijgt:
(
a  1500
)  0,005   ( 2,575 )
50
Dit levert een linkergrens op van 1371,25 uur en dus een rechtergrens 1628,75 uur.
Deze grenzen liggen dus verder van 1500 af dan in de vorige vraag. Dat is niet vreemd, want als je maar een
klein risico wilt lopen op een onjuiste conclusie, dan moet je de nulhypothese wat langer steunen.
Som10
a) Ook al is volgens het handboek het gemiddelde minder dan 4,5 %, dan sluit dat nog niet uit dat er eens een
keertje een meting plaatsvindt die een hoger gehalte oplevert.
b) Het gemiddelde van de 9 metingen bedraagt 4,3333 % en de spreiding wordt 3 keer zo klein, d.w.z. 0,0667 %
P( X  4,3333 )   (
4,3333  4,5
)   ( 2,5 )  0,0062
0,0667
Omdat dit minder is dan de drempel van 1 % verwerpt men de nulhypothese. In gewoon nederlands: met een
zekerheid van minstens 99 % mag je aannemen dat, op grond van de 9 steekproeven, is aangetoond dat het
zwavelgehalte inderdaad minder bedraagt dan 4,5 %.
Som 11
a) De fabrikant garandeert een gemiddelde van 400 meter met een spreiding van 24 = 4 meter
b) De veeboer denkt dat er te weinig op de rollen zit, dus zijn de hypotheses: H 0:  = 400 tegen H1:  < 400
P( X  393 )   (
393  400
)   ( 1,75 )  0,0401
4
(het getal 393 zit ‘m in het feit dat de tekst zegt dat hij 1 meter te kort kwam en 394 meter nodig had!)
Dit is kleiner dan de gestelde drempel, dus H0 wordt verworpen. De boer heeft met minstens 95 % zekerheid
gelijk als hij zegt dat de geleverde lengte niet klopt met de beloftes.
c) Nu werd gekeken naar de geleverde totaallengte; misschien is het eerlijker om te kijken naar het gemiddelde
per rol.
Som 12
In de steekproef van 20 pakken is de standaardafwijking gelijk aan
0,02
20
P( X  3,489 )   (
 0,0045
3,489  3,5
)   ( 2,50 )  0,0062  
0,0045
De bewering van de fabrikant mag verworpen worden.
Som 13
a) Als we uitgaan van een grote productie, dan kun je bij een steekproef van slechts 10 stuks de kans op een
ondeugdelijk exemplaar steeds op 0,09 houden. Je doet daarbij dus alsof je het getrokken exemplaar steeds
teruglegt. Dan geldt:
E( A )    n  p  10  0,09  0,9
E( A )  0,9
en
en   npq  10  0,09  0,91  0,9050
( A ) 
0,9050
8
 0,3200
b)
c) Het gaat om een zgn. tweezijdige toets, met de hypothesen H0:  = 0,9 tegenover H1:   0,9
Markeer nu weer twee grenzen a en b rond het verwachte gemiddelde 0,9 zodanig dat geldt
P( A  a )   (
a  0,9
)  0,005   ( 2,575 ) 
0,3200
a  0,076
De rechtergrens is dan gelijk aan 1,724.
De conclusie luidt: als, na de 8 steekproeven, er gemiddeld minder dan 0,076 of meer dan 1,724 ondeugdelijke
exemplaren per steekproef worden aangetroffen, dan wordt de nulhypothese verworpen. Anders gezegd: dan
haalt men de doelstelling (9 % ondeugdelijk) en moet de machine worden bijgesteld.
Som 14
a) Snelste methode: typ in je functiescherm de functie Binompdf(8 , 0.25 , X) in en genereer een tabel.
b)
P( X  5 )  1  P( X  4 )  1  Binomcdf ( 8 , 0.25 , 4 )  1  0,9727  0,0273  0,05
De nulhypothese kan hij verwerpen: er zijn wel erg veel witte muizen geboren om te blijven geloven dat p =
0,25
Som 15
a) De omvang van het experiment is wel erg klein om veilige conclusies te trekken.
b) De steekproefomvang opvoeren of over een langere periode waarnemingen doen.
Som 16
a) De voorzitter beweert weliswaar dat er minstens 40 % achter zijn partij staat, maar dan kan hij zijn mening ook
al bevestigd krijgen als er in een steekproef (ongeveer) 40 % aanhangers te vinden zijn. X is het aantal
aanhangers.
b)
P( X  35 )  binomcdf ( 100 , 0.40 , 35 )  0,1795  
De nulhypothese wordt niet verworpen: 35 van de 100 aanhangers is genoeg om de voorzitter gelijk te geven.
Som 17
a) De twee hypothesen zijn duidelijk: H0: p = 0,5
De overschrijdingskans is nu:
tegen
H1: p > 0,5
P( X  8 )  1  P( X  7 )  1  Binomcdf ( 10 ,0.5 ,7 )  1  0,9453  0,0547
Omdat je nog net boven de drempel zit is er geen reden om de nulhypothese te verwerpen; ondanks dat hij 8
van de 10 keer goed voorspeld (of geraden ?) heeft, zijn we niet met minstens 95 % zekerheid van zijn talenten
overtuigd.
b) Ga uit van een aantal van n glazen. Hoogstens 1 keer fout betekent minstens ( n - 1) keer goed.
De overschrijdingskans wordt nu
P( X  n  1| n  n ; p  0,5 )  1  P( X  ( n  1 )  1 )  1  P( X  n  2 )
Dit laatste moet nu minder dan 5 % blijven, hetgeen betekent dat
P( X  n  2 )  0,95 moet zijn.
Kijk nu in de tabel bij verschillende waarden van n waarvoor dit laatste geldt. Als je bijv. bij n = 13 kijkt, ga dan
na of
P(X  11) nog boven de 0,95 zit. Dit blijkt inderdaad het geval te zijn.
Als je bijv. n = 6 probeert, dan moet je nagaan of P(X  4) nog boven de 0,95 zit. Dit blijkt niet het geval te zijn.
Op deze manier werkend ontdek je dat het geldt voor alle waarden n die minstens gelijk aan 8 zijn.
Handiger (maar je moet er maar opkomen!) gaat het door het probleem te bekijken vanuit de situatie dat de
wijnkenner een verkeerde keuze maakt. Hij beweert namelijk dat die kans minder dan 50 % bedraagt, en hij
mag maximaal 1 keer fout zitten. Onder de hypothesen H0: p = 0,5 en H1: p < 0,5 krijg je nu: P(X  1| n = ? ) <
0,05 en ook dan wijst de tabel meteen n = 8 als laagste waarde aan waarvoor dit geldt.
Som 18
a) De figuur in het boek laat zien dat de verdeling bepaald niet symmetrisch is.
b) Je moet de opgegeven drempelwaarde nu halveren (vanwege het tweezijdige karakter van de toets) en krijgt
dan:
P( X  5 | n  8; p  0,25 )  1  P( X  4 )  1  0,9727  0,0273  0,025
De nulhypothese wordt nu dus nog niet verworpen, terwijl dit bij de eenzijdige toets van opgave 14 wel het geval
was!
Moraal: door een andere toetsvorm te kiezen kan de conclusie dus ook anders worden.
Som 19
a) Voer in je functiescherm de functie Binompdf (7 , 0.75 , X ) in en genereer een tabel, of raadpleeg het
tabellenboekje.
Het is een binomiale verdeling, dus reken je in feite steeds het volgende uit:
7  3
1
P( X  k )     ( )k  ( )7  k waarbij je voor k alle gehele waarden van 0 tot en met 7 moet invullen.
4
k  4
b) Volgens de formule voor de verwachtingswaarde van de binomiale verdeling geldt
E( X )  n  p  7 
3
1
5
4
4
c) De hypothesen zijn H0: p = 0,75 tegen
H1: p  0,75 (en dus is het een tweezijdige toets!)
1
P( X  3 )  0,0706   De nulhypothese hoeft niet verworpen te worden.
2
d) Bij 3 grijze muizen kan de nulhypothese nog niet verworpen worden, maar bij slechts twee of minder
exemplaren wel want P( X  2) = 0,0129 en dit zit wel onder de helft van de drempelwaarde.
e) De grens zakt nu naar 1 grijze muis, want P(X  2) = 0,0129 > 0,005 en P( X  1) = 0,0014 < 0,005
Som 20
a) De 4 paren waar de klant de paren even mooi vindt worden genegeerd. Er is dan sprake van 16 ruikers.
De hypothesen zijn nu: H0: p = 0,5 tegen H1: p > 0,5 (namelijk: even mooi met stuiver of mooier met
stuiver)
De overschrijdingskans wordt nu:
P( X  12 | n  16; p  0,5 )  1  P( X  11 )  1  0,9616  0,0384  
De conclusie moet luiden: een stuiver in het water doet positief werk!
b) Dezelfde berekening, alleen nu is n gelijk aan 17 (je negeert nu 3 paren ruikers). Je vindt nu als
overschrijdingskans
P( X  12 | n  17; p  0,5 )  1  P( X  11 )  1  0,9283  0,0717  
Deze klant moet de nulhypothese dus aanvaarden: een stuiver in het water doen is zinloos.
c) De bloemist wilde aantonen dat de volkswijsheid onzin is. De alternatieve hypothese was dan ook H 1: p > 0,5.
Hij vroeg aan de klanten om de mooiste helft aan te wijzen. Als dat maar 41 keer gebeurt, dan moet hij dat niet
ineens uitleggen als een indicatie dat p dús kleiner dan 0,5 is. Hij mag dus niet het uitgangspunt van de
veronderstelling aanpassen aan het resultaat van de steekproef.
Som 21
a) Neem als functie Binompdf ( 18 ,0.5 , X ) en genereer een tabel of raadpleeg de tabel.
b) X stelt het aantal plusjes voor.
c)
P( X  12 | n  18; p  0,5 )  1  P( X  11 )  1  0,8811  0,1189  
De nulhypothese kan niet verworpen worden: grijze muizen groeien niet sneller (en dat is voor minstens 95 %
zeker)
Som 22
Als de cijfers in het tweede tijdvak echt beter zijn, dan zal het verschil tussen het tweede cijfer en het eerste cijfer
vaak positief zijn. Trek daarom steeds het bovenste getal uit de tabel af van het onderste getal en noteer of het
resultaat positief, negatief of neutraal is. Je vindt: 12 plusjes, 5 minnetjes en 3 keer nul. Verwaarloos nu verder die
3 keren neutraal.
P( X  12 | n  17; p  0,5 )  1  P( X  11 )  1  0,9283  0,0717  
De nulhypothese wordt niet verworpen: in het tweede tijdvak wordt niet significant beter gescoord dan in het eerste
tijdvak.
Som 23
a) Er wordt een positief effect verwacht, dus bekijk je het verschil tussen “met” en “zonder”. Eventuele nullen
negeer je verder. Je krijgt dan: 10 plussen en 2 minnen. Zo’n groot aantal plussen pleit natuurlijk al sterk voor
de gedachte dat de bemesting positieve effecten heeft.
Je krijgt nu:
P( X  10 | n  12; p  0,5 )  1  P( X  9 )  1  0,9807  0,0193  
Verbazend misschien, maar de nulhypothese kan toch nog niet verworpen worden!
b) In de vorige vraag werd alleen gekeken of het verschil positief of negatief werd, maar de grootte van het verschil
werd buiten beschouwing gelaten. Als je naar de verschillen kijkt, dan krijg je de volgende serie getallen:
5 , -2 , 2 , 3 , 4 , 5 , 3 , -3 , 5 , 2 , 1 , 8
c) Als het middel echt iets doet, dan moeten er bij de vorige serie getallen veel positieve waarden zitten. Daarom
is het tweetal hypotheses nu: H0:  = 0 tegenover H1:  > 0 (zie ook het stukje tekst vlak boven vraag b!)
Het gemiddelde van de 12 gemeten verschillen bedraagt 33/12 = 2,75
De 12 gemeten waarden vormen een steekproef en dus wordt de standaardafwijking nu
3
12
 0,8660
De overschrijdingskans bedraagt nu:
P( X  2,75 )  1   (
2,75  0
)  1   ( 3,18 )  1  0,9993  0,0007  
0,8660
Nu is er dus wel aanleiding om de nulhypothese te verwerpen.
De opgaven 24 t/m 27 behandelen een techniek die in de tijd van het werken met de tabel nodig was. De reden is
dat een tabel maar een beperkt aantal waarden bood. De TI83 heeft daar echter geen beperkingen in, zodat je
deze sommen gewoon kunt maken zonder de gevraagde normale benaderingen te geven. Alleen opgave 24 wordt
bij wijze van demonstratie op deze manier gedaan.
Som 24
a) Tabelboeken vermelden de waarde 60 niet.
b) De formule op blz. 46 zou je dwingen om in totaal 20 kansen te berekenen en vervolgens alles op te tellen.
c) Als n groot is wordt het binomiale histogram steeds regelmatiger (“normaler”) van vorm.
d) Het rode gebied stopt bij de waarde 20,5. Gemiddelde is 60 . 0,4 = 24 en
  npq  60  0,4  0,6  3,79
P  (
e)
20,5  24
)   ( 0,92 )  0,1788
3,79
Als je intikt Binomcdf(60 , 0.4 , 20) krijg je 0,1786. Je ziet dus dat de benadering vrij goed is.
Som 25
a) 1 - P(X  29) = 1 - binomcdf(60 , 0.4 , 29) = 1 - 0,9254 = 0,0746
b) binomcdf(80 , 0.3 , 35) = 0,9968
binomcdf(80 , 0.3 , 31) = 0,9640
1 - binomcdf(120 , 0.6 , 69) = 1 - 0,3190 = 0,6810
1 - binomcdf(120 , 0.6 , 73) = 1 - 0,6078 = 0,3922
binomPdf(50 , 0.42 , 17) = 0,0605
binomcdf(50 , 0.42 , 27) - binomcdf(50 , 0.42 , 25) = 0,9680 - 0,9008 = 0,0672
 50 
17
33
   0,42  0,58  0,0605
17 
c) 
respectievelijk
 50 
 50 
26
24
27
23
   0,42  0,58     0,42  0,58  0,0409  0,0263  0,0672
26
27
 
 
Som 26
a) H0: p = 0,5 tegen H1: p > 0,5
b) P(X  19) = 1 - P(X  18) = 1 - binomcdf(30 , 0.5 , 18) = 1 - 0,8998 = 0,1002 > 0,05
De nulhypothese hoeft niet verworpen te worden.
Som 27
a) De kroonkurk kun je beter niet als munt gebruiken als het aantal keren kop te groot of juist te klein is. Dan is er
dus sprake van een tweezijdige toets. Vandaar toetsen we: H0: p = 0,5 tegen H1: p  0,5
P(X  43) = 1 - P(X  42) = 1 - binomcdf(75 , 0.5 , 42) = 1 - 0,8760 = 0,1240 > 0,025
Er is geen reden de nulhypothese te verwerpen.
b) We zouden (als de kansen fifty-fifty zijn) mogen rekenen op ongeveer 37 keren “kop”.
Als je hier vrij veel onder blijft lijkt er iets mis te zijn. Kies daarom een grensgetal g en verwerp de nulhypothese
zodra
X  g blijkt te zijn.
Uit P(X  g | n = 75 ; p = 0,5 )  0,025 levert via de GR op dat g  28 moet zijn.
Dit gaat als volgt: tik als functie in binomcdf(75 , 0.5 , X) en zet in Tablesetup de op een na laatste regel op
Ask. Genereer nu een tabel en probeer een paar waarden in de buurt van 30.
Het antwoord luidt nu: als het aantal keren “kop” hoogstens 28 of minstens 47 bedraagt, dan wordt de
nulhypothese verworpen (het gemiddelde van de twee grensgetallen moet natuurlijk 37,5 zijn!)
Download