Samenvatting Populatie: alle objecten of personen waar het

advertisement
Samenvatting
Populatie: alle objecten of personen waar het onderzoek op van toepassing is. Het aantal elementen
wordt genoteerd met een N
Steekproef: een gedeelte van de populatie. Het aantal elementen wordt genoteerd met een n
Hoe groter de steekproef hoe nauwkeuriger de indruk is
Schaal: een logische weergave van de antwoordmogelijkheden
Meetniveau: het type schaal
We laten deze vier meetniveaus de revue passeren namelijk:
1. Nominaal meetniveau: verschillende antwoordmogelijkheden zonder logische volgorde
2. Ordinaal meetniveau: er is zowel sprake van verschillende antwoorden als een logische
volgorde
3. Interval meetniveau: sprake van een logische volgorde. Daarnaast hebben de verschillen
tussen de antwoorden een eenduidige betekenis. Ontbreekt hier aan een natuurlijk nulpunt.
4. Ratio meetniveau: heeft naast de kenmerken van het intervalmeetniveau een eenduidige
betekenis voor de verhouding tussen de twee getalen. Er is hier sprake van een natuurlijk
nulpunt
Als je de antwoorden op een vragenlijst in een computerbestand hebt gezet, noem je elke vraag een
variabele. Variabelen kunnen kwantitatief of kwalitatief zijn.
Kwantitatieve variabele: Hebben te maken met getallen
Kwalitatieve variabele: kijk je naar kenmerken die weergegeven worden door getallen, zoals het
geslacht
Bij nominaal en ordinaal meetniveau maken we een tabel waar bij ieder antwoord het aantal en het
percentage vermeld word. Bij een interval- of ratio meetniveau maken we eerst klassen; daarna
vermelden we bij iedere klasse het aantal en het percentage.
Staafdiagram: kun je bij een nominaal en ordinaal meetniveau maken .
Cirkeldiagram: Kun je bij een nominaal en ordinaal meetniveau maken.
Histogram: maak je bij een interval en ratio meetniveau. Er zijn vaak niet even brede klassen. Het
gevolg is echter dat vergelijking van de klassen niet helemaal eerlijk is. Dit probleem wordt opgelost
met de zogenaamde frequentiedichtheid. Deze kan als volgt berekend worden:
Kies een geschikte eenheid van klassenbreedte. Vaak is dit de kleinste klassenbreedte
Bepaal van alle klassenbreedtes de verhouding tot de eenheid van klassenbreedte
Deel alle frequenties door de verhouding
Modale klasse: de klasse met de grootste frequentiedichtheid
Frequentiepolygoon: je neemt daarvoor het midden van ieder blok uit het histogram en deze
verbind je met elkaar. Aan de uiteinden neem je een fictief klassenmidden en rek je een gestippelde
lijn. Als de grafiek zoals hier bij de oorsprong begint, trek je een stippellijn vanuit de oorsprong naar
het eerste klassemidden.
Relatief cumulatief frequentiepolygoon, deze figuur wordt als vervolg getekend:
Je begint bij de oorsprong 0
Daarna verbind je 0 ter hoogte van het gecumuleerde percentage van de eerste klasse bij de
rechtergrens van de klasse in het histogram
Zo ga je door met verbinden van rechtergrens tot rechtergrens
Als je bij 100% trek je een horizontale lijn
Centrummaat: en getal dat iets zegt over het centrum van verzamelde getallen
Modus: De waarde die het meeste voorkomt in een rij getallen
Bimodaal: niet een maar twee modussen
Mediaan: de middelste waarde na rangschikking van klein naar groot. Als je 4 getallen hebt neem je
van de 2 middelste het gemiddelde
We onderscheiden twee soorten gemiddelden:
Steekproefgemiddelde: wordt berekend door alle gevonden waarden in de steekproef op te
tellen en te delen door n= het aantel elementel in de steekproef.
Populatiegemiddelde: wordt berekend door alle gevonden waarden in de populatie op te
tellen en te delen door N=aantal elementen in de populatie
Wel kunnen we een goede benadering vinden van het gemiddelde met behulp van de
klassenmiddens:
Bepaal van iedere klasse het klassenmidden
Vermenigvuldig het klassenmidden met het aantal van deze klasse
Tel de uitkomsten hiervan op: we hebben een benadering van de som van de uitkomsten!!
Deel door het aantal waarnemingen
Het gemiddelde wat we net hebben uitgerekend noemen we het gewogen gemiddelde.
Spreidingsmaat: Een getal dat iets zegt over de spreiding van een aantal getallen
We onderscheiden twee spreidingsmaten namelijk:
Spreidingsbreedte:De hoogste waarde minus de laagst waarde(dit wordt ook wel range
genoemd. Deze wordt gebruikt om snel een eerste indruk te krijgen van de spreiding van een
rij getallen. Helaas is de spreidingsbreedte niet optimaal omdat niet alle gegevens gebruikt
worden
Standdaarddeviatie: er zijn twee standdaarddeviaties namelijk:
Steekproefstanddaarddeviatie: wordt als volgd berekend:
Bereken het proefgemiddelde
Bepaal het verschil tussen alle getallen en het steekproefgemiddelde
Kwadrateer deze verschillen
Tel al deze kwadraten op
Deel door het aantal elementen minus 1
Neem tot slot de wortel
Populatiestanddaarddeviatie: bereken je als je alle gegevens van een kenmerk in de
populatie hebt.
Het verschil tussen populatiegemiddelde en steekproefgemiddelde geld hier ook bij.
Belangrijkst verschillen met de formule van de steekproefstanddaarddeviatie zijn:
We gebruiken in de formule het populatiegemiddelde
We delen niet door n -1 = het aantal steekproefgetallen minus 1, maar door het N= aantal
populatiegetallen
De volgende vuistregels zijn in het algemeen van toepassing bij grote aantallen gegevens:
68% van de gegevens zit in tussen het gemiddelde en plus of min de standaarddeviatie
95% van de gegevens zit in tussen het gemiddelde en plus of min tweemaal de
standdaarddeviatie
De populatiestanddaarddeviatie en de steekproefstanddaarddeviatie zijn te bepalen op basis van
alleen een frequentieverdeling.
Samenvatting hfst 1 WB
Regel 1
Bij optellen en aftrekken begin je vooraan de berekening en verwerk je term voor term
Regel 2
+ maal + is +
+ maal – is –
- maal + is –
- maal – is –
Regel 3
+ gedeeld door + is +
- gedeeld door + is –
+ gedeeld door – is –
- gedeeld door – is –
Regel 4
1. Eerst haakjes wegwerken(machtsverheffen gaat voor
2. Dan vermenigvuldigen of delen
3. Dan optellen of aftrekken
Regel 5
Als je twee breuken hebt en de noemers zijn gelijk, dan mag je de tellers bij elkaar optellen
Regel 6
Bij het optellen van breuken maak je de noemers gelijknamig. Daarna mag je de tellers optellen en de
noemer laten staan (noemer is de onderste)
Regel 7
Delen door een breuk is vermenigvuldigen met het omgekeerde
Regel 8
x n  x.x...x
X =grondtal
N= exponent
Regel 9
x n .x m  x n  m
Regel 10
n
x
 x nm
m
x
Als de grondgetallen gelijk zijn , dan mag je bij deling de exponenten van elkaar afhalen
Regel 11
( x n ) m  x n. m
Bij het verheffen van een macht tot een macht, mag je de exponenten met elkaar vermenigvuldigen
Regel 12
x n 
1
xn
De – in de exponent betekent dat je moet delen
Regel 13
x0  1
Een getal tot de macht 0 is gelijk aan 1
Regel 14
De onevenmachtswortel over een negatief getal levert een negatief getal op, de evenmachtswortel
over een negatief getal kan niet
Regel 15
1
n
x 
n
x
Regel 16
Als x^n = y dan geldt n = log y / log x
Regel 17
Bij terugrekenen met procenten moet je delen door de groeifactor
Samenvatting hft 2 SB
Lineaire regressie
De eerste stap is het maken van een spreidingsdiagram.
Aandachtspunt bij het maken van de spreidingsdiagram zijn het bepalen van de:
- Afhankelijke variabele Y
- Onafhankelijke variabele X
Als alle punten zich in een hoek van de grafiek zich bevinden kun je gebruik maken van een
‘scheurlijntje’(onderbreking in de x-as of y-as)
Formule lineair(rechtlijnig) verband:
Y = a + bX
Waarbij:
a = constante
b = richtingscoëfficiënt
Op het moment dat we een lineair verband opstellen tussen omzet en investeringskosten op basis
van deze grote hoeveelheid gegevens, verkrijgen we het volgende lineaire model:
Y = α + βX +Ɛ
Waarbij:
a = de populatieconstante
β = de populatierichtingscoëfficiënt
Ɛ = storingsterm
De storingsterm is het verschil tussen het meetgegeven en de lijn( kan alleen als je A en β weet)
Regressievergelijking:
Ŷ = a + bX
Het dakje geeft aan dat we met het lineaire verband schattingen van Y kunnen geven door een X
waarde in te vullen
De beste methode om een lijn door de meetgegevens te trekken is met behulp van de kleinste
kwadratenmethode, zorgt ervoor dat de afwijking tussen lijn en stip zo klein mogelijk is.
Met deze methode vinden we de volgende twee formules voor a en b:
A = ȳ -bẊ
Bij het bepalen van de kwaliteit van het lineaire verband berekenen we de correlatiecoëfficiënt.
r= de notatie van de (steekproef) correlatiecoëfficiënt
r = -1
r=0
r = -1
perfect dalend lineair verband
geen lineair verband
perfect stijgend lineair verband
Samenvatting hfst 2 WB
Regels lineair verband:
Lineair is een rechte lijn
Regel 1
De algemene gedaante van een lineair verband luidt y=ax+b
a = richtingscoëfficiënt
b= constante
Regel 2
Bij een snijpunt met de y-as is x =0
Bij een snijpunt met de x-as is y =0
Regel 3
De definitie van de richtingscoëfficiënt is a =
a> 0 dan is het lineair verband stijgend
b> a<0 is het lineair verband dalendt
a= 0 is er sprake van een constante
Regel 4
> betekent groter dan
≥ betekent groter dan of gelijk aan
< betekent kleiner dan
≤ betekent kleiner dan of gelijk aan
Regel 5
Bij een ongelijkheid klapt het teken om als er gedeelt wordt door een negatief getal
delen door een positief getal bij een ongelijkheid laat het ongelijkheidsteken ongemoeid
delen door een negatief getal bij een ongelijkheid laat het ongelijkheidsteken omdraaien
Regel 6
De algemene gedaand y=ax+b noemen we de expliciete gedaante van een lineair verband
De algemen gedaante ax+by=c noemen we de impliciete gedaante van een lineair verband
Stappenplan:Oplossen van het probleem in de case
- vertaal de tekst in een wiskundige notatie
- bepaal de afhankelijke en onafhankelijke variabele
- stel de lineaire verbanden van vraag en aanbod op
- bepaal het aanbodverschot en de financiele consequentie
- teken de lineaire verbanden in 1 grafiek
notatie:
p staat voor prijs
q staat voor afzet
Prijs is onafhankelijke variabele
Vraag en aanbod zijn afhankelijke variabelen
Samenvating hfst 4 WB
Regel 1
De slotwaarde van een bedrag X na n jaren met een jaarrente i is:
X .(1  i ) n
Waarin:
i = groeipercentage
1+i = groeifactor
Regel 2
De constante waarde van een bedrag X gerekend over n jaar geleden met een jaarrente i is
X
(1  i) n
Regel 3
Uitgaande van een jaarrente i vind je de maandrente als volgt
12
1  i 1
Regel 4
Looptijd berekenen:
N= log sw/log cd
Log (1+i)
Waarin:
CW = contante waarde
SW = slotwaarde
i = rente
Regel 5
De som van de slotwaarden van n periodieke stortingen verricht aan het einde van iedere periode
tegen een intrest i is gelijk aan:
(1  i ) n  1
X.
i
X is de periodieke storting
Regel 6
De som van de slotwaarden van n periodieke stortingen verricht aan het begin van iedere periode
tegen een intrest i is gelijk aan:
(1  i) n  1
X .(1  i).
i
X is de periodieke storting
Regel 7
De som van de contante waarden van n periodieke betalingen verricht aan het einde van iedere
periode tegen een intrest i is gelijk aan:
1  (1  i)  n
X.
i
X is de periodieke betaling
Regel 8
De som van de contante waarden van n periodieke betalingen verricht aan het begin van iedere
period tegen een intrest i is gelijk aan:
X is de periodieke betaling
Statistiek in Business hfst 4 kansberekening
Kans: een getal tussen de 0 en de 1.Dit drukken we meestal uit in een percentage. 1 is gelijk aan
100% en 0 is 0%. De notatie van een kans is de letter P. De kan om een 6 te gooien met een
dobbelsteen wordt genoteerd met P(6). De P is afkomstig uit het Frans van het woord probabilite.
Er zijn drie kans definities waarmee we dit zouden kunnen doen:
1. De kans definitie van Laplace
2. De relatieve frequentie
3. De subjectieve frequentie
Kans definitie van Laplace: Het aantal uitkomsten waarin je geinterresseerd bent gedeeld door het
totaal aantal mogelijke uitkomsten van een kansexperiment.
De formule die hier bij hoort is: N(A)/N
Waarbij:
- A=uitkomsten van het kansexperiment(gebeurtenis) waar je geinterresseerd bent
- N(A)= het aantal uitkomsten waar je geinterresseerd in bent
- N= het totaal aan uitkomsten
Relatieve frequentie: Te bepalen door het kansexperiment te herhalen en vervolgens te kijken hoe
vaak de uitkomst die je interesseert, zich voordoet ten opzichte van het totaal aantal herhaalde
kansexperiment
De formule die hier bij hoor is: P(A)= n(A)/ n
Waarbij:
- n(A)= het aantal uitkomsten waar je geinteresseerd in bent bij herhaling
- n= het aantal herhalingen van het kansexperiment
De relatieve frequentie wordt ook wel zweetkans genoemd, omdat je moet werken om hem te
bepalen
Subjectieve kans: Een inschatting van een kans door een persoon
Algemene somregel: P(A of B)= P(A) + P(B) – P(A en B)
Toelichting:
- A en B zijn twee gebeurtenissen waarin men geinteresseerd is
- In plaats van de woordjes `of` en `en` moeten eigenlijk de wiskundige tekens U gebruikt
worden. Om de lezer niet te vermoeien met deze notatie hebben we bewust gekozen voor
deze woorden. Let op: het teken U betekens dat minimaal een gebeurtenis zich voordoet bij
een kansexperiment, maar het kunnen ook alle twee de gebeurtenissen zijn ( het is dus
eigenlijk en/of)
- Als we de regel hardop lezen, dan zeggen we: de kans op A of B is gelijk aan de kans op A
plus de kans op B minus de kans op A en B
Speciale somregel: P(A of B)= P(A) + P(B), waarbij A en B niets gemeenschappelijks hebben
Voorwaardelijke kans: Kans op een bepaalde uitkomst als je al gedeeltelijke informatie hebt over de
uitkomst van een kansexperiment
De notatie van een voorwaardelijke kans luidt:
P (B|A)= P(A en B)/P(A)
| betekend gegeven dat
Uit de definitie van de voorwaardelijke kans volgt de algemene productregel
Speciale productregel: P(A en B)= P(A)*P(B), mits A en B onafhankelijk zijn
Complementregel: P(A) =1= P(complement van A)
Permutaties:Het aantal manieren waarop je een aantal verschillende objecten ten opzichte van
elkaar neer kunt zetten.
In het algemeen geldt dat het aantal permutaties van n objecten wordt weergegeven als n!= n*(n1)…*1
De n met het uitroepteken spreek je uit als een n` faculteit. Zo is 5!=5*4*3*2*1=120
Samenvatting hfst 6 SB
Voor uitgebreide uitleg zie hfst 6
Kenmerken standaardnormale verdeling:
- Typische klokvorm
- Het midden µ = 0
- De spreiding Ơ = 1
- De oppervlakten zijn getabelleerd zodat kansen bij deze verdeling te bepalen zijn
Samenvatting normale verdeling:
We zien dat we eerst het midden van alle waarden hebben afgetrokken en vervolgens gedeeld
hebben door de standaarddeviatie. Noemen we de standaardnormale verdeling ẕ en een algemene
normale verdeling x dan berekenen we kansen in de algemene normale verdeling door gebruik te
maken van de volgende transformatie:
z
x

De volgende vuistregels zijn in het algemeen van toepassing bij grote aantallen gegevens:
68% van de gegevens zit in tussen het gemiddelde en plus of min de standaarddeviatie
95% van de gegevens zit in tussen het gemiddelde en plus of min tweemaal de
standaarddeviatie
Deze vuistregel leveren de zogenaamde sigmagebieden
Sigmagebieden:
- Het één-sigmagebied in een normale verdeling is het gemiddelde plus of min de
standaarddeviatie en bevat 68% van de gegevens
- Het twee-sigmagebied in een normale verdeling is het gemiddelde plus of min tweemaal
de standaarddeviatie en bevat 95% van de gegevens
De kans dat je een steekproef trekt met een gemiddelde dat sterk afwijkt van het
populatiegemiddelde wordt steeds kleiner. De normale verdeling van het steekproefgemiddelde
wordt daardoor spitser.
Men noemt de term Ơ/√ de standaardfout
Download