Samenvatting Populatie: alle objecten of personen waar het onderzoek op van toepassing is. Het aantal elementen wordt genoteerd met een N Steekproef: een gedeelte van de populatie. Het aantal elementen wordt genoteerd met een n Hoe groter de steekproef hoe nauwkeuriger de indruk is Schaal: een logische weergave van de antwoordmogelijkheden Meetniveau: het type schaal We laten deze vier meetniveaus de revue passeren namelijk: 1. Nominaal meetniveau: verschillende antwoordmogelijkheden zonder logische volgorde 2. Ordinaal meetniveau: er is zowel sprake van verschillende antwoorden als een logische volgorde 3. Interval meetniveau: sprake van een logische volgorde. Daarnaast hebben de verschillen tussen de antwoorden een eenduidige betekenis. Ontbreekt hier aan een natuurlijk nulpunt. 4. Ratio meetniveau: heeft naast de kenmerken van het intervalmeetniveau een eenduidige betekenis voor de verhouding tussen de twee getalen. Er is hier sprake van een natuurlijk nulpunt Als je de antwoorden op een vragenlijst in een computerbestand hebt gezet, noem je elke vraag een variabele. Variabelen kunnen kwantitatief of kwalitatief zijn. Kwantitatieve variabele: Hebben te maken met getallen Kwalitatieve variabele: kijk je naar kenmerken die weergegeven worden door getallen, zoals het geslacht Bij nominaal en ordinaal meetniveau maken we een tabel waar bij ieder antwoord het aantal en het percentage vermeld word. Bij een interval- of ratio meetniveau maken we eerst klassen; daarna vermelden we bij iedere klasse het aantal en het percentage. Staafdiagram: kun je bij een nominaal en ordinaal meetniveau maken . Cirkeldiagram: Kun je bij een nominaal en ordinaal meetniveau maken. Histogram: maak je bij een interval en ratio meetniveau. Er zijn vaak niet even brede klassen. Het gevolg is echter dat vergelijking van de klassen niet helemaal eerlijk is. Dit probleem wordt opgelost met de zogenaamde frequentiedichtheid. Deze kan als volgt berekend worden: Kies een geschikte eenheid van klassenbreedte. Vaak is dit de kleinste klassenbreedte Bepaal van alle klassenbreedtes de verhouding tot de eenheid van klassenbreedte Deel alle frequenties door de verhouding Modale klasse: de klasse met de grootste frequentiedichtheid Frequentiepolygoon: je neemt daarvoor het midden van ieder blok uit het histogram en deze verbind je met elkaar. Aan de uiteinden neem je een fictief klassenmidden en rek je een gestippelde lijn. Als de grafiek zoals hier bij de oorsprong begint, trek je een stippellijn vanuit de oorsprong naar het eerste klassemidden. Relatief cumulatief frequentiepolygoon, deze figuur wordt als vervolg getekend: Je begint bij de oorsprong 0 Daarna verbind je 0 ter hoogte van het gecumuleerde percentage van de eerste klasse bij de rechtergrens van de klasse in het histogram Zo ga je door met verbinden van rechtergrens tot rechtergrens Als je bij 100% trek je een horizontale lijn Centrummaat: en getal dat iets zegt over het centrum van verzamelde getallen Modus: De waarde die het meeste voorkomt in een rij getallen Bimodaal: niet een maar twee modussen Mediaan: de middelste waarde na rangschikking van klein naar groot. Als je 4 getallen hebt neem je van de 2 middelste het gemiddelde We onderscheiden twee soorten gemiddelden: Steekproefgemiddelde: wordt berekend door alle gevonden waarden in de steekproef op te tellen en te delen door n= het aantel elementel in de steekproef. Populatiegemiddelde: wordt berekend door alle gevonden waarden in de populatie op te tellen en te delen door N=aantal elementen in de populatie Wel kunnen we een goede benadering vinden van het gemiddelde met behulp van de klassenmiddens: Bepaal van iedere klasse het klassenmidden Vermenigvuldig het klassenmidden met het aantal van deze klasse Tel de uitkomsten hiervan op: we hebben een benadering van de som van de uitkomsten!! Deel door het aantal waarnemingen Het gemiddelde wat we net hebben uitgerekend noemen we het gewogen gemiddelde. Spreidingsmaat: Een getal dat iets zegt over de spreiding van een aantal getallen We onderscheiden twee spreidingsmaten namelijk: Spreidingsbreedte:De hoogste waarde minus de laagst waarde(dit wordt ook wel range genoemd. Deze wordt gebruikt om snel een eerste indruk te krijgen van de spreiding van een rij getallen. Helaas is de spreidingsbreedte niet optimaal omdat niet alle gegevens gebruikt worden Standdaarddeviatie: er zijn twee standdaarddeviaties namelijk: Steekproefstanddaarddeviatie: wordt als volgd berekend: Bereken het proefgemiddelde Bepaal het verschil tussen alle getallen en het steekproefgemiddelde Kwadrateer deze verschillen Tel al deze kwadraten op Deel door het aantal elementen minus 1 Neem tot slot de wortel Populatiestanddaarddeviatie: bereken je als je alle gegevens van een kenmerk in de populatie hebt. Het verschil tussen populatiegemiddelde en steekproefgemiddelde geld hier ook bij. Belangrijkst verschillen met de formule van de steekproefstanddaarddeviatie zijn: We gebruiken in de formule het populatiegemiddelde We delen niet door n -1 = het aantal steekproefgetallen minus 1, maar door het N= aantal populatiegetallen De volgende vuistregels zijn in het algemeen van toepassing bij grote aantallen gegevens: 68% van de gegevens zit in tussen het gemiddelde en plus of min de standaarddeviatie 95% van de gegevens zit in tussen het gemiddelde en plus of min tweemaal de standdaarddeviatie De populatiestanddaarddeviatie en de steekproefstanddaarddeviatie zijn te bepalen op basis van alleen een frequentieverdeling. Samenvatting hfst 1 WB Regel 1 Bij optellen en aftrekken begin je vooraan de berekening en verwerk je term voor term Regel 2 + maal + is + + maal – is – - maal + is – - maal – is – Regel 3 + gedeeld door + is + - gedeeld door + is – + gedeeld door – is – - gedeeld door – is – Regel 4 1. Eerst haakjes wegwerken(machtsverheffen gaat voor 2. Dan vermenigvuldigen of delen 3. Dan optellen of aftrekken Regel 5 Als je twee breuken hebt en de noemers zijn gelijk, dan mag je de tellers bij elkaar optellen Regel 6 Bij het optellen van breuken maak je de noemers gelijknamig. Daarna mag je de tellers optellen en de noemer laten staan (noemer is de onderste) Regel 7 Delen door een breuk is vermenigvuldigen met het omgekeerde Regel 8 x n x.x...x X =grondtal N= exponent Regel 9 x n .x m x n m Regel 10 n x x nm m x Als de grondgetallen gelijk zijn , dan mag je bij deling de exponenten van elkaar afhalen Regel 11 ( x n ) m x n. m Bij het verheffen van een macht tot een macht, mag je de exponenten met elkaar vermenigvuldigen Regel 12 x n 1 xn De – in de exponent betekent dat je moet delen Regel 13 x0 1 Een getal tot de macht 0 is gelijk aan 1 Regel 14 De onevenmachtswortel over een negatief getal levert een negatief getal op, de evenmachtswortel over een negatief getal kan niet Regel 15 1 n x n x Regel 16 Als x^n = y dan geldt n = log y / log x Regel 17 Bij terugrekenen met procenten moet je delen door de groeifactor Samenvatting hft 2 SB Lineaire regressie De eerste stap is het maken van een spreidingsdiagram. Aandachtspunt bij het maken van de spreidingsdiagram zijn het bepalen van de: - Afhankelijke variabele Y - Onafhankelijke variabele X Als alle punten zich in een hoek van de grafiek zich bevinden kun je gebruik maken van een ‘scheurlijntje’(onderbreking in de x-as of y-as) Formule lineair(rechtlijnig) verband: Y = a + bX Waarbij: a = constante b = richtingscoëfficiënt Op het moment dat we een lineair verband opstellen tussen omzet en investeringskosten op basis van deze grote hoeveelheid gegevens, verkrijgen we het volgende lineaire model: Y = α + βX +Ɛ Waarbij: a = de populatieconstante β = de populatierichtingscoëfficiënt Ɛ = storingsterm De storingsterm is het verschil tussen het meetgegeven en de lijn( kan alleen als je A en β weet) Regressievergelijking: Ŷ = a + bX Het dakje geeft aan dat we met het lineaire verband schattingen van Y kunnen geven door een X waarde in te vullen De beste methode om een lijn door de meetgegevens te trekken is met behulp van de kleinste kwadratenmethode, zorgt ervoor dat de afwijking tussen lijn en stip zo klein mogelijk is. Met deze methode vinden we de volgende twee formules voor a en b: A = ȳ -bẊ Bij het bepalen van de kwaliteit van het lineaire verband berekenen we de correlatiecoëfficiënt. r= de notatie van de (steekproef) correlatiecoëfficiënt r = -1 r=0 r = -1 perfect dalend lineair verband geen lineair verband perfect stijgend lineair verband Samenvatting hfst 2 WB Regels lineair verband: Lineair is een rechte lijn Regel 1 De algemene gedaante van een lineair verband luidt y=ax+b a = richtingscoëfficiënt b= constante Regel 2 Bij een snijpunt met de y-as is x =0 Bij een snijpunt met de x-as is y =0 Regel 3 De definitie van de richtingscoëfficiënt is a = a> 0 dan is het lineair verband stijgend b> a<0 is het lineair verband dalendt a= 0 is er sprake van een constante Regel 4 > betekent groter dan ≥ betekent groter dan of gelijk aan < betekent kleiner dan ≤ betekent kleiner dan of gelijk aan Regel 5 Bij een ongelijkheid klapt het teken om als er gedeelt wordt door een negatief getal delen door een positief getal bij een ongelijkheid laat het ongelijkheidsteken ongemoeid delen door een negatief getal bij een ongelijkheid laat het ongelijkheidsteken omdraaien Regel 6 De algemene gedaand y=ax+b noemen we de expliciete gedaante van een lineair verband De algemen gedaante ax+by=c noemen we de impliciete gedaante van een lineair verband Stappenplan:Oplossen van het probleem in de case - vertaal de tekst in een wiskundige notatie - bepaal de afhankelijke en onafhankelijke variabele - stel de lineaire verbanden van vraag en aanbod op - bepaal het aanbodverschot en de financiele consequentie - teken de lineaire verbanden in 1 grafiek notatie: p staat voor prijs q staat voor afzet Prijs is onafhankelijke variabele Vraag en aanbod zijn afhankelijke variabelen Samenvating hfst 4 WB Regel 1 De slotwaarde van een bedrag X na n jaren met een jaarrente i is: X .(1 i ) n Waarin: i = groeipercentage 1+i = groeifactor Regel 2 De constante waarde van een bedrag X gerekend over n jaar geleden met een jaarrente i is X (1 i) n Regel 3 Uitgaande van een jaarrente i vind je de maandrente als volgt 12 1 i 1 Regel 4 Looptijd berekenen: N= log sw/log cd Log (1+i) Waarin: CW = contante waarde SW = slotwaarde i = rente Regel 5 De som van de slotwaarden van n periodieke stortingen verricht aan het einde van iedere periode tegen een intrest i is gelijk aan: (1 i ) n 1 X. i X is de periodieke storting Regel 6 De som van de slotwaarden van n periodieke stortingen verricht aan het begin van iedere periode tegen een intrest i is gelijk aan: (1 i) n 1 X .(1 i). i X is de periodieke storting Regel 7 De som van de contante waarden van n periodieke betalingen verricht aan het einde van iedere periode tegen een intrest i is gelijk aan: 1 (1 i) n X. i X is de periodieke betaling Regel 8 De som van de contante waarden van n periodieke betalingen verricht aan het begin van iedere period tegen een intrest i is gelijk aan: X is de periodieke betaling Statistiek in Business hfst 4 kansberekening Kans: een getal tussen de 0 en de 1.Dit drukken we meestal uit in een percentage. 1 is gelijk aan 100% en 0 is 0%. De notatie van een kans is de letter P. De kan om een 6 te gooien met een dobbelsteen wordt genoteerd met P(6). De P is afkomstig uit het Frans van het woord probabilite. Er zijn drie kans definities waarmee we dit zouden kunnen doen: 1. De kans definitie van Laplace 2. De relatieve frequentie 3. De subjectieve frequentie Kans definitie van Laplace: Het aantal uitkomsten waarin je geinterresseerd bent gedeeld door het totaal aantal mogelijke uitkomsten van een kansexperiment. De formule die hier bij hoort is: N(A)/N Waarbij: - A=uitkomsten van het kansexperiment(gebeurtenis) waar je geinterresseerd bent - N(A)= het aantal uitkomsten waar je geinterresseerd in bent - N= het totaal aan uitkomsten Relatieve frequentie: Te bepalen door het kansexperiment te herhalen en vervolgens te kijken hoe vaak de uitkomst die je interesseert, zich voordoet ten opzichte van het totaal aantal herhaalde kansexperiment De formule die hier bij hoor is: P(A)= n(A)/ n Waarbij: - n(A)= het aantal uitkomsten waar je geinteresseerd in bent bij herhaling - n= het aantal herhalingen van het kansexperiment De relatieve frequentie wordt ook wel zweetkans genoemd, omdat je moet werken om hem te bepalen Subjectieve kans: Een inschatting van een kans door een persoon Algemene somregel: P(A of B)= P(A) + P(B) – P(A en B) Toelichting: - A en B zijn twee gebeurtenissen waarin men geinteresseerd is - In plaats van de woordjes `of` en `en` moeten eigenlijk de wiskundige tekens U gebruikt worden. Om de lezer niet te vermoeien met deze notatie hebben we bewust gekozen voor deze woorden. Let op: het teken U betekens dat minimaal een gebeurtenis zich voordoet bij een kansexperiment, maar het kunnen ook alle twee de gebeurtenissen zijn ( het is dus eigenlijk en/of) - Als we de regel hardop lezen, dan zeggen we: de kans op A of B is gelijk aan de kans op A plus de kans op B minus de kans op A en B Speciale somregel: P(A of B)= P(A) + P(B), waarbij A en B niets gemeenschappelijks hebben Voorwaardelijke kans: Kans op een bepaalde uitkomst als je al gedeeltelijke informatie hebt over de uitkomst van een kansexperiment De notatie van een voorwaardelijke kans luidt: P (B|A)= P(A en B)/P(A) | betekend gegeven dat Uit de definitie van de voorwaardelijke kans volgt de algemene productregel Speciale productregel: P(A en B)= P(A)*P(B), mits A en B onafhankelijk zijn Complementregel: P(A) =1= P(complement van A) Permutaties:Het aantal manieren waarop je een aantal verschillende objecten ten opzichte van elkaar neer kunt zetten. In het algemeen geldt dat het aantal permutaties van n objecten wordt weergegeven als n!= n*(n1)…*1 De n met het uitroepteken spreek je uit als een n` faculteit. Zo is 5!=5*4*3*2*1=120 Samenvatting hfst 6 SB Voor uitgebreide uitleg zie hfst 6 Kenmerken standaardnormale verdeling: - Typische klokvorm - Het midden µ = 0 - De spreiding Ơ = 1 - De oppervlakten zijn getabelleerd zodat kansen bij deze verdeling te bepalen zijn Samenvatting normale verdeling: We zien dat we eerst het midden van alle waarden hebben afgetrokken en vervolgens gedeeld hebben door de standaarddeviatie. Noemen we de standaardnormale verdeling ẕ en een algemene normale verdeling x dan berekenen we kansen in de algemene normale verdeling door gebruik te maken van de volgende transformatie: z x De volgende vuistregels zijn in het algemeen van toepassing bij grote aantallen gegevens: 68% van de gegevens zit in tussen het gemiddelde en plus of min de standaarddeviatie 95% van de gegevens zit in tussen het gemiddelde en plus of min tweemaal de standaarddeviatie Deze vuistregel leveren de zogenaamde sigmagebieden Sigmagebieden: - Het één-sigmagebied in een normale verdeling is het gemiddelde plus of min de standaarddeviatie en bevat 68% van de gegevens - Het twee-sigmagebied in een normale verdeling is het gemiddelde plus of min tweemaal de standaarddeviatie en bevat 95% van de gegevens De kans dat je een steekproef trekt met een gemiddelde dat sterk afwijkt van het populatiegemiddelde wordt steeds kleiner. De normale verdeling van het steekproefgemiddelde wordt daardoor spitser. Men noemt de term Ơ/√ de standaardfout