Bedrijfsstatistiek_samenvatting_Boek_1_(29blz)

advertisement
Bedrijfsstatistiek
TEW 2e fase
Mieke Simons
H1: Statistiek en kansrekenen
Definitie van Statistiek
Statistiek
De (hulp)wetenschap die zich bezig houdt met informatie of gegevens
=> analyseren, interpreteren, voorstellen, verzamelen, classificeren,...
Enkele voorbeelden

Systeem voor vochtigheid
P: alle ogenblikken | Var: vochtigheid

Informatie vliegpassagiers
P: alle passagiers | Var: bagage, tijdstip, passagiers,...

Vulmachine
P: dozen | Var: rijst | Pr: vulproces

Nitraatgehalte groenten
P: groenten | Var: nitraatgehalte

Kwaliteit tennisballen
P: tennisballen | Var: diameter | Pr: productiepr

Risico van bep aandelen
P: rendementen | Var: tijd

Karakteristieken klanten
P: klanten | Var: betalingswijze, keuze,...

Gegevens zijn beschikbaar of moeten verzameld worden
o
Rechtstreeks beschikbaar
o
Verkregen via experimenten
o
Verkregen via enquetes
Onderwerp van de Statistiek

Over de populatie van elementen of objecten

Over een proces van elementen of objecten
(=> zie voorbeelden: P (populatie) en Pr (proces) en Var (variabele))

Gegevens via variabelen: verschilt bij elk element

Steekproef: slechts een deel wordt bekeken
Beschrijvende Statistiek
= descriptieve statistiek

Overzichtelijk beeld

Overzichtelijke beschrijving
Verklarende Statistiek
= inferentiële statistiek = steekproeftheorie

Analyseren en interpreteren

Hypothesen testen en waarde toetsen

Antwoorden en conclusies veralgemenen naar populatie = inferentie

Uitspraak niet 100% zeker!
o
Betrouwbaarheidsgraad => kansuitspraak => kansrekenen
2
Opletten met steekproeven

Moet voldoende groot zijn

Moet relevant en representatief zijnµ
De Kansrekening
Kansrekening
Bestudeert processen of experimenten waarbij de uitkomst onzeker is.

Het gooien van een dobbelsteen, de toekomstige prijs van een product,...

Statistiek vs Kansrekenen


o
Statistiek: uitspraken via steekproefgegevens
o
Kansrekenen: rechtstreekse uitspraken via onderstellingen
Onderstelling noodzakelijk
o
Vb dobbelsteen moet homogeen zijn
o
In de praktijk moeilijk of niet te verifiëren
Zie voorbeelden HBp 7 voor verschillen bij statistische studie (is) en kansrekening (zal)
!! Statistiek: beperkte steekproefinformatie: geen absoluut correcte uitspraken!!
3
H2: Data en hun voorstelling
Proces of Populatie
Elementen
Census van de populatie (volledige populatie)
Steekproef uit de populatie
Variabelen
SOORTEN GEGEVENS
Kwalitatieve (categorische) variabelen
Nominale variabele
Een nominale variabele laat toe de elementen te classificeren, het element krijgt een “etiket”.

Slechts om te categoriseren

Berekeningen zinloos (behalve percentages)

Codenummers, codeletters,... (cijfers impliceren dan geen volgorde en/of hoeveelheid!)

Kleur, merk, verpakking,...
Ordinale variabele
Een ordinale variabele laat toe de elementen te ordenen.

Om te waarderen, te beoordelen

Geen vaste meeteenheid (∆ restaurant * en restaurant ** ≠ ∆ restaurant ** en restaurant ***)

Berekeningen zinloos

Zeer goed/ goed/ slecht/ zeer slecht, 1 ster/2 sterren,...
Kwantitatieve variabele
Intervalvariabele

Geen natuurlijk nulpunt

16h is niet 2x zo laat als 8h

Tijd op de klok, temperatuur op de Celsiusschaal (nulpunt hebben we zelf gekozen),…
Ratiovariabele

Wel een natuurlijk nulpunt

6cm is wel 2x 3cm

Lengte, volume,Kelvinschaal ,...
Discrete variabele

Eindig: aantal passagiers dat opdaagt, aantal kinderen in een gezin,...

Oneindig: de aantal worpen nodig om een zes te gooien

Gehele getallen
Continue variabele

Elk getal tussen de boven en ondergrens: lengte, duurtijd, inhoud,...

Verdelen in klassen

Reële getallen
4
DE DATAMATRIX
Waarneming
Gewicht
Vulkop
Uur
Analist
O1
50,56
1
8
A1
O2
51,58
2
8
A2

Rij: elementen/ waarnemingen = observatievector O

Kolom: variabelen

Gewicht: continue variabele (kwantitatief)

Vulkop, analist: nominale variabele (kwalitatieve)

Uur: intervariabele/ nominale variabele
Univariate voorstelling

Betrekking op 1 variabele
Bivariate voorstelling

Betrekking op 2 variabelen
Frequentie

Frequentie ve klasse:
# elementen vd klasse

Relatieve frequentie:
# elementen vd klasse/ totaal # elementen vd proef
HET VOORSTELLEN VAN UNIVARIATE KWALITATIEVE VARIABELEN
Het staafdiagram
Het cirkeldiagram = sectordiagram
Het Pareto diagram

Klassen volgens dalende frequentie

Cumulatief voorgesteld

Kijken naar de klassen met de hoogste frequenties
Excel (HBp14-15)

Frequentie: AANTAL.ALS(celbereik;criterium)
HET VOORSTELLEN VAN UNIVARIATE KWANTITATIEVE VARIABELEN
Discrete kwantitatieve variabelen
Gehele getallen

Naalddiagram
Continue kwantitatieve variabelen
Reële getallen: verdelen in klassen!

Histogram
o
Klassenbreedte niet altijd gelijk
5

o
# klassen staat niet vast (tip: √𝑛)
o
Maximaal 15 à 20
o
Som van de oppervlakten = 1
Polygoon
o
Middens van de rechthoeken verbinden
o
Oppervlakte onder polygoon = 1
Het stam- en bladdiagram

Stam: eerste cijfer van elke waarneming

Blad: tweede cijfer van elke waarneming
Excel (HBp19-21)

Frequentie: INTERVAL(celbereik,bovengrenzen)
HET VOORSTELLEN VAN BIVARIATE VARIABELEN
Kwalitatieve variabelen

Kruistabel

Meervoudige staafdiagram
Kwantitatieve variabelen

Kruistabel

Puntenwolk/ puntendiagram
Gemengd

Kruistabel met kwalitatieve en kwantitatieve variabele
Excel (HBp19-21)

Kruistabel: DRAAITABEL
6
H3: Beschrijvende Kengetallen van Steeproefgegevens
BESCHRIJVENDE KENGETALLEN
(steekproef) statistieken = (steekproef) kengetallen
Kenmerkende maten die de gegevens van de steekproef samenvattend beschrijven => functies
Parameters
Kengetallen die betrekking hebben op een volledige populatie/ proces
UNIVARIATE KWANTITATIEVE VARIABELEN
Kengetallen van centrale ligging

Zowel voor discrete als continue variabelen
Het gemiddelde

Streekproefgemiddelde 𝑥̅

Populatiegemiddelde 𝜇

𝑓𝑖 : frequentie |

Eigenschappen

𝑓𝑖
𝑛
: gewichten = relatieve frequentie
o
∑ 𝑥𝑖 = 𝑛𝑥̅
o
∑(𝑥𝑖 − 𝑥̅ ) = 0
bewijs zie slides
Gevoelig aan extreme waarden
De mediaan

Ongeveer 50% vd waarnemingen zijn groter, 50% kleiner
 Hoe groter de steekproef, hoe nauwkeuriger

Niet gevoelig aan extreme waarden => robuust
De modus

Waarneming met de grootste frequentie

Histogram: modale klasse => unimodaal / bimodaal
Maatstaven van relatieve ligging
Geven de positie van een waarneming relatief tot de andere waarnemingen

ie ordekengetal = ie ordestatistiek = ie observatie na rangschikking van klein naar groot

Percentielen: Cp = waarde zodat p100% (0<p<1) van de gerangschikte waardes kleiner is
Vb C0,76 = X => 76% van de waarnemingen kleiner dan X (en 24% groter)


Kwartielen
o
1e kwartiel: Q1 = c0.25
|
2e kwartiel: Q2 = c0.5 (mediaan)
|
3e kwartiel: Q3 = c0.75
o
Ongeveer ¼ is < Q1
|
ongeveer ½ is < Q2
|
ongeveer ¾ is < Q3
Percentiel Cp = pde kwantiel
Vb C0,76 => 0,76ste kwantiel
Vb C0,80 => 0,80ste kwantiel => 8e deciel
7
Maatstaven van spreiding
Meten de spreiding van de gegevens rond een centrale waarde

Want zo kunnen 2 reeksen gegevens hetzelfde gemiddelde hebben, maar toch sterk verschillen!

Afwijking = (𝑥𝑖 − 𝑥̅ )
De variatiebreedte = spreidingsbreedte = ‘range’

Grootste – kleinste waarneming

Nadeel: hangt alleen af grootste en kleinste

Nadeel: moeilijk steekproeven met ongelijk # observaties te vgl’en (kan alleen maar stijgen als n stijgt)
De interkwartielbreedte = IKB

Q3 – Q1 = c0,75 – c0,25
De gemiddelde absolute afwijking

GAA

Niet 0 want werken met absolute waarden!!!
De gemiddelde gekwadrateerde afwijking

GGA

Niet 0 want werken met kwadraten!!!
De variantie

Steekproefvariantie 𝑠²

Populatievariantie 𝜎²

Altijd positief
0 bij cte waarden, dus geen variantie

Populatievariantie is dus een GGA,
Steekproefvariantie is geen GGA
De standaarddeviatie

𝑠

𝜎
Variatiecoëfficiënt

𝑣𝑐

Om de relatieve variabiliteit te bekomen
Maatstaven van scheefheid

Pearson-coëfficiënt
 −3 ≤ 𝑆𝑃 ≤ +3

Scheefheidscoëfficiëntie
o

Derde moment m3
Symmetrisch: gemiddelde = mediaan = modus
SP = 0 m3 = 0
Links scheef:
SP < 0 m3 < 0 staart aan de linkerzijde
gemiddelde < mediaan < modus
Rechts scheef: gemiddelde > mediaan > modus
SP > 0 m3 > 0 staart aan de rechterzijde
8
Transformatie en standaardisatie van gegevens

Lineaire transformaties
o
yi = axi + b met a en b cte
=> eenvoudige formules: gelden alleen als LINEAIRE transformaties!!!

Standaardiseren
o
De gestandaardiseerde waarneming zi
Meet de afstand, uitgedrukt in standaarddeviaties, die xi verwijderd liggen van 𝑥̅
o
Belangrijk voorbeeld van lineaire transformatie
o
Waarbij 𝑎 = 1/𝑠 en 𝑏 = −𝑥̅ /𝑠
o
𝑧̅ = 0 | 𝑠𝑧2 = 1 | 𝑥𝑖 = 𝑥̅ + 𝑧𝑖 . 𝑠
Extreme waarden, uitbijters (outliers)

Uitzonderlijk grote of kleine steekproefwaarneming

Valt buiten het patroon

Oorzaak moeilijk te achterhalen

o
Toch mogelijk: corrigeren of weglaten
o
Niet mogelijk: gekwalificeerd oordeel onderzoeker
Histogram klokvormig symmetrisch
o

Waarneming extreem als zi < -3 of als zi > +3
Histogram niet klokvormig symmetrisch: boxplot
Doos met snorharen = boxplot


Centrale deel: box
o
Begrensd door Q1 en Q3
o
Mediaan: verticale lijn
o
Gemiddelde:
Naast de snorharen: de mogelijke extreme waarden
o

of
𝑥𝑖 > 𝑄3 + 1.5 ∗ 𝐼𝐾𝐵
Nog verder naast de snorharen: de werkelijke extreme waarden
o

𝑥𝑖 < 𝑄1 − 1.5 ∗ 𝐼𝐾𝐵
𝑥𝑖 < 𝑄1 − 3 ∗ 𝐼𝐾𝐵
of
𝑥𝑖 > 𝑄3 + 3 ∗ 𝐼𝐾𝐵
Positie mediaan en gemiddelde (+ snorharen)
 Kan je uit afleiden of ze scheef is of niet en hoe
UNIVARIATE KWALITATIEVE VARIABELEN

Nominale variabel
o

Modus
Ordinale variabele
o
Modus en mediaan
o
Soms gemiddelde: schaal moet intervalschaal benaderen
9
BIVARIATE (KWANTITATIEVE) VARIABELEN
Covariantie

Steekproefcovariantie sXY

Populatiecovariantie 𝜎XY

Kan – en + zijn: hangt af van de dominantie van de positieve of negatieve termen

Termen (𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) in de covariantie


o
(+) : kleine waarde voor X en Y / grote waarde voor X en Y
(-)(-) of (+)(+)
o
(-) : kleine waarde voor X en grote waarde voor Y (e.o.)
(-)(+) of (+)(-)
Puntenwolk: assen rond de gemiddelden 𝑥̅ en 𝑦̅
o
Positieve term: 1e en 3e kwadrant
=> domineren: positieve samenhang
o
Negatieve term: 2e en 4e kwadrant
=> domineren: negatieve samenhang
Kruistabel van X en Y
o

Marginale frequenties van X en Y => relatieve frequenties van X en Y
Nadeel: afhankelijk van meeteenheid
 Variantie van een variabele is dus de covariantie met zichzelf: 𝑠𝑥2 = 𝑠𝑥𝑥 𝑒𝑛 𝜎𝑥2 = 𝜎𝑥𝑥
Correlatie

Steekproefcorrelatie rXY

Populatiecorrelatie 𝜌XY

Niet afhankelijk van meeteenheid

Belangrijke eigenschappen
o
-1 < rXY < +1
o
-1 < 𝜌XY < +1
o
Voor lineaire verband: zie formules
 Puntenwolken op rechte perfecte correlatie


Rechte met positieve helling

Rechte met negatieve helling r = -1
‘perfect’ negatief

Perfect horizontaal/ verticaal s = 0
geen lineair verband
r = +1 ‘perfect’ positief
Covarianties zeggen intuïtief niet veel, correlatie wel
 Correlatie meet enkel de graad van lineair verband tussen 2 variabelen
EXCEL FORMULES





s² : VAR(bereik)
𝜎² : VARP(bereik)
GAA: GEM.DEVIATIE(bereik)
Vc : STDEV(bereik) / GEMIDDELDE(bereik)
SCHEEFHEID(celbereik)

𝑁
COVARIANTIE(bereik1;bereik2)
𝑁−1
s : STDEV(bereik)
𝜎 : STDEVP(bereik)
GGA: DEV.KWAD(bereik)
PEARSON(bereik1;bereik2)
CORRELATIE(bereik1;bereik2)
10
H4: Kansrekening
BEGRIP KANS
Benaderend deterministisch

Resultaat zal met zekerheid worden voorspeld

Als aan voorwaarden voldaan

Slechts in theorie deterministisch want altijd kleine afwijkingen

Vb. bij druk van 760mm en t° van 100°C (vwen) zal water koken (resultaat)
Probabilistisch of stochastisch

Onzekerheid over de uitkomst

Kansprocessen = kansexperimenten = stochastische processen

‘erg waarschijnlijk dat…’
 Uitkomst kan je interpreteren als steekproefgegevens voor populatie/ proces
KANSEXPERIMENTEN EN VERZAMELINGENLEER
Uitkomstenruimte

Uitkomstenruimte = steekproefruimte Ω

Verzameling van alle uitkomsten waarvoor 𝜔 geldt

Eindig, oneindig, continu, numeriek, niet-numeriek,…

Eenzelfde experiment kan meerdere uitkomstenruimten hebben
 Kijken welke vragen gesteld worden over het experiment
Gebeurtenis (herbekijk vb HBp58)

G: een deelverzameling van Ω

Verzameling van uitkomsten waarbij ook ∅ en Ω als gebeurtenis worden beschouwd

Elementaire gebeurtenis: een G die zich naar een uitkomst zelf herleid

Gebeurtenis G doet zich voor als
o
Bij uitvoering van het experiment de uitkomst 𝜔 ∈ 𝐺
o
Bij uitvoering dus 1 van de uitkomsten van G zich voordoet
Definities, operaties en relaties

Unie of vereniging: 𝐺 = 𝐴 ∪ 𝐵 (A of B of beide)
o
𝐺 = 𝐺1 ∪ 𝐺2 ∪ … =∪𝑖 𝐺𝑖
=> dan bevat G alle uitkomsten die behoren tot minsten 1 vd gebeurtenissen G1,G2,…
o

G is exhaustief (volledig) als ∪𝑖 𝐺𝑖 = Ω
Doorsnede: 𝐺 = 𝐴 ∩ 𝐵
(A en B)
o
Lege doorsnede: disjunct: sluiten elkaar uit
o
𝐺 = 𝐺1 ∩ 𝐺2 ∩ … =∩𝑖 𝐺𝑖
=> dan bevat G alle uitkomsten die behoren tot al de gebeurtenissen G1,G2,…
11

Verschil: 𝐺 = 𝐴 − 𝐵
(A maar niet B)

Deelverzameling: 𝐴 ⊆ 𝐵
(B bevat A)

Complement: 𝐺 𝐶 = Ω − 𝐺
(niet in G)

o
𝐺𝐶 ∪ 𝐺 = Ω
o
𝐺𝐶 ∩ 𝐺 = ∅
Partitie van Ω
(of…of…of…)
o
Als ze exhaustief zijn
o
Als ze elkaar uitsluiten 𝐺 = 𝐺𝑖 ∩ 𝐺𝑗 = ∅
𝐺 = 𝐺1 ∪ 𝐺2 ∪ …
 𝑃(𝐺1 ∪ 𝐺2 ∪ … ) = ∑𝑛𝑖=1 𝑃(𝐺𝑖 )
DEFINITIE VAN KANS
Kans op gebeurtenis G
De kans definiëren dat een gebeurtenis 𝐺 ⊆ Ω zich voordoet, dus dat de uitkomst een element is van G
Frequentiedefinitie

Functie P(G)

Frequentie van G: 𝑓𝑛 (𝐺)
=> relatieve frequentie van G: 𝑓𝑛 (𝐺)/𝑛
Kans dat deze zal stabiliseren voor grote n: P(G)


Als 𝐺 = Ω
dan is
𝑓𝑛 (𝐺)
𝑛
=1
en dus 𝑃(Ω) = 1
Als 𝐺 = ∅
dan is
𝑓𝑛 (𝐺)
𝑛
=0
en dus 𝑃(∅) = 0
Hoe groot moet n zijn? We zouden n onbeperkt kunnen laten toenemen: 𝑃(𝐺) = lim
𝑛→∞
𝑓𝑛 (𝐺)
𝑛
=> is in praktijk moeilijk of zelfs onmogelijk
Axiomatische definitie
1. 𝑃(𝐺) ≥ 0
2. 𝑃(Ω) = 1
3. 𝑃(𝐺1 ∪ 𝐺2 ∪ 𝐺3 … = ∑𝑖 𝑃(𝐺𝑖 )

waarbij G1,G2,… elkaar uitsluiten (dus alleen of…)
Nadeel: wordt niets gezegd over de bepaling van P(...) voor een concreet experiment
Klassieke definitie van Laplace
𝑛𝐺
𝑛

Alle mogelijke uitkomsten zijn even waarschijnlijk 𝑃(𝐺) =

Slechts mogelijk voor eindig # mogelijke uitkomsten die alle gelijkwaardig zijn
Klassieke definitie tov frequentiedefinitie

Frequentiedefinitie
=> empirische verdeling

Klassieke definitie
=> theoretische verdeling = kansverdeling
Subjectieve definitie

Persoonlijke inschatting

Verschillende personen zullen dus verschillende inschattingen van de kans hebben
12
REKENREGELS VOOR KANSEN

Formules gelden voor elk experiment en willekeurige gebeurtenissen G1,G2,G3, …
SIMULATIE IN EXCEL
Doel

Goed inzicht krijgen

Kan vaak herhaald worden (op basis van de frequentiedefinitie)

Systemen optimaliseren
Programma’s

Voor de ingewikkelde processen specifieke simulatietalen ontwikkeld: GPSS, Slam,…

Excel: ASELECT( )
o
Lukraak een getal genereren tussen 0 en 1
o
Pseudolukrake getallen…
VOORWAARDELIJKE KANS
Begrip
Voorwaardelijke kans
De kans berekenen op een gebeurtenis, rekening houdend met een andere gebeurtenis, die de kans op de
eerste in belangrijke mate zou kunnen veranderen

Formule voorwaardelijke kans: P(G2) > 0

𝑃(𝐺1 )
onvoorwaardelijke kans = a priori kans
𝑃(𝐺1 |𝐺2 )
voorwaardelijke kans = a posteriori kans = herziene kans
Vermenigvuldigingsregel
𝑃(𝐺1 ∩𝐺2 ∩𝐺3 )
𝑃(𝐺1 ∩𝐺2 )

Voor 3 gebeurtenissen: 𝑃(𝐺3 |𝐺1 ∩ 𝐺2 ) =

Dus: 𝑃(𝐺1 ∩ 𝐺2 ∩ … ∩ 𝐺𝑘 ) = 𝑃(𝐺1 ) ∗ 𝑃(𝐺2 |𝐺1 ) ∗ 𝑃(𝐺3 |𝐺1 ∩ 𝐺2 ) ∗ … ∗ 𝑃(𝐺𝑘 |𝐺1 ∩ 𝐺2 ∩ … ∩ 𝐺𝐾 )
Onafhankelijke en afhankelijke gebeurtenissen

Onafhankelijk: 2e gebeurtenis heeft geen invloed op de eerste: info is neutraal

Vb. de kans om 1 te gooien met 4 eerlijke dobbelstenen: 𝑃(𝐺) = ( ∗ ∗ ∗ ) = ( )4

Elkaar uitsluitende gebeurtenissen ≠ onafhankelijke gebeurtenissen!!!!

Informatie in G2 is
1
6
o
Positief : 𝑃(𝐺1 |𝐺2 ) > 𝑃(𝐺1 )
o
Negatief: 𝑃(𝐺1 |𝐺2 ) < 𝑃(𝐺1 )
o
Neutraal: 𝑃(𝐺1 |𝐺2 ) = 𝑃(𝐺1 )
1
6
1
6
1
6
1
6
Totale kans en de kansregel van Bayes

Partitie: exhaustief en disjunct!

Bayes: indien totale kans gekend, zoeken waar de kans welke grootte heeft
13
H5: Univariate kansvariabelen
KANSVARIABELEN EN VERDELINGSFUNCTIE
Kansvariabele
Kansvariabele
Een functie X(𝜔) die een reëel getal associeert met elke uitkomst (𝜔) van een experiment

Kansvariabele = stochastische variabele

Grote letters gebruiken: meestal X,Y of Z

Kleine letters: verwijzen naar een bepaalde reële waarde voor de kansvariabele

Betrekking op eigenschap van de elementen of een proces

o
Univariaat: kansvariabele betrekking op 1 eigenschap
o
Bivariaat: kansvariabele betrekking op 2 eigenschappen samen
o
Kansvector: kansvariabele op meerdere eigenschappen samen
Kansen kansvariabelen kan je afleiden uit kansen gebeurtenissen
𝑃(𝑋 = 𝑥) = 𝑃(𝐺𝑥 )
vb. 𝑃(𝑋 = 3) = 𝑃(𝐺3 ) = 2/36 met G3 = {(1,2), (2,1)}
Verdelingsfunctie


Verdelingsfunctie = cumulatieve verdelingsfunctie 𝐹𝑥 (𝑥)
o
Niet dalend want kans is altijd positief
o
0 < 𝑃 < 1 dus ook 0 < 𝐹𝑥 < 1
Overlevingsfunctie: 𝑃(𝑋 > 𝑥) = 1 − 𝐹𝑋 (𝑥)
DISCRETE KANSVARIABELE EN KANSVERDELING
Kansverdeling

𝑝𝑋 (𝑥𝑖 )

Discrete kansvariabele

o
Als # mogelijke waarden voor X eindig aftelbaar zijn
o
Als # mogelijke waarden voor X oneindig aftelbaar zijn (opgooien tot uitkomst 6 is)
(som van # ogen)
Kansverdeling: niet exact in praktijk: onderstellingen maken
Empirische verdeling wel (rechtstreeks uit steekproefgegevens)

Ook steeds positief

Kansverdeling ≠ verdelingsfunctie!
o
(Zie HB p88)
Kansverdeling:
Waarde dat bij variabele hoort
Gedefinieerd voor reëel getal dat bij variabele hoort
o
Verdelingsfunctie: (cumulatief!)
tussen welke waarden het ligt
gedefinieerd voor elk reëel getal
14
CONTINUE KANSVARIABELE EN KANSDICHTHEID
Kansdichtheid

𝑓𝑋 (𝑥)

𝑓𝑋 (𝑥) = 𝑔(𝑥) 𝑎𝑙𝑠 𝑎 ≤ 𝑥 ≤ 𝑏
𝑓𝑋 (𝑥) = 0
𝑒𝑙𝑑𝑒𝑟𝑠

Tegenhanger van de kansverdeling

Continue kansvariabele
o

In klassen verdelen!
Benadering voor de kans (via relatieve frequentie)
o
Geeft zelf dus geen kans weer!!!

Oppervlakte onder polygoon tussen a en b benadert de kans van een waarde tussen a en b

Indien zeer groot => klassenbreedte zeer klein => limiet: continue curve

Waarde onder polygoon = 1 => waarde onder F ook

Om na te gaan je een dichtheid hebt
o
Aanduiden dat 𝑓𝑋 (𝑥) ≥ 0
o
En dat ∫𝑎 𝑓𝑋 (𝑥) = 1
𝑏
Verdelingsfunctie

𝐹𝑥 (𝑥)

Afleiden en dan heb je de kansdichtheid

Stijgend tot 1

𝐹𝑋 (𝑥) = 0
𝑎𝑙𝑠 𝑥 < 𝑎
𝐹𝑋 (𝑥) = 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥 = [𝑓(𝑎) − 𝑓(𝑏)]
𝐹𝑋 (𝑥) = 1

𝑎𝑙𝑠 𝑎 ≤ 𝑥 ≤ 𝑏
𝑎𝑙𝑠 𝑥 > 𝑏
𝑏
𝑥 𝑛+1
Uitwerken integraal: ∫𝑎 𝑥 𝑛 𝑑𝑥 = [
]
𝑛+1
𝑏
𝑎
GRAFISCH OVERZICHTJE
Discreet

Kansverdeling : naalddiagram
Verdelingsfunctie: trapvorm
Continu

Kansdichtheid: klokvormig
Verdelingsfunctie: stijgende tot aan 1
15
Simuleren van continue kansvariabelen

𝐹𝑋 (𝑥) = 𝑟
o
Met r = ASELECT( )
o
Functie herleiden tot x
FUNCTIE VAN EEN KANSVARIABELE
Algemeen

Kansvariabele 𝑋
𝑋=𝑥

Functie 𝑌 = 𝑔(𝑋)
𝑌 = 𝑦 = 𝑔(𝑥)
Discreet

Waarde van 𝑦 zoeken
 Functie 𝑌 = 𝑔(𝑋) gewoon invullen met de gevonden 𝑥-waarden
 Of formule aanpassen door 𝑥 te substitueren door 𝑦

𝑝𝑌 (𝑦) gewoon zoeken door oorspronkelijke kansverdeling 𝑝𝑋 (𝑥) toe te passen met y
Continu

Via de verdelingsfunctie
1. Bepaal het nieuwe domein
2. Bereken de nieuwe verdelingsfunctie 𝐹𝑌 (𝑦) = 𝑃(𝑌 ≤ 𝑦)
3. Leid deze af tot je 𝑓𝑌 (𝑦) krijgt (domein niet vergeten!)

Via de differentiaalanalyse
1. Bepaal het nieuwe domein
2. Los de nieuwe functie op naar 𝑥 en bepaal de afgeleide
3. Vul deze inverse functie in in de oorspronkelijke en vermenigvuldig met de afgeleide

Herbekijk voorbeelden HBp98-99
16
H6: Kengetallen van populaties en processen
VERWACHTE WAARDE VAN EEN KANSVARIABELE

Verwachte waarde 𝜇𝑋 of 𝐸(𝑥)

Wordt ook het gemiddelde van 𝑋 genoemd
Verwachte waarde 𝜇𝑋 voor de populatie of het proces
=
Steekproefgemiddelde 𝑥̅ voor steekproefgegevens

Discrete kansvariabele
o

Continue kansvariabele
o

Met kansverdeling 𝑝𝑋 (𝑥𝑖 )
Met kansdichtheid 𝑓𝑋 (𝑥)
Verwachte waarde kan een waarde zijn die niet door de kansvariabele kan aangenomen worden
VERWACHTE WAARDE VAN EEN FUNCTIE VAN EEN KANSVARIABELE
Algemeen

Methode 1 (met substititie)
1. Bereken 𝑝𝑌 (𝑦) als discreet of 𝑓𝑌 (𝑦) als continu van de nieuwe variabele 𝑌 = 𝑔(𝑋)
2. Pas nu de definitie van de verwachte waarde toe

Methode 2 (direct)
1. Gebruik de kansverdeling of kansdichtheid van 𝑋 zelf en de functie 𝑔(𝑋)
2. Pas nu de definitie van de verwachte waarde toe

St Petersburg Paradox
o
Voor 1x te mogen spelen niet bereid veel in te zetten
o
Verwachte waarde van de opbrengst is oneindig groot
Speciale gevallen

Lineaire functies
=> bewijs HBp106

Constante
=> 𝐸(𝑐) = 𝑐

𝐸(𝑋 − 𝜇𝑋 ) = (𝜇𝑋 − 𝜇𝑋 ) = 0
VARIANTIE EN STANDAARDDEVIATIE VAN EEN KANSVARIABELE
Variantie en standaarddeviatie

Nu gedefinieerd voor elke mogelijke kansvariabele (discreet/continu)

Ook gebruikt als maatstaf van spreiding
 Hoe groter 𝜎𝑋2 of 𝜎𝑋 , hoe groter de spreiding rond de verwachte waarde
17
Var(lineaire functie)

Bewijs zie HBp109

Constant b heeft geen invloed op 𝜎𝑋2 of 𝜎𝑋

𝜎𝑏2 = 0 en 𝜎𝑏 = 0
Gestandaardiseerde kansvariabele

Heeft altijd verwachte waarde 0 en variantie 1!!!

Zie ook hoofdstuk 3 (p9)
ANDERE KENGETALLEN
Modus

Bestaat niet als er geen maximum bestaat

Zeer zwakke maat van centrale ligging
Mediaan

Discreet: zie formule

0.5
Continue: 𝑃(𝑋 ≤ 𝛾0.5 ) = 𝑃(𝑋 ≥ 𝛾0.5 ) = ∫−∞
𝑓𝑋 (𝑥)𝑑𝑥 = ∫𝛾

Ook maat voor centrale ligging want minder gevoelig aan extreme waarden dan 𝐸(𝑋)
𝛾
+∞
0.5
𝑓𝑋 (𝑥)𝑑𝑥 = 1/2
Kwantielen, parcentielen en kwartielen

100*pde percentiel = 10*pde deciel = pde kwantiel
Vb. 0,25e kwantiel = 2,5e deciel = 25e percentiel

1e kwartiel 𝛾0.25 | 2e kwartiel 𝛾0.5 | 3e kwartiel 𝛾0.75

Voor continue kansvariabelen: zie formules

Voor discrete kansvariabelen: slechts een benadering!
Scheefheidscoëfficiënten

Pearson populatiecoëfficiënt
 −3 ≤ 𝑆𝑃𝑝𝑜𝑝 ≤ +3

Scheefheidscoëfficiëntie
o

Vergeljkbaar met derde moment m3
Symmetrisch: gemiddelde = mediaan = modus
SP = 0 m3 = 0
Links scheef:
SP < 0 m3 < 0 staart aan de linkerzijde
gemiddelde < mediaan < modus
Rechts scheef: gemiddelde > mediaan > modus
SP > 0 m3 > 0 staart aan de rechterzijde
18
H7: Belangrijke discrete kansvariabelen
FAMILIE VAN KANSVERDELINGEN/ KANSDICHTHEDEN

Verzameling van verdelingen/ dichtheden

Geïndexeerd door 1 of meerdere grootheden => parameters

Elke waarde die de parameter aanneemt (in een bepaald domein)
 resulteert in een kansverdeling/ kansdichtheid
DE BERNOULLI VERDELING

Parameter 𝜋 stelt hier een kans voor => 0 ≤ 𝜋 ≤ 1

Succes:
𝑋 = 1 met kans 𝜋

Faling:
𝑋 = 0 met kans (1 − 𝜋)

Bernoulli-experiment = kanproces voor 1 element
DE BINOMIALE KANSVERDELING
Voorwaarden

Bestaat uit n opeenvolgende Bernoulli experimenten => succes of faling

Met parameter 𝜋 telkens dezelfde waarde

Experimenten worden onafhankelijk van elkaar uitgevoerd!
Kans op succes

𝑋 = 1,2,3, … , 𝑛 en stelt het aantal successen voor
o
Kans op 𝑥 succes
o
Kans op (𝑛 − 𝑥) faling
Parameters 𝝅 en 𝒏

𝑛 ≥ 0 en geheeltallig

0≤𝜋≤1
Scheefheid

Symmetrisch: 𝜋 = 0,5

Links scheef:

Rechts scheef: 𝜋 ≤ 0,5
𝜋 ≥ 0,5
(figuur 𝜋=0.2)
Excel

Binomiale kans 𝑝𝑋 (𝑥; 𝑛, 𝜋)

Cumulatieve kans ∑𝑥𝑥=0 𝑝(𝑥; 𝑛, 𝜋)
∗
𝑥∗
=> (𝑋 = 𝑥)
=BINOMIALE.VERD(𝑥, 𝑛, 𝜋, 0)
=> (𝑋 ≤ 𝑥) = 𝐹𝑋 (𝑥)
=BINOMIALE.VERD(𝑥, 𝑛, 𝜋, 1)

Kleinste waarde 𝑥 ∗ zodanig dat ∑𝑥=0 𝑝(𝑥; 𝑛, 𝜋) ≥ 𝛼

Herbekijk voorbeelden HBp117-120
=CRIT.BINOM(𝑛, 𝜋, 𝛼)
19
DE POISSON VERDELING
Voorwaarden

Is een specifiek geval van een binomiale verdeling => succes of faling

Met 𝜋 per klein interval telkens dezelfde waarde en zeer klein

In 1 deelinterval kan maximum 1 gebeurtenis voorkomen

Gebeurtenissen zijn onafhankelijk van elkaar!
Van Binomiaal naar Poisson verdeeld


Stel 𝑋 binomiaal verdeeld
o
Indien 𝑛 → ∞ en 𝜋 → 0
o
Dan tendeert de kansverdeling 𝑋 naar de Poisson verdeling met 𝜆 = 𝑛𝜋
Voorbeeld: # fouten in stof als we weten dat gemiddeld 5 fouten per 10m
o
Zeer veel intervallen
=> 𝑛 = 10.000
o
Zeer kleine fout per m
=> 𝜋 = 0.0005
o
En dit tendeert dus naar
=> 𝑛𝜋 = 5 = 𝜆
Excel

Poisson kans 𝑝𝑋 (𝑥; 𝜆)

𝑥∗
Cumulatieve kans ∑𝑥=0 𝑝(𝑥; 𝜆)

Herbekijk voorbeelden HBp125
=> 𝑃(𝑋 = 𝑥)
=POISSON(𝑥, 𝜆, 0)
=> 𝑃(𝑋 ≤ 𝑥) = 𝐹𝑋 (𝑥)
=POISSON(𝑥, 𝜆, 1)
DE GEOMETRISCHE VERDELING

Bestaat uit n opeenvolgende Bernoulli experimenten => succes of faling

Na 𝑥 experimenten een eerste succes

0≤𝜋≤1
Excel

Geometrische kans
=> 𝑃(𝑋 = 𝑥)
=NEG.BINOM.VERD(𝑥 − 1,1, 𝜋)
DE NEGATIEF BINOMIALE OF PASCAL VERDELING

Veralgemening van de geometrische

Na 𝑥 experimenten een 𝑟-de succes en dus aantal falingen = (𝑥 − 𝑟)
Bij geometrische: 𝑟 = 1

0≤𝜋≤1
Excel

Pascal kans
=> 𝑃(𝑋 = 𝑥)
=NEG.BINOM.VERD(𝑥 − 𝑟, 𝑟, 𝜋)
Om grootheden van bepaalde verdeling te bewijzen

Formules van H6 gewoon invullen met de gepaste waarden

Gepaste waarden: waarden die de bepaalde verdeling kan aannemen
20
KORT OVERZICHT
Bernoulli verdeling

Binair (0/1)

Faling/succes, ja/nee, geslaagd/niet geslaagd,…
 𝑋 = 1/0
Binomiale verdeling

Reeks van Bernoulli

20 mensen dagen op/dagen niet op, 100 producten falen/zijn succes,…
 𝑋 = 𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑒𝑛
Poisson verdeling

Gebeurtenis doet zich lukraak voor

Binomiaal met 𝑛 → ∞ en 𝜋 → 0

# klanten per u in apotheker, # brieven in de brievenbus na 2 dagen,…
 𝑋 = 𝑎𝑎𝑛𝑡𝑎𝑙 𝑔𝑒𝑏𝑒𝑢𝑟𝑡𝑒𝑛𝑖𝑠𝑠𝑒𝑛 𝑝𝑒𝑟 𝑒𝑒𝑛ℎ𝑒𝑖𝑑
Geometrische verdeling

Reeks van Bernoulli

Aantal experimenten nodig voor 1e succes

Kans om een eerste 6 te gooien, kans om een juiste bloeddonor te vinden,…
 𝑋 = 𝑎𝑎𝑛𝑡𝑎𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑒𝑛 𝑡𝑜𝑡 1𝑒 𝑠𝑢𝑐𝑐𝑒𝑠
Negatief binomiale of Pascal verdeling

Veralgemening van de geometrische

Aantal experimenten nodig voor 𝑟 e succes

Kans om een r-de 6 te gooien, kans om r gepaste kleedjes te vinden,…
 𝑋 = 𝑎𝑎𝑛𝑡𝑎𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑒𝑛 𝑡𝑜𝑡 𝑟′𝑑𝑒 𝑠𝑢𝑐𝑐𝑒𝑠
21
H8: Belangrijke continue kansvariabelen
INLEIDING
Problemen ivm met continue kansvariabele


In praktijk niet altijd volwaardig continu!
o
Niet perfect te meten
o
Benadering
o
Eindig in aantal…
Grote eindige populatie
o
Eigenschap soms continue verondersteld
o
Slecht een benadering!
o
Vb gewicht producten grote voorraad
DE (CONTINUE) UNIFORME DICHTHEID
Excel

Genereren van een lukraak getal tussen 2 grenzen

𝛼 + (𝛽 − 𝛼) ∗ ASELECT( )
Wielertoerist

Zie slides

Slechte week referentie bepalen

Afstand ligt binnen interval

Formule toepassen
DE EXPONENTIËLE DICHTHEID
Algemeen

𝜆>0

Stel dat 𝑌 = 𝑋 + 𝛼, dan zal de kansvariabele enkel waarden aannemen ≥ 𝛼
Eigenschap zonder geheugen

Zie formule: vb loketten
Verband exponentiële en Poisson

Poisson verdeeld met aankomstenfrequentie 𝜆
⇔
Tijd tussen opeenvolgende aankomsten exponentieel verdeeld met paramater 𝜆

Voorbeeld stof

Bewijs: 𝐹𝑇 (𝑡) = 1 − 𝑃(𝑇 > 𝑡) = 1 − 𝑃(𝑋 = 0) = 1 −
𝑒 −𝜆𝑡 (𝜆𝑡)0
0!
= 1 − 𝑒 −𝜆𝑡
Excel

Kansdichtheid 𝑓𝑋 (𝑥)
=> 𝑃(𝑋 = 𝑥)
=EXPON.VERD(𝑥, 𝜆, 0)

Verdelingsfunctie 𝐹𝑋 (𝑥)
=> 𝑃(𝑋 ≤ 𝑥)
=EXPON.VERD(𝑥, 𝜆, 1)
22
Duidt aan:

𝑓(2)

𝐹(2)
23
H9: De Normale dichtheid
DE NORMALE DICHTHEID
Voordelen van de normale dichtheid

Heel wat processen in praktijk genereren normaal verdeelde gegevens

Belangrijke functies van normaal verdeelde kansvariabelen zijn normaal verdeeld

Belangrijke functies van niet normaal verdeelde kansvariabelen zijn benaderend normaal verdeeld
Belangrijke eigenschappen

Voor elke 𝜇 en voor elke 𝜎 > 0, is het een dichtheid

Klokvormig met asymptoot naar 0 voor 𝑥 → ±∞

Symmetrisch rond 𝜇 of 𝑓𝑋 (𝜇 + 𝑥; 𝜇, 𝜎) = 𝑓𝑋 (𝜇 − 𝑥; 𝜇, 𝜎)

Modus = mediaan = verwachte waarde = 𝜇

Buigpunten: 𝑥 = 𝜇 ± 𝜎
DE NORMALE VERDELINGSFUNCTIE

𝐹𝑋 (𝑥)

Moeilijk te berekenen

Voor elke waarden anders
 Normale verdeling gebruiken!
NORMAAL EN STANDAARDNORMAAL
Standaardnormaal

𝐹𝑍 (𝑧) = 𝜙(𝑧)

Als 𝜇 = 0 en 𝜎 = 1
Lineaire transformatie

Kansvariabele is normaal verdeeld 𝑁(𝜇, 𝜎)
Lineaire functie 𝑌 = 𝑎𝑋 + 𝑏
 𝐸(𝑌) = 𝑎𝜇 + 𝑏
 𝑣𝑎𝑟(𝑌) = 𝑎2 𝜎 2

𝑌 is dan ook normaal verdeeld 𝑁(𝑎𝜇 + 𝑏, |𝑎|𝜎)
Verband normaal en standaardnormaal kansvariabelen: tabel

Voor tabel standaardnormaal: 𝑁(𝜇, 𝜎)

Alleen de positieve waarden van z

Altijd tekenen!!

Meeste elementen bevinden zich dicht bij het gemiddelde

Als 𝜇 meer dan 3𝜎 boven 0 ligt, dan zak de normale verdeling zelden negatieve waarden opleveren
24
EXCEL

NORM.VERD(𝑥, 𝜇, 𝜎, 0)

STAND.NORM.VERD(𝑧)

NORM.INV(𝐴𝑆𝐸𝐿𝐸𝐶𝑇( ), 𝜇, 𝜎) en
en
NORM.VERD(𝑥, 𝜇, 𝜎, 1)
STAND.NORM.INV(𝐴𝑆𝐸𝐿𝐸𝐶𝑇( ))
𝑃(𝑍 < 𝑧(𝛼)) = 𝛼


𝑧(𝛼): grenzen
o
Eerst kolom
o
Dan rij aflezen
𝛼: de uiteindelijk waarde
25
SOM VAN ONAFHANKELIJKE KANSVARIABELEN

Gewoon kansrekenen toepassen

Zie slides om op te frissen
Som van 2 onafhankelijke kansvariabelen

Met 𝑋1 en 𝑋2 normaal verdeeld

Som 𝑌 = 𝑋1 + 𝑋2 ook normaal verdeeld met:
o
𝜇𝑌 = 𝜇1 + 𝜇2
(𝜇𝑌 = 𝜇1 − 𝜇2 𝑣𝑜𝑜𝑟 𝑣𝑒𝑟𝑠𝑐ℎ𝑖𝑙)
o
𝜎𝑌 ² = 𝜎1 ² + 𝜎2 ²
(𝜎𝑌 ² = 𝜎1 ² + 𝜎2 ² 𝑣𝑜𝑜𝑟 𝑣𝑒𝑟𝑠𝑐ℎ𝑖𝑙‼!)
Som van meerdere onafhankelijke kansvariabelen

Met 𝑋1 , 𝑋2 ,…, 𝑋𝑛 normaal verdeeld
Met allemaal dezelfde verwachte waarde en dezelfde variantie:

𝑌 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ook normaal verdeeld met:
o
𝐸(𝑌) = 𝜇𝑌 = 𝑛𝜇
o
𝑣𝑎𝑟(𝑌) = 𝜎𝑌 ² = 𝑛𝜎²
Met 𝑌 een lineaire functie: 𝑌 = 𝑎0 + 𝑎1 𝑋1 + 𝑎2 𝑋2 + ⋯ + 𝑎𝑛 𝑋𝑛

𝑌 = 𝑎0 + 𝑎1 𝑋1 + 𝑎2 𝑋2 + ⋯ + 𝑎𝑛 𝑋𝑛 ook normaal verdeeld met:

Formule hoofdstuk 11
o
𝜇𝑌 = 𝑎0 + 𝑎1 𝜇1 + 𝑎2 𝜇2 + ⋯ + 𝑎𝑛 𝜇𝑛
o
𝜎𝑌 ² = 𝑎1 ²𝜎1 ² + 𝑎2 ²𝜎2 ² + ⋯ + 𝑎𝑛 ²𝜎𝑛 ²
Met allemaal een verschillende verwachte waarde en verschillende variantie:

De centrale limietstelling!
Wat wordt de kansverdeling/ dichtheid indien we een groot # onafhankelijke variabelen optellen?
 Tenderen naar een normale verdeling/dichtheid!
 Ongeacht de kansverdeling/ dichtheid van de oorspronkelijke kansvariabelen!

𝑌 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 benaderend normaal verdeeld

Voorwaarden:

o
Geen extreem afwijkende 𝜎𝑖2
o
N moet voldoende groot zijn

Kansdichtheid 𝑋𝑖 ± normaal verdeeld
=> 𝑛 = 5

Kansdichtheid 𝑋𝑖 niet normaal, maar geen pieken
=> 𝑛 = 12

Voor andere gevallen
=> 𝑛 = 100
Aangezien Y dan benaderend normaal => Z(Y) benaderend standaardnormaal
Met 𝑋 binomiaal verdeeld met 𝑛 𝑒𝑛 𝜋

Dan 𝑋 ook benaderend normaal verdeeld

Bewijs doordat de binomiale kans overal hetzelfde is (dus de varianties en verwachte waardes ook)

n groot => 𝑛𝜋 en 𝑛(1 − 𝜋) minimum 5

continuïteitscorrectie: 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) benaderen via 𝑃(𝑎 − 0.5 ≤ 𝑋 ≤ 𝑏 + 0.5)
26
H10: Multivariate kansvariabelen
BEGRIPPEN
Univariate kasvariabele

1 reëel getal wordt geassocieerd met elke uitkomst van het experiment

Vb dobbelsteen 5x opgooien
Multivariate kansvariabelen

Meerdere reële getallen worden geassocieerd met elke mogelijke uitkomst

Vb witte en zwarte dobbelsteen tegelijkertijd 5x opgooien

Multivariaat = gezamenlijk = tegelijkertijd!!
Gezamenlijke kansverdeling

Voor discrete bivariate kansvector

Geld samen als een kans dus voorwaarden:
o
0 ≤ 𝑝(𝑥, 𝑦) ≤ 1
o
∑ 𝑝(𝑥, 𝑦) = 1
MARGINALE KANSVERDELING

Kansverdeling van 𝑋 afleiden uit de gezamenlijke kansverdeling (𝑋, 𝑌)

Kansverdeling 𝑋 = marginale kansverdeling 𝑋
o
“marginaal” om aan te tonen dat ze werd afgeleid uit de gezamenlijke
o
Telkens de totalen optellen
o
Moet samen 1 geven!

De 2e kansvariabele wordt buiten beschouwing gelaten

Marginale kansverdelingen kunnen afgeleid worden uit de gezamenlijke
MAAR de gezamenlijke kan alleen afgeleid worden uit de marginale als onafhankelijk!!!
VOORWAARDELIJKE KANSVERDELINGEN

De voorwaardelijke kansverdeling van 𝑋 gegeven 𝑌 = 𝑦 en
De voorwaardelijke kansverdeling van 𝑌 gegeven 𝑋 = 𝑥

Wanneer 𝑋 en 𝑌 onafhankelijke kansvariabelen:
o
Voorwaardelijke kansverdeling van 𝑋 gegeven 𝑌 = 𝑦
= marginale kansverdeling van 𝑋
o
Voorwaardelijke kansverdeling van 𝑌 gegeven 𝑋 = 𝑥
= marginale kansverdeling van 𝑌
27
H11: Functies van meerdere kansvariabelen
FUNCTIE VAN MEERDERE KANSVARIABELEN

𝑌 = 𝑔(𝑋1 , 𝑋2 , … , 𝑋𝑛 )

We willen de reeds gevonden resultaten veralgemenen
VERWACHTE WAARDE VAN EEN FUNCTIE VAN MEERDERE KANSVARIABELEN
Verwachte waarde 𝑬[𝒈(𝑿𝟏 , 𝑿𝟐 )]

Zie formule
Verwachte waarde 𝑬(𝑿)

∑ 𝑥𝑖 ∗ 𝑚𝑎𝑟𝑔𝑖𝑛𝑎𝑙𝑒 𝑘𝑎𝑛𝑠𝑣𝑒𝑟𝑑𝑒𝑙𝑖𝑛𝑔

𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)

𝐸(𝑋 − 𝑌) = 𝐸(𝑋) − 𝐸(𝑌)

𝐸(𝑋𝑌) = 𝐸(𝑋)𝐸(𝑌)

𝐸(𝑋/𝑌) ≠ 𝐸(𝑋)/𝐸(𝑌)

𝐸(𝑋/𝑌) = 𝐸(𝑋)𝐸(1/𝑌)
als onafhankelijk!!!
als onafhankelijk!!!
VOORWAARDELIJKE VERWACHTE WAARDEN

Hetzelfde als hierboven

Voorwaardelijke kansverdeling/dichtheid gebruik ipv de gewone afzonderlijke (marginale)

Eerst voorwaardelijke kansverdeling/dichtheid berekenen, daarna pas verwachte waarde
KANSVERDELING/KANSDICHTHEID VAN FUNCTIES VAN KANSVARIABELEN


Op dezelfde manier als in hoofdstuk 5
o
Berekeningen gewoon uitvoeren
o
Met deze resultaten verder werken
Stellingen en gevolgen reeds gezien in Hoofdstuk 9
28
H12: Covariantie - Correlatie - Variantie van lineaire functies
COVARIANTIE EN CORRELATIE
Begrippen

Hetzelfde als in hoofdstuk 3

Formule voor covariantie hier veralgemeend

Variantie hier opnieuw een speciaal geval van covariantie
 Covariantie van X met zichzelf is de variantie van X!

Als 𝑋 en 𝑌 onafhankelijk, dan is 𝑐𝑜𝑣(𝑋, 𝑌) = 0
 Omgekeerde niet altijd waar!!!
Lineair verband

Voor lineaire verband: 𝑌 = 𝑎𝑋 + 𝑏
o
Rechte met positieve helling (𝑎 > 0) 𝑐𝑜𝑟𝑟(𝑋, 𝑌) = +1
‘perfect’ positief
o
Rechte met negatieve helling (𝑎 < 0) 𝑐𝑜𝑟𝑟(𝑋, 𝑌) = −1
‘perfect’ negatief
o
Perfect horizontaal/ verticaal (𝑎 = 0) 𝑐𝑜𝑟𝑟(𝑋, 𝑌) = 𝑜𝑛𝑏𝑒𝑝𝑎𝑎𝑙𝑑
geen lineair verband

Het omgekeerde geldt ook!

𝑐𝑜𝑟𝑟(𝑋, 𝑌) en 𝑐𝑜𝑣(𝑋, 𝑌) geven enkel de graad van lineair verband!!!
o

Hoe meer de correlatie afwijkt van |1|, hoe minder lineair
Correlatie zegt iets over de sterkte van het verband, covariantie niet
Excel

COVARIANTIE(celbereik X , celbereik Y)

CORRELATIE(celbereik X , celbereik Y) of PEARSON(celbereik X , celbereik Y)
VARIANTIE VAN EEN LINEAIRE FUNCTIE VAN KANSVARIABELEN
Formule

Herbekijk bewijsje HBp179

Gevolg

o
𝑣𝑎𝑟(𝑋 + 𝑌) = 𝑣𝑎𝑟(𝑋) + 𝑣𝑎𝑟(𝑌) + 2𝑐𝑜𝑣(𝑋, 𝑌)
o
𝑣𝑎𝑟(𝑋 − 𝑌) = 𝑣𝑎𝑟(𝑋) + 𝑣𝑎𝑟(𝑌) − 2𝑐𝑜𝑣(𝑋, 𝑌)
Je kan de variantie natuurlijk ook gewoon bereken via de methode van substitutie zoals in H11
Voorbeeld belegging

Standaard deviatie als maatstaf voor risico van een portefeuille
o

Hoe hoger de 𝑠𝑡. 𝑑𝑒𝑣(𝑃𝑜𝑟𝑡𝑒𝑓𝑒𝑢𝑖𝑙𝑙𝑒), hoe groter het risisco
Gediversifieerde, gedomineerde en efficiënte portefeuilles
Covariantiematrix

Symmetrisch + positief semi-definiet

Stel de covariantiematrix van het vb van de belegging opnieuw!
29
Download