Onderzoeksmethodiek LE: 2

advertisement
Onderzoeksmethodiek LE: 2
3 Parameters en grootheden
3.1 Parameters
Wat is een parameter?
Een karakteristieke grootheid van een populatie
à Gem. gewicht van een 34-jarige man
3.2 Steekproefgrootheden
Wat zijn steekproefgrootheden?
= Karakteristieke grootheden
= Getallen waarmee men alle waarnemingsuitkomsten als het ware kan karakteriseren of
samenvatten
4 Wat is een variabele?
Wat is een variabele?
Een kenmerk van een object dat telkens een andere waarde aanneemt bij meerdere waarnemingen
Wat is de uitkomst?
= De waarde van de variabele die meestal een getal oplevert
4.1 Kwantitatieve versus kwalitatieve variabele
Wat is een kwalitatieve variabele?
Een variabele waarbij de getalwaarde nauwelijks betekenis heeft.
Vb. Automerk van een persoon, vakantiebestemming 2011
Wat is een kwantitatieve variabele?
Een variabele dat voorgesteld wordt door een getal met een reële betekenis
Vb. Temperatuur op 1 juli, Aantal patiënten in UZ gent
4.2 Continue versus Discrete variabelen
Wat is een continue variabele?
KWANTITATIEVE variabele, uitgedrukt in een reëel getal. Ze kan elke waarde aannemen, met een
onbeperkt aantal decimalen
Vb. Het gewicht van een schat, de afstand afgelegd door een vertegenwoordiger
Wat is een discrete variabele?
KWANTITATIEVE die uitgedrukt word in een geheel getal
Vb. Aantal fietsen op school, Aantal studenten in studentenclub
Wat is een kansvariabele?
Continue of discrete kansvariabele waarvan het van het toeval afhangt welke waarde deze bij
waarneming zal aannemen
5 Het meetniveau van een variabele = schalen
5.1 Nominale en ordinale schaal
Wat is een nominale schaal?
KWALITATIEVE variabelen op geen enkele zinvolle manier in een bepaalde volgorde gerangschikt
worden
Vb. Kleur van Ogen, Geslacht, naam van politieke partijen
Wat is een ordinale schaal?
KWALITATIEVE variabelen in een bepaalde volgorde ordenen heeft wel zin
Vb. De smaak van pizza, De rang van militair
5.2 Intervalschaal en ratioschaal
Wat is een intervalschaal?
KWANTITATIEVE variabelen
= Het verschil tussen 2 waarnemingsuitkomsten is meetbaar en van betekenis, maar de
verhoudingen niet. Bovendien is er geen 0 punt
VB. Temperatuur en Tijd
Wat is een ratioschaal?
KWANITATIEVE variabelen
= het meetniveau is nog hoger. Er is een nulpunt aanwezig dat het mogelijk en vaak ook zinvol maakt
verschillende waarnemingsuitkomsten op elkaar te delen
Vb. 0 kinderen= geen kinderen MAAR!!! à 0°C is niet gelijk aan geen temperatuur
Vb. KG en kredieten
5.3 Eigenschappen van schalen
Er zijn 3 eigenschappen nl:
- Uitkomsten kunnen ondubbelzinnig gerangschikt worden
- Een meeteenheid bezitten, dwz dat de afstand tussen 2 uitkomsten een reële betekenis heeft
- Een nulpunt bezitten met een reële betekenis
Nominale
Schaal
Uitkomsten kunnen
ondubbelzinnig
gerangschikt worden
Een meeteenheid
bezitten
Een nulpunt bezitten
6 Gegevens verwerven
Wat is NIS?
Nationaal Instituut Statistiek
7 Oefeningen
Ordinale
Schaal
Interval
-Schaal
Ratio
- Schaal
x
x
x
x
x
x
Leereenheid 3: Het voorstellen van geg.
1 Inleiding
Enkel BESCHRIJVENDE STATISTIEK
2 Het samenstellen van tabellen
3 Soorten grafieken
3.1 Inleiding
3.2 Stereogram
Wat is een stereogram?
3D voorwerp uit hout, plastic vb. Maquette
3.3 Cartogram
Wat is een cartogram?
Landkaart waarop meestal aardrijkskundige verschijnselen zijn weergegeven door punten, kleuren
3.4 Diagram
Wat is een diagram?
Voorstelling op blad papier, gewoonlijk binnen een assenstelsel
Wanneer gebruikt men een scheurlijn?!!! EXAMEN VRAAG
Het voorkomen dat de laagste waarnemingsuitkomst zich ver van het nulpunt bevindt, terwijl de
overige uitkomsten dicht bij elkaar liggen.
à Voorkomen dat een groot deel van de grafiek ongebruikt blijft en de overige waarnemingen zo
dicht bij elkaar liggen, dat fluctuaties in het verloop niet goed zichtbaar worden
3.5 Soorten diagrammen
Welke soorten hebben we?
- Vlakdiagram
- Staafdiagram
- Stralendiagram
-Histogram
- Lijndiagram
3.5.1 Vlakdiagram
- Geen volgorde terugvinden
- Kwalitatieve variabelen
- Niet goed bij meer dan 6 onderverdelingen
3.5.2 Staafdiagram
- Start bij punt diagram
- Naalddiagram( naar beneden gaan)
3.5.3 Stralendiagram
- Basiswaarde = 100
3.5.4 HISTOGRAM!!!
- Horizontale as in gelijke delen verdeeld
- Men start niet bij 0
Wat is het doel?
1. Een goed beeld schetsen van de verdeling van een populatie volgens een bepaalde variabele.
2. Het laat ook toe om snel afwijkingen te ontdekken
Hoe wordt het globale patroon beschreven?
Via de vorm, het centrum en de spreiding
Waarop moet men letten bij de vorm?
1. Het aantal toppen: Er is maar 1 top/piek dan heet de verdeling unimodaal
2. De scheefheid: Symmetrisch, links scheef of rechts scheef
Wat bepaalt de scheefheid?
De ligging van de centrummaten, de spreiding en is ook belangrijk bij het interpreteren van gegevens
à Als men 2 pieken heeftè bimodale verdeling
3.5.5 Lijndiagram
- Continue evolutie
- Frequentiepolygoon: Kwantitatieve variabele voor te stellen als de variabele continu is
3.5.6 Boxplot
- 50 %
- Q1 en Q3
- Xmin en Xmax
- Zinvol om de verdeling van kwantitatief kenmerken weer te gevenà SIMPELE BOXPLOT
Doel van een boxplot?
We vinden in de boxplot een mediaan, het eerst en derde kwartiel e de variatiebreedte ( R= Xmax –
Xmin). We krijgen op die manier een goed beeld van de verdeling en de spreiding van de gegevens.
!!Als men over losse gegevens beschikt, worden de staarten soms anders getekend.
à Begrenzing van de staarten = 1,5 x (Q3-Q1) of de interkwartielafstandà voor de boxplot
à Tot aan de maximale gemeten waarde langs rechts
àGegevens die daar buitenvallen worden met afzonderlijke punten weergegeven.
è Gewone boxplot
3.5.7 Samengestelde, gestapelde en 100% diagrammen
Samengesteld: Lijn en Staaf
Links en rechts
Gestapeld: Lijn en staaf
Boven en onder
Voordeel: Lijnen snijden elkaar niets
à Om verwarring tegen te gaan tussen samengesteld en gestapeld lijndiagram arceert men de
ruimte tussen in
100%: Lijn en staaf
Totalen = 100%
Voordeel: Het relatieve aandeel van de kenmerken is zeer duidelijkà nadeel geen duidelijke cijfers
4 Frequentieverdelingen
4.1 Frequentieverdeling
Welke soorten frequenties hebben we?
- Absolute
- Relatieve
- Cumulatieve
4.1.1 Absolute frequentie
Wat is de absolute frequentie?
Het aantal keer dat een kenmerk X wordt waargenomen
4.1.2 Relatieve frequentie
Wat is de relatieve frequentie?
Absolute frequentie/ totale frequentie ( totaal aantal waarnemingen)
Decimalen of procenten
à Som = 1 of 100%
4.1.3 Cumulatieve frequentie
Wat is de cumulatieve?
Het aantal waarnemingen met een waarde of ranggetal kleiner dan of gelijk aan een bepaalde
grenswaarde m.a.w. hoeveel waarden in het schaalpunt en eronder zijn gelegen
4.2 Frequentietabel
Waarom gebruiken?
Het verdelen in klassen begint met opstellen van frequentietabel. Een ordening krijgen in de
getalmassa.
4.2.1 Opstellen van frequentietabel met gelijke klassenbreedte
- Klassen
- Klassengrenzen
- Klassebreedte
4.2.1.1 Interval
Wat is de totale lengte?
Het verschil tussen de hoogste en laagste meetwaarde
4.2.1.2 Histogram
Hoe maak je een histogram?
- Spreidingsbreedte= Hoogste – laagste meetwaarde in de steekproef
- Klassenbreedte= b = R/ √(n)
R= spreidingsbreedte
N= aantal steekproef elementen
- Klassengrenzen: wordt gevormd door waarden die veelvouden zijn van de gevonden
klassenbreedte in punt 2
- Klassemidden: Benedengrens+ Bovengrens/ 2
! Opgelet als men werkt men klassen bv van 4 en je hebt getal 80 bij start waar moet 84 dan in?
à we lossen dit op door 84 is een afgerond getal tussen 83,5 en 84,5
à De klassengrenzen worden verminderd met 0,5
Dan noteren we [ 79,5-83,5]
4.2.2 Klassen van ongelijke breedte
Ongelijke klassenà frequentiedichtheid
= De hoogte van een kolom bij een bepaalde klassen wordt bepaald door het quotiënt van het aantal
meetwaarden per klasse en bijhorende klasse breedte
à Frequenties delen door de verschillende klassenbreedteà frequentie per klasse
gestandaardiseerd
Fd= Frequentie/ klassebreedte= fi/ i
4.2.3 Frequentiepolygoon
Wat is een frequentiepolygoon?
Ontstaat door de frequentiedichtheid uit te zetten tegen de klassenmiddens en vervolgens deze
punten onderling te verbinden door rechte lijnstukken
4.3 Cumulatieve frequentieverdelingen
Relatief en Cum
Leereenheid 5: Centrummaten
1 Inleiding
2 Centrummaten bij niet- gegroepeerde gegevens
Welke 3 centrummaten kennen we?
- Het rekenkundig gemiddelde
- De mediaan
- De modus
2.1 Rekenkundig gemiddelde
Som van het aantal waarden/ aantal waarden
Van de populatie:
Van de steekproef:
Gewogen rekenkundig gemiddelde:
à als we met frequenties werken
2.2 De mediaan
Het middelste getal bij oneven waarnemingen
Even aantal waarnemingen= Rekenkundig gem. van de 2 middelste waarden
2.3 De modus
Wat is de modus?
Die waarde van de waarnemingsuitkomsten , die het meest voorkomt
3 Centrummaten bij gegroepeerde gegevens of
frequentieverdelingen
3.1 Het rekenkundig gemiddelde van een frequentieverdeling
Wat is het rekenkundig gemiddelde?
Frequentie (fi) x klassenmiddens mi/ aantal waarnemingen
3.2 Mediaan van een frequentieverdeling
Wat is de mediaanklasse?
De klasse waarin mediaan ligt
Me= Q2= 50%
à ondergrens+ percentage bovenklasse-percentage klasse
------------------------------------------------------------ x klassenbreedte
Breedte waarin 50 % ligt
3.3 Modus van een frequentieverdeling
Wat is de modale klasse?
Gelijke klassenbreedtes: de klasse met de hoogste frequentie
Ongelijke : de klasse met hoogste frequentie dichtheid
Modus via de formule:
f-fl
M0= b+ ------------------------- x i
(f- fl)+(f-fh)
Met:
b= benedengrens modale klasse
f= frequentie modale klasse
fl= frequentie lagere klasse
fh= frequentie hogere klasse
i= klassebreedte
Leereenheid 6: Kwantielen
1 Inleiding
Wat zijn kwantielen?
Uitgaande van de relatieve cumulatieve frequentieverdeling kan men alle meetwaarden verdelen in
intervallen met daarin gelijke frequenties
è Kwantielen= intervallen met gelijke frequenties
Welke 3 soorten kwantielen hebben we?
- Kwartielen
- Decielen
- Percentielen
2 Kwartielen
= as indelen in 4 kwartielen met ieder frequentie van 25%
Welke kwartielen hebben we?
1. 1ste kwartiel: Q1= 25%-punt
2. 2de kwartiel: Q2= 50%-punt= Q2=Me
3. 3de kwartiel: Q3= 75%-punt
3 Decielen
= as indelen in 10 intervallen met elk 10 % van de meetwaarden
D1= 10%
4 Percentielen
= as indelen in 100 intervallen met elk 1% van de meetwaarden
D1= P10
Q1= P25
Q2= Me= D5= P50
Q3= P75
Wat is de interkwartielafstand?
Het verschil tussen 3de en 1ste kwartiel: Q= Q3-Q1= P75- P25
Leereenheid 7: Spreidingsmaten
1 Inleiding
2 Spreidingsbreedte bij niet-gegroepeerde gegevens of
frequentieverdelingen
2.1 Spreidingsbreedte
Wat is de spreidingsbreedte?
Het verschil tussen de hoogste en de laagste uitkomst van een reeks waarnemingsuitkomsten
R= Xmax-Xmin
2.2 Variantie
Wat is de variantie?
De gemiddelde kwadratische afwijking t.o.v. het gemiddelde. In formulevorm
Steekproef:
Wat is het nadeel?
De variantie wordt als de som van het kwadraat van de afwijkingen, waardoor ook de eenheid,
waarin de variantie wordt uitgedrukt, kwadratisch is. à moeilijk te interpreteren
2.3 Standaardafwijking
Wat is de standaardafwijking?
De wortel uit de variantie
Formule= s =√s²
2.4 Variatiecoëfficiënt
Wat is de variatiecoëfficiënt?
Het quotiënt van de standaardafwijking en het rekenkundig gemiddelde
V= S/ x
à goed voor de spreiding van verschillende steekproeven
3 Spreidingsmaten bij gegroepeerde of frequentieverdelingen
3.1 Spreidingsbreedte
à verschil tussen bovengrens van de bovenste klasse en de ondergrens van de laagste klasse
à verschil tussen klassenmiddens hoogste en laagste klasse
3.2 Variantie
Formule:
3.3 Standaardafwijking
Formule:
Leereenheid 8: Synthese oefening
Download