Onderzoeksmethodiek LE: 2 3 Parameters en grootheden 3.1 Parameters Wat is een parameter? Een karakteristieke grootheid van een populatie à Gem. gewicht van een 34-jarige man 3.2 Steekproefgrootheden Wat zijn steekproefgrootheden? = Karakteristieke grootheden = Getallen waarmee men alle waarnemingsuitkomsten als het ware kan karakteriseren of samenvatten 4 Wat is een variabele? Wat is een variabele? Een kenmerk van een object dat telkens een andere waarde aanneemt bij meerdere waarnemingen Wat is de uitkomst? = De waarde van de variabele die meestal een getal oplevert 4.1 Kwantitatieve versus kwalitatieve variabele Wat is een kwalitatieve variabele? Een variabele waarbij de getalwaarde nauwelijks betekenis heeft. Vb. Automerk van een persoon, vakantiebestemming 2011 Wat is een kwantitatieve variabele? Een variabele dat voorgesteld wordt door een getal met een reële betekenis Vb. Temperatuur op 1 juli, Aantal patiënten in UZ gent 4.2 Continue versus Discrete variabelen Wat is een continue variabele? KWANTITATIEVE variabele, uitgedrukt in een reëel getal. Ze kan elke waarde aannemen, met een onbeperkt aantal decimalen Vb. Het gewicht van een schat, de afstand afgelegd door een vertegenwoordiger Wat is een discrete variabele? KWANTITATIEVE die uitgedrukt word in een geheel getal Vb. Aantal fietsen op school, Aantal studenten in studentenclub Wat is een kansvariabele? Continue of discrete kansvariabele waarvan het van het toeval afhangt welke waarde deze bij waarneming zal aannemen 5 Het meetniveau van een variabele = schalen 5.1 Nominale en ordinale schaal Wat is een nominale schaal? KWALITATIEVE variabelen op geen enkele zinvolle manier in een bepaalde volgorde gerangschikt worden Vb. Kleur van Ogen, Geslacht, naam van politieke partijen Wat is een ordinale schaal? KWALITATIEVE variabelen in een bepaalde volgorde ordenen heeft wel zin Vb. De smaak van pizza, De rang van militair 5.2 Intervalschaal en ratioschaal Wat is een intervalschaal? KWANTITATIEVE variabelen = Het verschil tussen 2 waarnemingsuitkomsten is meetbaar en van betekenis, maar de verhoudingen niet. Bovendien is er geen 0 punt VB. Temperatuur en Tijd Wat is een ratioschaal? KWANITATIEVE variabelen = het meetniveau is nog hoger. Er is een nulpunt aanwezig dat het mogelijk en vaak ook zinvol maakt verschillende waarnemingsuitkomsten op elkaar te delen Vb. 0 kinderen= geen kinderen MAAR!!! à 0°C is niet gelijk aan geen temperatuur Vb. KG en kredieten 5.3 Eigenschappen van schalen Er zijn 3 eigenschappen nl: - Uitkomsten kunnen ondubbelzinnig gerangschikt worden - Een meeteenheid bezitten, dwz dat de afstand tussen 2 uitkomsten een reële betekenis heeft - Een nulpunt bezitten met een reële betekenis Nominale Schaal Uitkomsten kunnen ondubbelzinnig gerangschikt worden Een meeteenheid bezitten Een nulpunt bezitten 6 Gegevens verwerven Wat is NIS? Nationaal Instituut Statistiek 7 Oefeningen Ordinale Schaal Interval -Schaal Ratio - Schaal x x x x x x Leereenheid 3: Het voorstellen van geg. 1 Inleiding Enkel BESCHRIJVENDE STATISTIEK 2 Het samenstellen van tabellen 3 Soorten grafieken 3.1 Inleiding 3.2 Stereogram Wat is een stereogram? 3D voorwerp uit hout, plastic vb. Maquette 3.3 Cartogram Wat is een cartogram? Landkaart waarop meestal aardrijkskundige verschijnselen zijn weergegeven door punten, kleuren 3.4 Diagram Wat is een diagram? Voorstelling op blad papier, gewoonlijk binnen een assenstelsel Wanneer gebruikt men een scheurlijn?!!! EXAMEN VRAAG Het voorkomen dat de laagste waarnemingsuitkomst zich ver van het nulpunt bevindt, terwijl de overige uitkomsten dicht bij elkaar liggen. à Voorkomen dat een groot deel van de grafiek ongebruikt blijft en de overige waarnemingen zo dicht bij elkaar liggen, dat fluctuaties in het verloop niet goed zichtbaar worden 3.5 Soorten diagrammen Welke soorten hebben we? - Vlakdiagram - Staafdiagram - Stralendiagram -Histogram - Lijndiagram 3.5.1 Vlakdiagram - Geen volgorde terugvinden - Kwalitatieve variabelen - Niet goed bij meer dan 6 onderverdelingen 3.5.2 Staafdiagram - Start bij punt diagram - Naalddiagram( naar beneden gaan) 3.5.3 Stralendiagram - Basiswaarde = 100 3.5.4 HISTOGRAM!!! - Horizontale as in gelijke delen verdeeld - Men start niet bij 0 Wat is het doel? 1. Een goed beeld schetsen van de verdeling van een populatie volgens een bepaalde variabele. 2. Het laat ook toe om snel afwijkingen te ontdekken Hoe wordt het globale patroon beschreven? Via de vorm, het centrum en de spreiding Waarop moet men letten bij de vorm? 1. Het aantal toppen: Er is maar 1 top/piek dan heet de verdeling unimodaal 2. De scheefheid: Symmetrisch, links scheef of rechts scheef Wat bepaalt de scheefheid? De ligging van de centrummaten, de spreiding en is ook belangrijk bij het interpreteren van gegevens à Als men 2 pieken heeftè bimodale verdeling 3.5.5 Lijndiagram - Continue evolutie - Frequentiepolygoon: Kwantitatieve variabele voor te stellen als de variabele continu is 3.5.6 Boxplot - 50 % - Q1 en Q3 - Xmin en Xmax - Zinvol om de verdeling van kwantitatief kenmerken weer te gevenà SIMPELE BOXPLOT Doel van een boxplot? We vinden in de boxplot een mediaan, het eerst en derde kwartiel e de variatiebreedte ( R= Xmax – Xmin). We krijgen op die manier een goed beeld van de verdeling en de spreiding van de gegevens. !!Als men over losse gegevens beschikt, worden de staarten soms anders getekend. à Begrenzing van de staarten = 1,5 x (Q3-Q1) of de interkwartielafstandà voor de boxplot à Tot aan de maximale gemeten waarde langs rechts àGegevens die daar buitenvallen worden met afzonderlijke punten weergegeven. è Gewone boxplot 3.5.7 Samengestelde, gestapelde en 100% diagrammen Samengesteld: Lijn en Staaf Links en rechts Gestapeld: Lijn en staaf Boven en onder Voordeel: Lijnen snijden elkaar niets à Om verwarring tegen te gaan tussen samengesteld en gestapeld lijndiagram arceert men de ruimte tussen in 100%: Lijn en staaf Totalen = 100% Voordeel: Het relatieve aandeel van de kenmerken is zeer duidelijkà nadeel geen duidelijke cijfers 4 Frequentieverdelingen 4.1 Frequentieverdeling Welke soorten frequenties hebben we? - Absolute - Relatieve - Cumulatieve 4.1.1 Absolute frequentie Wat is de absolute frequentie? Het aantal keer dat een kenmerk X wordt waargenomen 4.1.2 Relatieve frequentie Wat is de relatieve frequentie? Absolute frequentie/ totale frequentie ( totaal aantal waarnemingen) Decimalen of procenten à Som = 1 of 100% 4.1.3 Cumulatieve frequentie Wat is de cumulatieve? Het aantal waarnemingen met een waarde of ranggetal kleiner dan of gelijk aan een bepaalde grenswaarde m.a.w. hoeveel waarden in het schaalpunt en eronder zijn gelegen 4.2 Frequentietabel Waarom gebruiken? Het verdelen in klassen begint met opstellen van frequentietabel. Een ordening krijgen in de getalmassa. 4.2.1 Opstellen van frequentietabel met gelijke klassenbreedte - Klassen - Klassengrenzen - Klassebreedte 4.2.1.1 Interval Wat is de totale lengte? Het verschil tussen de hoogste en laagste meetwaarde 4.2.1.2 Histogram Hoe maak je een histogram? - Spreidingsbreedte= Hoogste – laagste meetwaarde in de steekproef - Klassenbreedte= b = R/ √(n) R= spreidingsbreedte N= aantal steekproef elementen - Klassengrenzen: wordt gevormd door waarden die veelvouden zijn van de gevonden klassenbreedte in punt 2 - Klassemidden: Benedengrens+ Bovengrens/ 2 ! Opgelet als men werkt men klassen bv van 4 en je hebt getal 80 bij start waar moet 84 dan in? à we lossen dit op door 84 is een afgerond getal tussen 83,5 en 84,5 à De klassengrenzen worden verminderd met 0,5 Dan noteren we [ 79,5-83,5] 4.2.2 Klassen van ongelijke breedte Ongelijke klassenà frequentiedichtheid = De hoogte van een kolom bij een bepaalde klassen wordt bepaald door het quotiënt van het aantal meetwaarden per klasse en bijhorende klasse breedte à Frequenties delen door de verschillende klassenbreedteà frequentie per klasse gestandaardiseerd Fd= Frequentie/ klassebreedte= fi/ i 4.2.3 Frequentiepolygoon Wat is een frequentiepolygoon? Ontstaat door de frequentiedichtheid uit te zetten tegen de klassenmiddens en vervolgens deze punten onderling te verbinden door rechte lijnstukken 4.3 Cumulatieve frequentieverdelingen Relatief en Cum Leereenheid 5: Centrummaten 1 Inleiding 2 Centrummaten bij niet- gegroepeerde gegevens Welke 3 centrummaten kennen we? - Het rekenkundig gemiddelde - De mediaan - De modus 2.1 Rekenkundig gemiddelde Som van het aantal waarden/ aantal waarden Van de populatie: Van de steekproef: Gewogen rekenkundig gemiddelde: à als we met frequenties werken 2.2 De mediaan Het middelste getal bij oneven waarnemingen Even aantal waarnemingen= Rekenkundig gem. van de 2 middelste waarden 2.3 De modus Wat is de modus? Die waarde van de waarnemingsuitkomsten , die het meest voorkomt 3 Centrummaten bij gegroepeerde gegevens of frequentieverdelingen 3.1 Het rekenkundig gemiddelde van een frequentieverdeling Wat is het rekenkundig gemiddelde? Frequentie (fi) x klassenmiddens mi/ aantal waarnemingen 3.2 Mediaan van een frequentieverdeling Wat is de mediaanklasse? De klasse waarin mediaan ligt Me= Q2= 50% à ondergrens+ percentage bovenklasse-percentage klasse ------------------------------------------------------------ x klassenbreedte Breedte waarin 50 % ligt 3.3 Modus van een frequentieverdeling Wat is de modale klasse? Gelijke klassenbreedtes: de klasse met de hoogste frequentie Ongelijke : de klasse met hoogste frequentie dichtheid Modus via de formule: f-fl M0= b+ ------------------------- x i (f- fl)+(f-fh) Met: b= benedengrens modale klasse f= frequentie modale klasse fl= frequentie lagere klasse fh= frequentie hogere klasse i= klassebreedte Leereenheid 6: Kwantielen 1 Inleiding Wat zijn kwantielen? Uitgaande van de relatieve cumulatieve frequentieverdeling kan men alle meetwaarden verdelen in intervallen met daarin gelijke frequenties è Kwantielen= intervallen met gelijke frequenties Welke 3 soorten kwantielen hebben we? - Kwartielen - Decielen - Percentielen 2 Kwartielen = as indelen in 4 kwartielen met ieder frequentie van 25% Welke kwartielen hebben we? 1. 1ste kwartiel: Q1= 25%-punt 2. 2de kwartiel: Q2= 50%-punt= Q2=Me 3. 3de kwartiel: Q3= 75%-punt 3 Decielen = as indelen in 10 intervallen met elk 10 % van de meetwaarden D1= 10% 4 Percentielen = as indelen in 100 intervallen met elk 1% van de meetwaarden D1= P10 Q1= P25 Q2= Me= D5= P50 Q3= P75 Wat is de interkwartielafstand? Het verschil tussen 3de en 1ste kwartiel: Q= Q3-Q1= P75- P25 Leereenheid 7: Spreidingsmaten 1 Inleiding 2 Spreidingsbreedte bij niet-gegroepeerde gegevens of frequentieverdelingen 2.1 Spreidingsbreedte Wat is de spreidingsbreedte? Het verschil tussen de hoogste en de laagste uitkomst van een reeks waarnemingsuitkomsten R= Xmax-Xmin 2.2 Variantie Wat is de variantie? De gemiddelde kwadratische afwijking t.o.v. het gemiddelde. In formulevorm Steekproef: Wat is het nadeel? De variantie wordt als de som van het kwadraat van de afwijkingen, waardoor ook de eenheid, waarin de variantie wordt uitgedrukt, kwadratisch is. à moeilijk te interpreteren 2.3 Standaardafwijking Wat is de standaardafwijking? De wortel uit de variantie Formule= s =√s² 2.4 Variatiecoëfficiënt Wat is de variatiecoëfficiënt? Het quotiënt van de standaardafwijking en het rekenkundig gemiddelde V= S/ x à goed voor de spreiding van verschillende steekproeven 3 Spreidingsmaten bij gegroepeerde of frequentieverdelingen 3.1 Spreidingsbreedte à verschil tussen bovengrens van de bovenste klasse en de ondergrens van de laagste klasse à verschil tussen klassenmiddens hoogste en laagste klasse 3.2 Variantie Formule: 3.3 Standaardafwijking Formule: Leereenheid 8: Synthese oefening