Frequentietabellen Eerste kolom de waarde of het gegeven ( vb leeftijden, beroepen,..) Tweede kolom AF : het aantal keren dat iets voorkomt ( eventueel turven) Derde kolom RF : het totaal aantal gegevens is 100% en hieruit berekenen we de RF Vierde kolom CAF : som van de bovenstaande AF Histogram en staafdiagram Een histogram verdeelt de waarden van een variabele in intervallen. In het histogram kun je het aantal (of percentage) waarnemingen aflezen dat in elk interval terechtkomt. Meestal kiest men intervallen van gelijke breedte. Men maakt een histogram bij een verdeling in klasse. Een staafdiagram lijkt op een histogram, maar er zijn toch wel een paar verschillen. Bij een staafdiagram vergelijkt men alleen de hoogte van de verschillende staafjes. De horizontale as hoeft geen schaalverdeling te hebben, maar kan ook bestaan uit losse objecten. Denk bijvoorbeeld aan kleuren of verschillende automerken. Omdat elk staafje in een staafdiagram een ander object voorstelt worden de staafjes meestal getekend met ruimte tussen de staafjes. Men maakt een staafdiagram van bijvoorbeeld de AF Cirkeldiagram In een cirkeldiagram geeft de grootte van de sectoren van een cirkel de frequenties weer. Vaak staan in de een cirkeldiagram de percentages erbij. Met een cirkeldiagram krijg je snel een overzicht van de verhoudingen. Het totale aantal gegevens = 360° Centrummaten Met centrummaten geef je het 'midden' van een verdeling aan. Bij veel verdelingen liggen de getallen 'rond' een bepaald getal. Met een centrummaat geef je aan waar de getallen zo'n beetje om heen liggen. De bekendste centrummaten zijn: het gemiddelde de mediaan de modus Het (rekenkundig) gemiddelde Om het gemiddelde van een aantal getallen te berekenen tel je alle getallen op en deel je de som door het aantal. Meestal gebruiken we voor het gemiddelde de notatie . Om het gemiddelde uit te rekenen moet je bij frequentietabellen altijd de klassenmiddens gebruiken. Je gaat er als het ware van uit dat het klassenmidden van een klasse het gemiddelde van die klasse is. Mediaan De mediaan is het midden van een verdeling, dat wil zeggen dat 50% van de getallen onder de mediaan ligt en 50% erboven. Je kunt ook zeggen: de mediaan is het middelste getal als je de getallen op volgorde van klein naar groot zet. Bij een oneven aantal getallen kan dat, maar bij een even aantal is het lastiger. In dat geval nemen we als mediaan het rekenkundig gemiddelde van de twee middelste getallen. Voor grote aantallen gegevens is deze methode niet erg handig. Een handige methode is de volgende: Bereken n=aantal/2. Als aantal even is dan is n een geheel getal en is de mediaan = (n-de+n+1ste )/2 Als aantal oneven is dan is n geen geheel getal en rond je af naar boven. Modus De modus van een serie getallen is het getal met de hoogste frequentie. Het getal wat het meeste voorkomt. De modus in een centrummaat. Variatie- of spreidingsbreedte De variatie- of spreidingsbreedte is een voorbeeld van een spreidingsmaat. Het is niets anders dan het verschil tussen de kleinste en de grootste waarneming. Deze spreidingsmaat is erg gevoelig voor uitschieters en wordt maar weinig gebruikt. Kwartielafstand De kwartielafstand is een spreidingsmaat. De kwartielafstand is het verschil tussen het derde en het eerste kwartiel. De mediaan verdeelt de gegevens in twee even grote stukken: 50% eronder en 50% erboven. Je kunt op deze manier een hoeveelheid gegevens ook in vieren verdelen. Dus in 4 stukken van elk 25% van de gegevens. De grenzen van deze vier gebieden worden kwartielen genoemd: q 1, q2 en q3. Uiteraard is q2 hetzelfde als de mediaan. De afstand van q1 en q3 is een maat voor spreiding. Je kunt q1 ook opvatten als de mediaan van de onderste helft en q3 als mediaan van de bovenste helft. Het bepalen van q1 en q3 lijkt erg veel op het bepalen van de mediaan. Boxplot Een boxplot is een grafische voorstelling waarmee je snel een overzicht van de verdeling van een verzameling gegevens kunt krijgen. Met boxplots kun je makkelijk verschillende verdelingen vergelijken. Hieronder staat een voorbeeld. In een boxplot kan je de kwartielen, de mediaan en de grootste en de kleinste waarde aflezen. Standaarddeviatie De spreidingsmaat die het meest gebruikt wordt is de standaard deviatie. Om de standaarddeviatie te berekenen neem je de volgende stappen: Bereken het gemiddelde. Neem van elk getal de afstand tot het gemiddelde Neem het kwadraat van die afstanden. Bereken het gemiddelde van die kwadraten. Neem de wortel van de uitkomst Hoe groter de standaarddeviatie hoe groter de verschillen tussen de verschillende waarnemingen.