Samenvattig door Kristof Heiremans SPSS SPSS Frequentietabel: Analyse D.S. frequenties Berekenen van variabelen: transform compute Enkel voor bepaalde groep if Tellen van waarden: transform count (->if) Waarden indelen in klassen: transform visual bounder Variabele hercoderen: transform recode into different variabeles Bepalen van de rangorde: transform rank cases o Rangnummer per groep: by Automatisch hercoderen: transform automatic recode Ontbrekende variabelen vervangen: transform replace missing values Analyseren van groepen: data split file o Compose: groepen met elkaar vergelijken o Analyse: zelfde analyse voor meerdere groepen o Analyse all cases = split file uitzetten Selecteren van waarnemingen: data select cases o All o If o Random (steekproef) o Lose range (waarneming nummer) o Filter o Vb.: MISSING(…) voorwaardelijk selecteren Voor niet ontbrekende waarden Wegen van waarnemingen: data weight cases Sorteren van waarnemingen: data sort cases Toevoegen van waarnemingen: data merge files add cases o 2 bestanden met dezelfde variabelen maar met verschillende waarnemingen samenvoegen o zelfde variabelen maar andere naam pair o ongepaarde variabelen veranderen van naam rename o vastleggen bron (0=data editor, 1=andere) indicate case source as variable toevoegen van variabelen: data merge files add variables o 2 bestanden met zelfde waarnemingen maar met verschillende variabelen samenvoegen o key variable: enkel waarnemingen samenvoegen als ze zelfde waarden hebben voor sleutelwaarde samenvoegen van waarnemingen met aggregate: dataaggregate o waarnemingen per groep samenvoegen o break: nieuwe variabelen herstructureren van het gegevensbestand: data restructure o rijen kolommen of omgekeerd opdelen van waarnemingen (elke waarneming bevat meerdere waarnemingen) 2004-2005 Departement BEST Hogeschool gent 1 Samenvattig door Kristof Heiremans SPSS omzetten van variabelen in waarnemingen (omgekeerde van bovenste) kantelen rijen kolommen o opdelen van waarnemingen: stap 2: hoeveel groepen veriabelen stap 3: variabele opgeven waarmee waarnemingen worden onderscheiden (case group ID) variabele opgeven die waarnemingen gaan vormen (target variable) variabelen die rijen moeten gaan vormen stap 4: index opgeven (# variabelen nodig om index te vormen om te kunnen terugkeren) stap 5: opgeven welke voorwaarden deze nieuwe index variabele moet hebben (nummers of omschrijving) stap 6:ontbrekende waarden o omzetten van variabelen stap 2: welke variabele bepaalt in nieuwe bestand de indeling in waarnemingen index opgeven: variabele die gesplitst gaat worden stap 3: al gesorteerd? Stap 4: volgorde, tellen hoeveel waarnemingen worden samengevoegd o Variabelen opgeven die getransponeerd worden Name variable: welke naam nieuwe variabelen moeten hebben Frequentietabel: analyse D.S. decriptives o Maakt tabel : rijen : variabelen, kolommen:kengetallen verschil met statistics o Options : andere kengetallen opvragen Beoordelen van verdeling met explore: analyze D.S. explore (voor continue variabelen = interval of ratio) o Dep. List : variabele opgeven waarvan kengetallen en diagrammen moet berekend worden o Fac. List: groepen onderscheiden Staafdiagram: graphs bar o Enkelvoudig o Gegroepeerd o Gestapeld o Per groep waarnemingen o Per vaiabele o Per waarneming Lijngrafiek: graphs line o 1 lijn o meerdere o meerdere (verticaal) Opp. Grafiek: graphs area o 1 opp o meerdere (gestapeld) cirkel grafiek: graphs pie hoog-laag diagrammen: graphs high-low 2004-2005 Departement BEST Hogeschool gent 2 Samenvattig door Kristof Heiremans SPSS o 3 (hoog, laag, eind) o idem, maar voor 2 groepen o bereik, staafdiagram (per meting verschil tss hoog en laag) zelfde groep moet steeds de hoogste waarde hebben(1) o idem voor 2 groepen o verschillen lijngrafiek, geen voorwaarde(2) (1) bereik staafdiagrammen: graphs high-low simple range bar define 2 groups by (2de keer uitsplitsten) (2) graphs high-low difference area (heeft voorkeur) boxdiagrammen: graphs boxplot o simple : 1 of meerdere variabelen of groepen o clustered uitgesplitst geeft info over verdeling van een variabele cases: hoofdindeling groen / variables: hoofdindeling variabele, Histogram: graphs histogram, per reeks waarden een staaf o Staafdiagram voor continue variabelen Normale verdelingsdiagrammen: graphs o p-p (waarschijnlijkheid) o q-q (kwartiel) o voor as : cumulatieve proportionele verdeling van een variabele o waargenomen waarden van een variabele, ingedeeld in klassen 1e grafiek: verticale as: normale verdeling 2e grafiek: verticale as: afwijking ten opzicht van de normale verdeling chart editor: assen verwisselen: transpose chart kruistabel: analyse D.S. crosstabs (geven inzicht in verband tss 2 variabelen) o enkel voor nominale en ordinale variabelen o onafhankelijke variabele rij afhankelijke variabelen kolom o layer: variabelen voor elke waarde van variabele een afzonderlijke kruistabel o cells: informatie in cellen: # waarnemingen, %, resideren, wegen chi-kwadraattoets: statistics (vaststellen of 2 nominale variabelen onafh. Van elkaar zijn) o H0: geen verband H1: wel verband Asympsig (kans dat als Z variabelen onafh zijn, de berekend chi² zou opleveren) Overschrijdingskans genoemd (sygnificantie of p-waarde) Grens 0,05 (sygnificantie moet < grens om H0 te verwerpen) o Voorwaarden: Verwachte frequencies minimaal 1 Max 20 % verwachte frequencies < 5 Multiple response set : analyze multiple response define sets o Dichotome : 2 waarden Frequentietabel van een set: analyze multiple response frequencies Kruistabel maken van een set : analyze multiple response crosstabs o Define range (column) : welke reeks waarden moet worden opgenomen 2004-2005 Departement BEST Hogeschool gent 3 Samenvattig door Kristof Heiremans SPSS Beschrijven van groepen met means: analyze compare means means (van elke groep kengetallen berekenen) o Variabelen die groepsindeling bepaalt = onafh variabele (nominaal of ordinaal) Variabelen waar kengetallen berekend worden = afh variabelen (interval of ratio) o onderscheiden van subgroepen : NEXT (meerdere layers) o options: berekenen van kengetallen steekproefgemiddelde toetsen aan andere waarden: analyze compare means one sample T test o H0: steekproefgemiddelde: andere gemiddelde H1: … ≠ … s of < of > Bepaalt representativiteit (als repr is, dan moet gem = populatie gem., niet omdraaien) Voorwaarde verdeling van steekproef ongeveer verdeling populatie (chi²). Indien niet niet parametrische toets als sign. > 0,05 niet verwerpen Gemiddelden toetsen bij 2 groepen: analyze compare means indepentent samples T test o Testen of gemiddelde van 2 groepen aan elkaar gelijk zijn voorwaarden: interval of ratiovariabele uit aselecte stekkproeven uit normaal verdeelde populatie H0: gem1 = gem2 : beide groepen onafh van elkaar, anders gepaarde t-toets o Equal variances of niet: Levene-toets: H0:ja sign < 0,05 H0 verwerpen voor eenzijdig toetsen: sign delen door 2 define groups: use spec values: nominaal cut point : continue gepaarde t-toets: analyze compare means paired sample T test o hoe dichterde correlatie bij 1 ligt, hoe effectiever de gepaarde T-toets variantie analyze: o meer groepen dan T-toets o voorwaarde: idem als T-toets + varianties chi anders Vruskal-Wallis of mediaantoets variabelen die groepsindeling bepalen = factoren (numeriek) met 1 factor, One Way ANOVA: analyze compare means one-way anova bij H0 verwerpen: minimaal 2 verschillende gemiddelden (kijken met posthoc) options : Bronn-Forsythe en Welch als varianties verschillen controlleren door variance test of descriptive grootste kleinste standaarddeviatie < 2 OK meerdere factoren (GLM): analyze general lineair model univarantie of GLM profile plots: niet parallele lijnen = interactie correlatie en regressieanalyse: als er een lineair verband word verondersteld tss 2 of meer interval of ratiogeschaalde intervallen o geeft indruk van de samenhang 2004-2005 Departement BEST Hogeschool gent 4 Samenvattig door Kristof Heiremans SPSS o probeert numerieke verklaring te geven van de afhankelijke veriabele door 1 of meer onafhankelijke variabelen correlatie tss 2 variabelen o voorwaarde: variabelen interval of ratiogeschaald, steekproef afkomstig uit bivariate normaalverdeling voor elke waarde van de ene variabele is de andere normaal verdeeld en omgekeerd o best eerst spreidingsdiagram maken om te zien of het nuttig is verband: rechte lijn of niet(=correlatiecoëfficiënt ongeveer 0 sterke samenhang maar niet lineair o verband tussen 2 ongeacht invloed van andere bivariantie correlatie (analyze corr bivariatie) o corrigeren voor andere partiële correlatie niet voldaan aan pearson correlatiecoëfficiënt: o nominaal: chi², phi-coëf o ordinaal: spearman, correlatiecoëf, Vendell’s Taer o correlatie coëf ongeveer 1 lineair verband + als ene stijgt andere ook sign: H0 geen verband eenzijdig: one-tailed o analyze correlatie partial interpretatie idem regressieanalyse : lineair verband schatten tussen 1 afh en 1 of meer onafh variabelen o er worden causaal verband verondersteld o verschijnsel dat we willen verklaren veronderstellingen: interval of ratio lineair verband of wiskundig bekende (curve estimation) voorwaarde van onafhankelijke waarde is afhankelijk van normaal verdeeld variantie van afhankelijk variabele voor elke waarde van de onafhankelijk van gelijk zijn. Eerst spreidingsdiagram (lineair) en correlatieanalyse( samenhang afh en onafhankelijk var.) Lineaire regressie: analyze regression lineair o R: correlatiecoëf R= determinantiecoëff o H0: alle regressiecoëf met uitzondering van de constante = 0 o H1: minimum 1 coëff verschillend van 0 anova: regression: verklaarde variantie residurel: niet verklaarde variantie o Coëff: als var(b) en var2(b) positief is dan als het 1 stijgt het andere ook o T-toets: H0 : regressiecoëff = 0 2004-2005 Departement BEST Hogeschool gent 5 Samenvattig door Kristof Heiremans SPSS Best : 1 voor 1 onafhankelijk toevoegen en kijken of k² niet teveel stijgt F-toets Omgekeerde methode: idem maar voor 1 verwijderen F-to-remove Enter: 1 regressievergelijking met alle variabelen Forward: 1 voor 1 toegevoegd Backward: 1 voor 1 verwijderd Stepwise: combinatie enter en forward F-to-remove > F-toenter Remove: als onafhanklijk variabele in groepen Regressie bij kromlijnige verbanden: 1 onafhankelijk variabele curve estimation , anders eerst transformeren Kromlijnige regressieanalyse: analyzeregressioncurve estimation zie p 305-308 o Eerst kijken of verband wel lineair is (spreidingsdiagram) welk Model ? o spreidingsdiagram o modellen o vergelijking welk beste is niet-parametrische toetsen: als niet aan voorwaarde van andere toetsen voldaan is overzicht p 309 o chi²-toets: bepalen of waargenomen freq. In verschillende categ. Voorkomen met verwachte freq. Verdeling van variabele toetsen (testen of steekproef representatief is) H0: waargenomen verdeling ongeveer verwachte verdeling o Analyzenon parametric chi-square Binomiale toets: analyzeN-Pbinomial (onderzoeken of gegevens bevestigen dat er een kans p is op een bep waarde van een variabele) H0: bv.: bij sexe is kans 50% dat iemand mannelijk is Runs-toets: analyzeN-PRuns (vaststellen of geg. In willekeurige volgorde zijn verzameld) H0: willekeurige volgorde o Runs zeer hoog: bv.: oud,jong,oud,jong o Runs zeer laag: bv.: oud,oud,oud,oud,jong,jong Kolmogaron-smirnov: analyzeN-P1-Sample K-S (bepaalt of waargenomen verdeling ongeveer theoretische verdeling) Ook gebruikt om te kijken of 2 steekproeven uit zelfde populatie komen H0: theorieverdeeld 2004-2005 Departement BEST Hogeschool gent 6 Samenvattig door Kristof Heiremans SPSS Toetsen bij 2 onafhankelijke groepen (aantonen of gemiddelde van 2 onafhankelijke steekproeven gelijk zijn). Vergelijking met T-toets: t-toets voorkeur tenzij: -niet interval of ratio -niet normaal verdeeld 1 of 2 ? 1) bij grote steekproeven 2) bij kleine steekproeven 1. Mann-Whitney of Wilconon : analyze N-P 2 independent samples (toetsen of 2 onafhankelijke steekproeven uit populaties met zelfde verdeling komen) a. H0: zelfde verdeling (gemiddelden gelijk) 2. Kolmogarov-Smirnov voor 2 groepen: idem (K-S Z aanvinken) Toetsen bij 2 of meer onafhankelijke groepen: vergelijking variantieanalyse: variantieanalyse nemen tenzij niet aan voorwaarde wordt voldaan. 1 of 2 ? 1) voorkeur 2) als exacte waarden van een aantal extreme waarden niet bekend zijn. 1. analyze nonparametric independent samples a. (uitbreiding Mann - Whitney) H0: zelfde verdeling (gemiddelde gelijk) 2. mediaan toets: idem maar mediaan aanvinken Toetsen bij 2 gerelateerde groepen: afhankelijke steekproeven Tenzij voorwaarden niet voldaan altijd gepaarde T-toets gebruiken 1 of 2 ? beter 1 tenzij u geeft informatie over de omvang van het verschil hebt 1. Wilcoxon signed ranks : analyze N-P 2 related samples (hebben 2 afhankelijke steekproeven zelfde mediaan en verdeling ?) H0: zelfde mediaan en verdeling 2. Tekentoets: idem maar sign. Aanvinken Bij 2 of meer gerelateerde groepen: Wij zien enkel ordinaal (bv.: rapportcijfer of 5-puntenschaal) o H0: mediaan is gelijk o Analyze N-P K related samples 2004-2005 Departement BEST Hogeschool gent 7