SPSS - TI Aalst

advertisement
Samenvattig door Kristof Heiremans
SPSS
SPSS















Frequentietabel: Analyse  D.S.  frequenties
Berekenen van variabelen: transform  compute
Enkel voor bepaalde groep  if
Tellen van waarden: transform  count (->if)
Waarden indelen in klassen: transform  visual bounder
Variabele hercoderen: transform  recode  into different variabeles
Bepalen van de rangorde: transform  rank cases
o Rangnummer per groep: by
Automatisch hercoderen: transform  automatic recode
Ontbrekende variabelen vervangen: transform  replace missing values
Analyseren van groepen: data  split file
o Compose: groepen met elkaar
vergelijken
o Analyse: zelfde analyse voor
meerdere groepen
o Analyse all cases = split file uitzetten
Selecteren van waarnemingen: data  select cases
o All
o If
o Random (steekproef)
o Lose range (waarneming
nummer)
o Filter
o Vb.: MISSING(…)  voorwaardelijk selecteren
 Voor niet ontbrekende waarden
Wegen van waarnemingen: data  weight cases
Sorteren van waarnemingen: data  sort cases
Toevoegen van waarnemingen: data  merge files  add cases
o 2 bestanden met dezelfde variabelen maar met verschillende
waarnemingen samenvoegen
o zelfde variabelen maar andere naam  pair
o ongepaarde variabelen veranderen van naam  rename
o vastleggen bron (0=data editor, 1=andere)  indicate case source as
variable
toevoegen van variabelen: data  merge files  add variables
o 2 bestanden met zelfde waarnemingen maar met verschillende
variabelen samenvoegen
o key variable: enkel waarnemingen samenvoegen als ze zelfde waarden
hebben voor sleutelwaarde
samenvoegen van waarnemingen met aggregate: dataaggregate
o waarnemingen per groep samenvoegen
o break: nieuwe variabelen
herstructureren van het gegevensbestand: data  restructure
o rijen  kolommen of omgekeerd
 opdelen van waarnemingen (elke waarneming bevat meerdere
waarnemingen)
2004-2005
Departement BEST Hogeschool gent
1
Samenvattig door Kristof Heiremans
SPSS








omzetten van variabelen in waarnemingen (omgekeerde van
bovenste)
 kantelen rijen  kolommen
o opdelen van waarnemingen:
 stap 2: hoeveel groepen veriabelen
 stap 3:
 variabele opgeven waarmee waarnemingen worden
onderscheiden (case group ID)
 variabele opgeven die waarnemingen gaan vormen
(target variable)
 variabelen die rijen moeten gaan vormen
 stap 4: index opgeven (# variabelen nodig om index te vormen
om te kunnen terugkeren)
 stap 5: opgeven welke voorwaarden deze nieuwe index
variabele moet hebben (nummers of omschrijving)
 stap 6:ontbrekende waarden
o omzetten van variabelen
 stap 2: welke variabele bepaalt in nieuwe bestand de indeling in
waarnemingen
 index opgeven: variabele die gesplitst gaat worden
 stap 3: al gesorteerd?
 Stap 4: volgorde, tellen hoeveel waarnemingen worden
samengevoegd
o Variabelen opgeven die getransponeerd worden
 Name variable: welke naam nieuwe variabelen moeten hebben
Frequentietabel: analyse  D.S.  decriptives
o Maakt tabel : rijen : variabelen, kolommen:kengetallen  verschil met
statistics
o Options : andere kengetallen opvragen
Beoordelen van verdeling met explore: analyze  D.S.  explore (voor
continue variabelen = interval of ratio)
o Dep. List : variabele opgeven waarvan kengetallen en diagrammen
moet berekend worden
o Fac. List: groepen onderscheiden
Staafdiagram: graphs  bar
o Enkelvoudig
o Gegroepeerd
o Gestapeld
o Per groep waarnemingen
o Per vaiabele
o Per waarneming
Lijngrafiek: graphs  line
o 1 lijn
o meerdere
o meerdere (verticaal)
Opp. Grafiek: graphs  area
o 1 opp
o meerdere (gestapeld)
cirkel grafiek: graphs  pie
hoog-laag diagrammen: graphs  high-low
2004-2005
Departement BEST Hogeschool gent
2
Samenvattig door Kristof Heiremans









SPSS
o 3 (hoog, laag, eind)
o idem, maar voor 2 groepen
o bereik, staafdiagram (per meting verschil tss hoog en laag) zelfde groep
moet steeds de hoogste waarde hebben(1)
o idem voor 2 groepen
o verschillen lijngrafiek, geen voorwaarde(2)
 (1) bereik staafdiagrammen: graphs  high-low  simple range
bar
 define 2 groups by (2de keer uitsplitsten)
 (2) graphs  high-low  difference area (heeft voorkeur)
boxdiagrammen: graphs boxplot
o simple : 1 of meerdere variabelen of groepen
o clustered  uitgesplitst
 geeft info over verdeling van een variabele
 cases: hoofdindeling groen / variables: hoofdindeling variabele,
Histogram: graphs  histogram, per reeks waarden een staaf
o Staafdiagram voor continue variabelen
Normale verdelingsdiagrammen: graphs 
o p-p (waarschijnlijkheid)
o q-q (kwartiel)
o voor as : cumulatieve proportionele verdeling van een variabele
o waargenomen waarden van een variabele, ingedeeld in klassen
 1e grafiek: verticale as: normale verdeling
 2e grafiek: verticale as: afwijking ten opzicht van de normale
verdeling
chart editor: assen verwisselen: transpose chart
kruistabel: analyse  D.S.  crosstabs (geven inzicht in verband tss 2
variabelen)
o enkel voor nominale en ordinale variabelen
o onafhankelijke variabele  rij
afhankelijke variabelen  kolom
o layer: variabelen  voor elke waarde van variabele een afzonderlijke
kruistabel
o cells: informatie in cellen: # waarnemingen, %, resideren, wegen
chi-kwadraattoets: statistics (vaststellen of 2 nominale variabelen onafh. Van
elkaar zijn)
o H0: geen verband H1: wel verband
 Asympsig (kans dat als Z variabelen onafh zijn, de berekend chi²
zou opleveren)
 Overschrijdingskans genoemd (sygnificantie of p-waarde)
 Grens 0,05 (sygnificantie moet < grens om H0 te
verwerpen)
o Voorwaarden:
 Verwachte frequencies minimaal 1
 Max 20 % verwachte frequencies < 5
Multiple response set : analyze  multiple response  define sets
o Dichotome : 2 waarden
Frequentietabel van een set: analyze  multiple response  frequencies
Kruistabel maken van een set : analyze  multiple response  crosstabs
o Define range (column) : welke reeks waarden moet worden opgenomen
2004-2005
Departement BEST Hogeschool gent
3
Samenvattig door Kristof Heiremans








SPSS
Beschrijven van groepen met means: analyze  compare means  means
(van elke groep kengetallen berekenen)
o Variabelen die groepsindeling bepaalt = onafh variabele (nominaal of
ordinaal)
 Variabelen waar kengetallen berekend worden = afh variabelen
(interval of ratio)
o onderscheiden van subgroepen : NEXT (meerdere layers)
o options: berekenen van kengetallen
steekproefgemiddelde toetsen aan andere waarden: analyze  compare
means  one sample T test
o H0: steekproefgemiddelde: andere gemiddelde H1: … ≠ … s of < of >
 Bepaalt representativiteit (als repr is, dan moet gem = populatie
gem., niet omdraaien)
 Voorwaarde verdeling van steekproef ongeveer verdeling
populatie (chi²). Indien niet  niet parametrische toets als sign. >
0,05 niet verwerpen
Gemiddelden toetsen bij 2 groepen: analyze  compare means 
indepentent  samples T test
o Testen of gemiddelde van 2 groepen aan elkaar gelijk zijn
voorwaarden: interval of ratiovariabele uit aselecte stekkproeven uit
normaal verdeelde populatie
 H0: gem1 = gem2 : beide groepen onafh van elkaar, anders
gepaarde t-toets
o Equal variances of niet: Levene-toets: H0:ja  sign < 0,05 H0
verwerpen
voor eenzijdig toetsen: sign delen door 2
define groups:
 use spec values: nominaal
 cut point : continue
gepaarde t-toets: analyze  compare means  paired sample T test
o hoe dichterde correlatie bij 1 ligt, hoe effectiever de gepaarde T-toets
variantie analyze:
o meer groepen dan T-toets
o voorwaarde: idem als T-toets + varianties chi  anders Vruskal-Wallis
of mediaantoets
variabelen die groepsindeling bepalen = factoren (numeriek)
met 1 factor, One Way ANOVA: analyze  compare means  one-way
anova
bij H0 verwerpen: minimaal 2 verschillende gemiddelden (kijken met posthoc)
options : Bronn-Forsythe en Welch als varianties verschillen  controlleren
door variance test of descriptive grootste kleinste standaarddeviatie < 2 OK
meerdere factoren (GLM): analyze  general lineair model  univarantie of
GLM
profile plots: niet parallele lijnen = interactie
correlatie en regressieanalyse: als er een lineair verband word verondersteld
tss 2 of meer interval of ratiogeschaalde intervallen
o geeft indruk van de samenhang
2004-2005
Departement BEST Hogeschool gent
4
Samenvattig door Kristof Heiremans

SPSS
o probeert numerieke verklaring te geven van de afhankelijke veriabele
door 1 of meer onafhankelijke variabelen
correlatie tss 2 variabelen
o voorwaarde: variabelen interval of ratiogeschaald, steekproef afkomstig
uit bivariate normaalverdeling voor elke waarde van de ene variabele is
de andere normaal verdeeld en omgekeerd
o best eerst spreidingsdiagram maken om te zien of het nuttig is
verband: rechte lijn of niet(=correlatiecoëfficiënt ongeveer 0 sterke
samenhang maar niet lineair
o verband tussen 2 ongeacht invloed van andere  bivariantie correlatie
(analyze  corr  bivariatie)
o corrigeren voor andere  partiële correlatie
niet voldaan aan pearson correlatiecoëfficiënt: o nominaal: chi², phi-coëf
o ordinaal: spearman,
correlatiecoëf, Vendell’s Taer
o correlatie coëf ongeveer 1  lineair verband + als ene stijgt andere ook
 sign: H0 geen verband
 eenzijdig: one-tailed
o analyze  correlatie  partial
interpretatie idem

regressieanalyse : lineair verband schatten tussen 1 afh en 1 of meer onafh
variabelen
o er worden causaal verband verondersteld
o verschijnsel dat we willen verklaren
 veronderstellingen:
 interval of ratio
 lineair verband of wiskundig bekende (curve estimation)
 voorwaarde van onafhankelijke waarde is afhankelijk van
normaal verdeeld
 variantie van afhankelijk variabele voor elke waarde van
de onafhankelijk van gelijk zijn.
Eerst spreidingsdiagram (lineair) en correlatieanalyse( samenhang afh en
onafhankelijk var.)

Lineaire regressie: analyze  regression  lineair
o R: correlatiecoëf R= determinantiecoëff
o H0: alle regressiecoëf met uitzondering van de constante = 0
o H1: minimum 1 coëff verschillend van 0
anova:
 regression: verklaarde variantie
 residurel: niet verklaarde variantie
o Coëff: als var(b) en var2(b) positief is dan als het 1 stijgt het andere ook
o T-toets: H0 : regressiecoëff = 0
2004-2005
Departement BEST Hogeschool gent
5
Samenvattig door Kristof Heiremans









SPSS
Best : 1 voor 1 onafhankelijk toevoegen en kijken of k² niet teveel
stijgt
 F-toets
Omgekeerde methode: idem maar voor 1 verwijderen
 F-to-remove
Enter: 1 regressievergelijking met alle variabelen
Forward: 1 voor 1 toegevoegd
Backward: 1 voor 1 verwijderd
Stepwise: combinatie enter en forward  F-to-remove > F-toenter
Remove: als onafhanklijk variabele in groepen
Regressie bij kromlijnige verbanden: 1 onafhankelijk variabele  curve
estimation , anders eerst transformeren
Kromlijnige regressieanalyse: analyzeregressioncurve estimation zie p
305-308
o Eerst kijken of verband wel lineair is (spreidingsdiagram)
welk Model ?
o spreidingsdiagram
o modellen
o vergelijking welk beste is

niet-parametrische toetsen: als niet aan voorwaarde van andere toetsen
voldaan is
overzicht p 309
o chi²-toets: bepalen of waargenomen freq. In verschillende categ.
Voorkomen met verwachte freq.
 Verdeling van variabele toetsen (testen of steekproef
representatief is)
 H0: waargenomen verdeling ongeveer verwachte
verdeling
o Analyzenon parametric  chi-square
 Binomiale toets: analyzeN-Pbinomial
(onderzoeken of gegevens bevestigen dat er een kans p is op
een bep waarde van een variabele)
 H0: bv.: bij sexe is kans 50% dat iemand mannelijk is
 Runs-toets: analyzeN-PRuns
(vaststellen of geg. In willekeurige volgorde zijn verzameld)
 H0: willekeurige volgorde
o Runs zeer hoog: bv.: oud,jong,oud,jong
o Runs zeer laag: bv.: oud,oud,oud,oud,jong,jong
 Kolmogaron-smirnov: analyzeN-P1-Sample K-S
(bepaalt of waargenomen verdeling ongeveer theoretische
verdeling)
 Ook gebruikt om te kijken of 2 steekproeven uit zelfde
populatie komen
 H0: theorieverdeeld
2004-2005
Departement BEST Hogeschool gent
6
Samenvattig door Kristof Heiremans

SPSS
Toetsen bij 2 onafhankelijke groepen (aantonen of gemiddelde van 2
onafhankelijke steekproeven gelijk zijn). Vergelijking met T-toets: t-toets
voorkeur tenzij:
-niet interval of ratio
-niet normaal verdeeld
1 of 2 ?
1) bij grote steekproeven
2) bij kleine steekproeven
1. Mann-Whitney of Wilconon : analyze  N-P 2 independent
samples (toetsen of 2 onafhankelijke steekproeven uit populaties
met zelfde verdeling komen)
a. H0: zelfde verdeling (gemiddelden gelijk)
2. Kolmogarov-Smirnov voor 2 groepen: idem (K-S Z aanvinken)

Toetsen bij 2 of meer onafhankelijke groepen: vergelijking variantieanalyse:
variantieanalyse nemen tenzij niet aan voorwaarde wordt voldaan.
1 of 2 ?
1) voorkeur
2) als exacte waarden van een aantal extreme waarden niet bekend zijn.

1. analyze  nonparametric  independent samples
a. (uitbreiding Mann - Whitney)
H0: zelfde verdeling (gemiddelde gelijk)
2. mediaan toets: idem maar mediaan aanvinken
Toetsen bij 2 gerelateerde groepen: afhankelijke steekproeven
Tenzij voorwaarden niet voldaan altijd gepaarde T-toets gebruiken
1 of 2 ?
beter 1 tenzij u geeft informatie over de omvang van het verschil hebt
1. Wilcoxon signed ranks : analyze  N-P  2 related samples
(hebben 2 afhankelijke steekproeven zelfde mediaan en verdeling ?)
H0: zelfde mediaan en verdeling
2. Tekentoets: idem maar sign. Aanvinken

Bij 2 of meer gerelateerde groepen: Wij zien enkel ordinaal (bv.: rapportcijfer
of 5-puntenschaal)
o H0: mediaan is gelijk
o Analyze  N-P  K related samples
2004-2005
Departement BEST Hogeschool gent
7
Download