R-codes statistiek I

advertisement
Statistiek I: R-Codes
Hoofdstuk 1: Inleiding
Zie cursus, makkelijke codes (optellen, aftrekken, vermenigvulgdigen, delen).
Hoofdstuk 2: Visualiseren van data

Dim()
= Dimensie opvragen. Geeft aantal rijen en kolommen van tabel weer.

Head()
= Geeft eerste 6 rijen en alle kolommen van tabel weer.

Names()
= Geeft namen van variabelen weer.

$
= Geeft waarden van een variabele uit tabel weer.
Bv.: DataIAT$geslacht

Table()
= Berekent de absolute frequenties.
 Relatieve frequentie = absolute frequentie gedeeld door steekproefgrootte

Pie()
= Cirkeldiagram.

Barplot()
= Staafdiagram.

Cut()
= Geeft klassen weer.
 breaks = grenzen van de klassen

Hist()
= Histogram.

Cumsum()
= Op basis van de absolute frequenties bekomen we de cumulatieve frequenties.
1

Ecdf() en plot()
= Cumulatieve frequentiecurve
 Geeft cumulatieve relatieve frequenties i.p.v. cumulatieve absolute frequenties.
Hoofdstuk 3: Samenvatten van data

Mean()
= Rekenkundig gemiddelde berekenen.

Median()
= Mediaan berekenen.

Min() en max()
= variatiebreedte berekenen. Om deze te berekenen heb je het minimum en
maximum nodig.
 Max() – Min() = vraiatiebreedte

Aad()
= gemiddelde absolute afwijking (average absolute deviation)

Var()
= variantie berekenen
 R zal steeds 𝑠𝑋2 berekenen i.p.v. 𝑠𝑑𝑋2

Sd()
= standaarddeviatie sX berekenen

Sqrt()
= vierkantswortel doen van de variantie (square root = vierkantswortel)
Bv.: sqrt(var()) = sd()

Quantile()
= verschillende percentielen berekenen, waaronder de kwartielen

IQR()
= interkwartielafstand bekomen

Boxplot()
= boxplot bekomen
2
Hoofdstuk 4: Samenhang tussen twee variabelen

Plot()
= spreidingsdiagram bekomen

Cov()
= covariantie tussen twee variabelen berekenen.

Cor()
= correlatiecoëfficiënt berekenen.

Kendall en cor()
= door de optie kendall te gebruiken, kunnen we via cor() Kendall’s  berekenen.
Bv.: cor(DataIQ$Hersengrootte, DataIQ$VIQ, method = kendall)
Hoofdstuk 5: De populatie en verdelingsfuncties

Dbinom(k, N, p)
= kansdichtheid P(X = k) bekomen

Pbinom(k, N, p)
= cumulatieve verdelingsfunctie P (X≤k) bekomen

Pnorm(x)
= Voor standaardnormale variabele X, kunnen we rechtstreeks de kansen P(X≤x)
vinden

Dnorm(x)
= kansdichtheid fX(x)

Pchisq(y, k)
= kansen P(Y≤y) bekomen voor variabele Y ~ 𝑋𝑘2

Pt(t,k)
= De kansen P(T ≤ t) bekomen voor een variabele T ~ tk
Hoofdstuk 6: De steekproevenverdeling
Geen R-Codes.
3
Hoofdstuk 7: Betrouwbaarheidsintervallen en statistische toetsen voor het
populatiegemiddelde

t.test(data,mu)
= t-toets voor één steekproef uitvoeren
4
Download