Statistiek I: R-Codes Hoofdstuk 1: Inleiding Zie cursus, makkelijke codes (optellen, aftrekken, vermenigvulgdigen, delen). Hoofdstuk 2: Visualiseren van data Dim() = Dimensie opvragen. Geeft aantal rijen en kolommen van tabel weer. Head() = Geeft eerste 6 rijen en alle kolommen van tabel weer. Names() = Geeft namen van variabelen weer. $ = Geeft waarden van een variabele uit tabel weer. Bv.: DataIAT$geslacht Table() = Berekent de absolute frequenties. Relatieve frequentie = absolute frequentie gedeeld door steekproefgrootte Pie() = Cirkeldiagram. Barplot() = Staafdiagram. Cut() = Geeft klassen weer. breaks = grenzen van de klassen Hist() = Histogram. Cumsum() = Op basis van de absolute frequenties bekomen we de cumulatieve frequenties. 1 Ecdf() en plot() = Cumulatieve frequentiecurve Geeft cumulatieve relatieve frequenties i.p.v. cumulatieve absolute frequenties. Hoofdstuk 3: Samenvatten van data Mean() = Rekenkundig gemiddelde berekenen. Median() = Mediaan berekenen. Min() en max() = variatiebreedte berekenen. Om deze te berekenen heb je het minimum en maximum nodig. Max() – Min() = vraiatiebreedte Aad() = gemiddelde absolute afwijking (average absolute deviation) Var() = variantie berekenen R zal steeds 𝑠𝑋2 berekenen i.p.v. 𝑠𝑑𝑋2 Sd() = standaarddeviatie sX berekenen Sqrt() = vierkantswortel doen van de variantie (square root = vierkantswortel) Bv.: sqrt(var()) = sd() Quantile() = verschillende percentielen berekenen, waaronder de kwartielen IQR() = interkwartielafstand bekomen Boxplot() = boxplot bekomen 2 Hoofdstuk 4: Samenhang tussen twee variabelen Plot() = spreidingsdiagram bekomen Cov() = covariantie tussen twee variabelen berekenen. Cor() = correlatiecoëfficiënt berekenen. Kendall en cor() = door de optie kendall te gebruiken, kunnen we via cor() Kendall’s berekenen. Bv.: cor(DataIQ$Hersengrootte, DataIQ$VIQ, method = kendall) Hoofdstuk 5: De populatie en verdelingsfuncties Dbinom(k, N, p) = kansdichtheid P(X = k) bekomen Pbinom(k, N, p) = cumulatieve verdelingsfunctie P (X≤k) bekomen Pnorm(x) = Voor standaardnormale variabele X, kunnen we rechtstreeks de kansen P(X≤x) vinden Dnorm(x) = kansdichtheid fX(x) Pchisq(y, k) = kansen P(Y≤y) bekomen voor variabele Y ~ 𝑋𝑘2 Pt(t,k) = De kansen P(T ≤ t) bekomen voor een variabele T ~ tk Hoofdstuk 6: De steekproevenverdeling Geen R-Codes. 3 Hoofdstuk 7: Betrouwbaarheidsintervallen en statistische toetsen voor het populatiegemiddelde t.test(data,mu) = t-toets voor één steekproef uitvoeren 4