Contactmoment 2: Respons computer lab

Belangrijk

Vooraleer je de oefeningen kan oplossen is het belangrijk om zowel de dataset te laden, het pakket car te activeren en ook de OLP2 Functies te activeren.

Oefening 1

In welke mate scoren leerlingen uit de verschillende studierichtingen (Richting5cat) anders als het gaat over het begrijpen van techniek (Begrijpen.voor)?

Indien dit zo is, welke groepen van leerlingen verschillen dan statistisch significant van elkaar?

Om deze vragen te beantwoorden dienen we een ANOVA analyse uit te voeren. Hieronder volgen we de verschillende stappen van een ANOVA analyse om zo een volledig antwoord op deze vragen te kunnen formuleren.

We starten met het berekenen van de gemiddelde scores in de steekproef voor Begrijpen.voor van de leerlingen in de verschillende studierichtingen.

tapply(Techniek$Begrijpen.voor, Techniek$Richting5cat, FUN=mean, na.rm=TRUE)

        1         2         3         4         5 
0.6216667 0.6452206 0.7098642 0.6337891 0.5429025

Hieruit leren we dat in de steekproef leerlingen uit categorie 3 gemiddeld het hoogst scoren op Begrijpen.voor (gemiddelde = 0.71) en leerlingen uit categorie 5 scoren gemiddeld het laagst (gemiddelde = 0.54).

Vooraleer we de ANOVA zelf kunnen uitvoeren dienen we de assumptie van gelijke binnengroepenvarianties na te gaan aan de hand van de Levene Test.

leveneTest(Techniek$Begrijpen.voor, Techniek$Richting5cat)

Levene's Test for Homogeneity of Variance (center = median)
        Df F value  Pr(>F)  
group    4  2.0016 0.09181 .
      1873                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Uit de bovenstaande output leren we dat we de nulhypothese (= er zijn gelijke binnengroepenvarianties in de populatie) niet kunnen verwerpen. Maw, de assumptie gaat wel op. Dus, we kunnen de functie aov() hanteren.

Model.Begrijpen <- aov(Techniek$Begrijpen.voor~ Techniek$Richting5cat)
summary(Model.Begrijpen)

                        Df Sum Sq Mean Sq F value Pr(>F)    
Techniek$Richting5cat    4   5.27  1.3182   49.34 <2e-16 ***
Residuals             1873  50.04  0.0267                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
489 observations deleted due to missingness

De analyses leren ons dat er een statistisch significant verband is tussen studierichting en Begrijpen.voor (F(4,1873) = 49.34, p<0.001).

Een volgende stap is nagaan hoe groot het effect is (effectgrootte berekenen).

etasq(Model.Begrijpen)

                      Partial eta^2
Techniek$Richting5cat     0.0953278
Residuals                        NA

Eta-kwadraat bedraagt 0.095 en is dus tussen 0.06 en 0.14: het gaat om een medium effect.

Een laatste stap is nagaan welke groepen onderling verschillen van elkaar. Dit doen we aan de hand van post-hoc testen door middel van de functie TukeyHSD( ).

Model.Begrijpen.Tukey <- TukeyHSD(Model.Begrijpen)
Model.Begrijpen.Tukey

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Techniek$Begrijpen.voor ~ Techniek$Richting5cat)

$`Techniek$Richting5cat`
           diff         lwr         upr     p adj
2-1  0.02355392 -0.06121659  0.10832444 0.9422650
3-1  0.08819755  0.04762624  0.12876886 0.0000000
4-1  0.01212240 -0.02746614  0.05171093 0.9193976
5-1 -0.07876412 -0.12536703 -0.03216122 0.0000413
3-2  0.06464363 -0.01394620  0.14323346 0.1634082
4-2 -0.01143153 -0.08951854  0.06665549 0.9946245
5-2 -0.10231805 -0.18418477 -0.02045132 0.0059194
4-3 -0.07607515 -0.09968814 -0.05246217 0.0000000
5-3 -0.16696167 -0.20105203 -0.13287132 0.0000000
5-4 -0.09088652 -0.12380115 -0.05797189 0.0000000

Kijken we naar de laatste kolom dan kunnen we daar de verschillende lijnen identificeren waarvoor geldt dat de p-waarde lager is dan 0.05 (lijnen 2, 4, 7, 8, 9, 10).

We kunnen deze post-hoc testen ook visualiseren:

plot(Model.Begrijpen.Tukey)

CONCLUSIE:

Afhankelijk van de studierichting die een leerling volgt, verschilt de mate waarin techniek wordt begrepen. Het gaat om een medium (eta-kwadraat = 0.10) en statistisch significant effect (F(4,1873) = 49.34, p<0.001). We verwachten dit effect dus ook in de populatie terug te vinden. Uit de post-hoc analyse blijkt dat leerlingen uit categorie 5 (Handel/STV) het meest verschillen van de andere leerlingen. Hun score op Begrijpen.voor is significant (p < 0.05) lager dan deze van leerlingen uit categorie 2 (Kunst), categorie 3 (Latijn) en categorie 4 (Moderne wetenschappen). Ook tussen de groepen Latijn (categorie 3) en Techniek (categorie 1) is een significant verschil (p < 0.05) in het begrijpen van techniek terug te vinden. De leerlingen uit de Latijnse scoren significant (p < 0.05) beter dan de leerlingen uit de meer technische richtingen. De verschillen tussen leerlingen uit de technische (categorie 1), moderne (categorie 4) of kunstrichtingen (categorie 2) in onze steekproef kunnen we niet doortrekken naar de populatie (p > 0.05).

Oefening 2

We bekeken in de eerste oefening of er een verschil was in het begrijpen van techniek naargelang de studierichting.

Als we de afhankelijke variabele (Begrijpen.voor) opdelen in vier categorieën op basis van de kwartielen kunnen we dit verband ook weergeven in een tabel.

→ Hoe is de verdeling overheen de verschillende categorieën van begrijpen naar studierichting?

→ Geef dit ook grafisch weer.

Deze oefening vraagt om een analyse aan de hand van een kruistabel.

Als start voor deze oefening maken we een categorische variant van de variabele Begrijpen.voor via de recode( ) functie.

# Kwartielen berekenen

quantile(Techniek$Begrijpen.voor, c(0.25,0.5,0.75), na.rm=TRUE)

   25%    50%    75% 
0.5000 0.6875 0.7500

# Hercoderen 

Techniek$Begrijpen.voor.Cat <- recode(
  Techniek$Begrijpen.voor,
  "0:0.5 = 'Zeer laag'; 
  0.5:0.6875 = 'Laag'; 
  0.6875:0.75 = 'Hoog'; 
  0.75:1 = 'Zeer hoog'",
  as.factor = TRUE,
  levels = c("Zeer laag", "Laag", "Hoog", "Zeer hoog")
  )

Nu kunnen we een kruistabel aanmaken. Meerbepaald maken we een tabel met kolompercentages waarin we da afhankelijke variabele (Begrijpen.voor.Cat) in de rijen plaatsen.

kruistabel.kolom(Techniek$Begrijpen.voor.Cat, Techniek$Richting5cat)

           x
y                    1          2          3          4          5        Sum
  Zeer laag  30.666667  29.411765  12.460064  28.485577  46.186441  25.559105
  Laag       38.666667  29.411765  34.025559  38.100962  37.711864  36.581470
  Hoog       13.333333  11.764706  17.731629  13.100962   9.322034  14.164004
  Zeer hoog  17.333333  29.411765  35.782748  20.312500   6.779661  23.695421
  Sum       100.000000 100.000000 100.000000 100.000000 100.000000 100.000000

Vervolgens berekenen we de Chi-kwadraat test. Door gebruik te maken van de functie chi.kwadraat.test() krijgen we in de output ook meteen een maat van effectgrootte mee (Cramer’s V).

chi.kwadraat.test(
  table(Techniek$Begrijpen.voor.Cat,
        Techniek$Richting5cat)
  )


    Pearson's Chi-squared test

data:  table(Techniek$Begrijpen.voor.Cat, Techniek$Richting5cat)
X-squared = 172.76, df = 12, p-value < 2.2e-16
95 percent confidence interval:
 0.1428339 0.1959541
sample estimates:
Cramer's V 
 0.1751129

Tot slot visualiseren we de kruistabel. Let op dat je hier rijen en kolommen omwisselt in vergelijking met de vorige stukken code. Daarom dat we in de onderstaande code-blok eerst een nieuw object aanmaken Tabel_asso waarin de kruistabel staat met de rijen en kolommen omgewisseld.

Tabel_asso <- table(Techniek$Richting5cat,Techniek$Begrijpen.voor.Cat)
assocplot(Tabel_asso)

Als we alle output overschouwen, dan komen we tot volgende conclusie.

CONCLUSIE:

De kolompercentages geven weer hoe binnen de verschillende clusters van studierichtingen wordt gescoord op het begrijpen van techniek. We bespreken enkele ‘opvallende’ cijfers… Bij de leerlingen uit technische studierichtingen zit de grootste groep in de categorie “Laag” (38.67%). Het percentage van deze leerlingen in de categorie “Zeer hoog” bedraagt slechts 17.33%. De grootste groep leerlingen die Latijn volgen is terug te vinden in de categorie “Zeer hoog” (35.78%). Deze groep leerlingen scoort dus in het algemeen beter dan de leerlingen uit de andere studierichtingen. Handel/STV-leerlingen scoren dan weer sterk lager. 46.19% van deze leerlingen is terug te vinden in de categorie “Zeer Laag” en slechts 6.78% in de categorie “Zeer Hoog”. De chi²-analyse leert ons dat het verband statistisch significant is (p < 0.05), maar eerder beperkt (Cramer’s V = 0.18).

Oefening 3

We zijn ook geïnteresseerd in welke mate de aanwezigheid van technisch speelgoed (Speelgoed) een invloed heeft op het begrijpen van techniek (Begrijpen.voor). We kunnen dit op 2 manieren analyseren nu we beschikken over een kwalitatieve en een kwantitatieve variabele die iets zeggen over het begrijpen van techniek (de originele variabele Begrijpen.voor en de aangemaakte categorische variabele uit oefening 2).

→ Teken beide modellen en vermeld de analysetechniek.

→ Maak beide oefeningen en vergelijk de resultaten.

Optie 1: t-test

Eerst de Levene Test.

leveneTest(Techniek$Begrijpen.voor, Techniek$Speelgoed)

Levene's Test for Homogeneity of Variance (center = median)
        Df F value Pr(>F)
group    1  0.1089 0.7415
      1890

P-waarde is hoger dan 0.05, dus de assumptie van gelijke binnengroepenvarianties gaat op. Nu kunnen we de t-test zelf uitvoeren.

t.test(Techniek$Begrijpen.voor~Techniek$Speelgoed, var.equal=TRUE)


    Two Sample t-test

data:  Techniek$Begrijpen.voor by Techniek$Speelgoed
t = -3.6108, df = 1890, p-value = 0.0003132
alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
95 percent confidence interval:
 -0.04621105 -0.01368049
sample estimates:
mean in group 0 mean in group 1 
      0.6251900       0.6551357

Ook de effectgrootte gaan we na (Cohen’s d).

d(Techniek$Begrijpen.voor,Techniek$Speelgoed)

[1] -0.1737467

CONCLUSIE:

In de steekproef scoren leerlingen gemiddeld 0.66 op begrijpen van techniek, terwijl leerlingen die thuis geen technisch speelgoed hebben iets lager scoren (gemiddelde = 0.63). Het effect van al dan niet technisch speelgoed hebben, is statistisch significant (p < 0.05). We kunnen het dus doortrekken naar de populatie. Het effect is echter zo klein (d = 0.17) dat het van weinig praktische waarde is.

Optie 2: kruistabel

Een tabel met kolompercentages aanmaken met afhankelijke variabele (Begrijpen.voor.Cat) in de rijen.

kruistabel.kolom(Techniek$Begrijpen.voor.Cat,Techniek$Speelgoed)

           x
y                   0         1       Sum
  Zeer laag  29.63526  24.06807  26.00423
  Laag       38.44985  35.57536  36.57505
  Hoog       12.15805  15.07293  14.05920
  Zeer hoog  19.75684  25.28363  23.36152
  Sum       100.00000 100.00000 100.00000

De Chi-kwadraattest uitvoeren.

chi.kwadraat.test(table(Techniek$Begrijpen.voor.Cat, Techniek$Speelgoed))


    Pearson's Chi-squared test

data:  table(Techniek$Begrijpen.voor.Cat, Techniek$Speelgoed)
X-squared = 14.289, df = 3, p-value = 0.002537
95 percent confidence interval:
 0.03199597 0.12691805
sample estimates:
Cramer's V 
0.08690546

En tot slot ook de tabel visueel maken.

Tabel_asso <- table(Techniek$Speelgoed,Techniek$Begrijpen.voor.Cat)
assocplot(Tabel_asso)

Alles samengenomen kunnen we het volgende concluderen uit deze analyse.

Conclusie:

De kolompercentages geven weer of leerlingen die al dan niet technisch speelgoed bezitten anders scoren op het begrijpen van techniek. Uit de kruistabel blijkt dat de verschillen eerder klein zijn. Beide groepen leerlingen hebben gelijkaardige percentages binnen de verschillende categorieën van ‘Begrijpen.voor.Cat’. Hoewel de chi²-analyse aangeeft dat het om een statistisch significant verband gaat (p < 0.05), wijst de Cramer’s V op een klein effect (Cramer’s V = 0.09).

Vergelijken we beide analyses, dan komen we tot een vrij gelijkaardige conclusie. Er is een statistisch significant verband, maar het is verwaarloosbaar klein.