Online (R) oefeningen

t-test

In wat volgt staan een aantal interactieve oefeningen die je kan doorlopen om te testen of je de materie aangaande t-testen voldoende onder de knie hebt.

Om de oefeningen te kunnen uitvoeren hebben we de dataset penguins nodit uit het pakket palmerpenguins. Volgende code loopt automatisch zodanig dat je meteen aan de oefeningen kan beginnen!

Meer achtergrond over deze dataset vind je via volgende link: palmerpenguins

Oefening 1

We zijn geïnteresseerd in verschillen tussen mannelijk en vrouwelijke pinguïns. Meerbepaald zijn we benieuwd wat het verschil in lichaamsmassa (body_mass_g) is tussen beide sekses (sex).

Vul onderstaande code aan om de gemiddeldes per sekse te berekenen.

We willen het gemiddelde per categorie van de variabele penguins$sex berekenen. Dus, je moet in je code iets met die variabele doen.

tapply(penguins$body_mass_g, penguins$____ , _____)

Als je die variabele mee opgenomen hebt in je code, moet je nog tegen R zeggen wat precies berekend moet worden. Hier gaat het om het gemiddelde berekenen. Welke functie in R kan je hanteren om het gemiddelde te berekenen?

tapply(penguins$body_mass_g, penguins$sex , _____)

Oplossing:

De volledige oplossing ziet er zo uit!

tapply(penguins$body_mass_g, penguins$sex , mean)
tapply(penguins$body_mass_g, penguins$sex , mean)

Oefening 2

In de eerste oefening kregen we zicht op de gemiddelde lichaamsmassa van mannelijke en vrouwelijke pinguïns in de steekproef. Uiteraard zijn we meer geïnteresseerd in hoe dit in de populatie zit! We wensen dus een t-test uit te voeren.

Voer in het onderstaande code blok de juiste code in om de t-test uit te voeren (je mag er even vanuit gaan dat er voldaan is aan de assumptie van gelijke varianties).

We willen een t-test uitvoeren. Daartoe maak je best gebruik van de functie t.test( ).

t.test(______ ~ _______)

Oplossing:

De volledige oplossing ziet er zo uit!

t.test(penguins$body_mass_g ~ penguins$sex, var.equal = TRUE)
t.test(penguins$body_mass_g ~ penguins$sex, var.equal = TRUE)

Oefening 3

Met de t-test zijn we nagegaan of we statistische evidentie hebben dat het verschil in gemiddelden in de steekproef ook kan worden veralgemeend naar een verschil in de populatie van alle pinguïns. We zijn dus de statistische significantie nagegaan. Echter, het resultaat van zo’n test is afhankelijk van de steekproefgrootte. Om een algemeen beeld te krijgen over hoe groot het verschil is tussen beide groepen introduceren we het idee van effectgrootte.

Doe de nodige analyse om tevens de effectgrootte na te gaan voor het verschil in lichaamsmasse tussen mannelijke en vrouwelijke pinguïns

We willen Cohen’s d berekenen om de effectgrootte uit te drukken. Daartoe maak je best gebruik van de functie d( ).

d(______ , _______)

Oplossing:

De volledige oplossing ziet er zo uit!

d(penguins$body_mass_g, penguins$sex)

d(penguins$body_mass_g, penguins$sex)

Oefening 4

In oefening 2 hebben we abstractie gemaakt van de assumptie van gelijke binnen-groepen varianties voor beide sekses.

Test nu de assumptie dat beide varianties gelijk zijn. Is het zo dat de variantie in lichaamsmassa voor mannelijke pinguïns vergelijkbaar is met de variantie in lichaamsmassa voor vrouwelijke pinguïns?

Om deze assumptie na te gaan dienen we een Levene test uit te voeren.

leveneTest(_____, _______)

Oplossing:

De volledige oplossing ziet er zo uit!

leveneTest(penguins$body_mass_g, penguins$sex)

leveneTest(penguins$body_mass_g, penguins$sex)

Oefening 5

Nu je meer zicht hebt op het feit dat de assumptie van gelijke varianties niet op gaat, betekent dit dat we de t-test opnieuw moeten uitvoeren adhv een andere functie.

Voer de t-test opnieuw uit met de gepaste toets en functie in R.

Hiertoe moeten we de functie t.test( ) uitbreiden met een extra argument dat aan R meegeeft dat de assumptie van gelijke varianties niet opgaat.

t.test(penguins$body_mass_g ~ penguins$sex, _____)

Oplossing:

De volledige oplossing ziet er zo uit!

t.test(penguins$body_mass_g ~ penguins$sex, var.equal = FALSE)

t.test(penguins$body_mass_g ~ penguins$sex, var.equal = FALSE)

Oefening 6

De nodige analyses zijn uitgevoerd. Wat nu nog rest is het goed interpreteren en uitschrijven van conclusies op basis van de output die gegenereerd is tijdens de analyses.

Schrijf voor jezelf een alinea waarin je de nodige informatie opneemt om de resultaten van de analyse te communiceren.

Dit is een mogelijke verwoording van de resultaten;

In de steekproef van onderzochte pinguïns stellen we vast dat vrouwelijke pinguïns een lagere gemiddelde lichaamsmassa hebben (gemiddelde = 3862 gram) dan de mannelijke pinguïns (gemiddelde = 4546 gram). Dit verschil in lichaamsmassa tussen vrouwelijke en mannelijke pinguïns is statistisch significant (t = -8.55, df = 323.9, p <0.001). Met andere woorden, de kans dat we dit verschil in lichaamsmassa vaststellen in onze steekproef indien er in de gehele populatie geen verschil zou zijn, is bijzonder laag. We concluderen dus dat er voldoende evidentie is om te stellen dat vrouwelijke pinguïns een lagere lichaamsmassa hebben dan de mannelijke pinguïns. Uit de effectgrootte (Cohen’s d = -0.94) kunnen we afleiden dat dit gezien kan worden als een groot verschil.

Rapporteren is van cruciaal belang. Wil je meer toelichting bij de bovenstaande rapportage, klik dan door naar hier.