t-Test für abhängige Stichproben in R

Manchmal erhebst Du Daten vor und nach einer Intervention – zum Beispiel Stresslevel vor und nach einem Achtsamkeitstraining. Oder Du arbeitest mit Paaren, Zwillingen oder Messwiederholungen. In solchen Fällen nutzt Du den t-Test für abhängige Stichproben, auch paired t-Test genannt.


Was prüft der paired t-Test?

Definition:
Der t-Test für abhängige Stichproben prüft, ob sich zwei verbundene Messungen (z. B. vorher und nachher) im Mittelwert signifikant unterscheiden.
Nullhypothese: $H_0: \mu_{\text{diff}} = 0$
Alternativhypothese: $H_1: \mu_{\text{diff}} \ne 0$ (zweiseitig)

Dabei wird der Mittelwert der Differenzen analysiert: Für jede Person wird die Differenz zwischen den beiden Zeitpunkten berechnet und dann getestet, ob diese im Schnitt von null abweicht.


Beispiel: Stress vor und nach einem Training

Angenommen, Du untersuchst 20 Personen, die an einem Stressbewältigungstraining teilgenommen haben. Du misst ihr Stressniveau vorher und nachher auf einer Skala von 1–10.

# Beispiel-Daten simulieren
set.seed(123)
stress_vorher <- rnorm(20, mean = 7, sd = 1)
stress_nachher <- stress_vorher - rnorm(20, mean = 0.8, sd = 0.5)

daten <- data.frame(stress_vorher, stress_nachher)

Durchführung des Tests in R

# Paired t-Test durchführen
t.test(daten$stress_vorher, daten$stress_nachher, paired = TRUE)

Wichtig: paired = TRUE gibt an, dass die beiden Variablen verbundene Beobachtungen sind.


Beispielausgabe (verkürzt)

Paired t-test

data: daten$stress_vorher and daten$stress_nachher
t = 5.201, df = 19, p-value = 5.13e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.662 1.391
mean of the differences: 1.027

Interpretation der Ergebnisse

KennwertBedeutung
t = 5.201Teststatistik – wie stark weicht der Mittelwert der Differenzen von 0 ab
df = 19Freiheitsgrade: Anzahl der Paare minus 1
p-value = 0.0000513Sehr kleiner p-Wert → Unterschied ist signifikant
Konfidenzintervall [0.66, 1.39]Der wahre Unterschied liegt mit 95 %iger Sicherheit in diesem Bereich
mean of differences = 1.027Im Schnitt ist der Stress nach dem Training um 1.03 Punkte niedriger

Fazit: Das Stresslevel hat sich nach dem Training signifikant reduziert.


Visualisierung der Differenzen

# Unterschied als Histogramm darstellen
diff <- daten$stress_vorher - daten$stress_nachher
hist(diff, main = "Differenz: Stress vorher - nachher", col = "lightgray",
xlab = "Differenzwerte", breaks = 8)

# oder Boxplot
boxplot(daten$stress_vorher, daten$stress_nachher, names = c("Vorher", "Nachher"),
main = "Stressniveau vor und nach dem Training", ylab = "Stress (1-10)",
col = c("lightblue", "lightgreen"))

Zusammenfassung

SchrittWas Du machst
1Zwei verbundene Messungen vorbereiten (z. B. vorher/nachher)
2t.test(x, y, paired = TRUE) durchführen
3p-Wert, Konfidenzintervall und Mittelwertdifferenz interpretieren
4Optional: Visualisieren mit Histogramm oder Boxplot

Q&A zum Mitdenken

Frage 1: Wann benutzt Du den t-Test für abhängige Stichproben?
Antwort: Wenn Du zwei verbundene Messungen pro Fall hast, z. B. Vorher–Nachher-Daten oder Messwiederholungen.

Frage 2: Was prüft der Test konkret?
Antwort: Ob der Mittelwert der Differenzen signifikant von null abweicht.

Frage 3: Wie führst Du ihn in R durch?
Antwort: Mit t.test(x, y, paired = TRUE)

Frage 4: Was bedeutet ein p-Wert von 0.00005?
Antwort: Es ist extrem unwahrscheinlich, so einen Unterschied durch Zufall zu bekommen. Das Ergebnis ist hochsignifikant.

Alles klar?

Ich hoffe, der Beitrag war für dich soweit verständlich. Wenn du weitere Fragen hast, nutze bitte hier die Möglichkeit, eine Frage an mich zu stellen!

Stelle Dominik eine Frage