Manchmal erhebst Du Daten vor und nach einer Intervention – zum Beispiel Stresslevel vor und nach einem Achtsamkeitstraining. Oder Du arbeitest mit Paaren, Zwillingen oder Messwiederholungen. In solchen Fällen nutzt Du den t-Test für abhängige Stichproben, auch paired t-Test genannt.
Was prüft der paired t-Test?
Definition:
Der t-Test für abhängige Stichproben prüft, ob sich zwei verbundene Messungen (z. B. vorher und nachher) im Mittelwert signifikant unterscheiden.
Nullhypothese: $H_0: \mu_{\text{diff}} = 0$
Alternativhypothese: $H_1: \mu_{\text{diff}} \ne 0$ (zweiseitig)
Dabei wird der Mittelwert der Differenzen analysiert: Für jede Person wird die Differenz zwischen den beiden Zeitpunkten berechnet und dann getestet, ob diese im Schnitt von null abweicht.
Beispiel: Stress vor und nach einem Training
Angenommen, Du untersuchst 20 Personen, die an einem Stressbewältigungstraining teilgenommen haben. Du misst ihr Stressniveau vorher und nachher auf einer Skala von 1–10.
# Beispiel-Daten simulieren
set.seed(123)
stress_vorher <- rnorm(20, mean = 7, sd = 1)
stress_nachher <- stress_vorher - rnorm(20, mean = 0.8, sd = 0.5)
daten <- data.frame(stress_vorher, stress_nachher)
Durchführung des Tests in R
# Paired t-Test durchführen
t.test(daten$stress_vorher, daten$stress_nachher, paired = TRUE)
Wichtig: paired = TRUE
gibt an, dass die beiden Variablen verbundene Beobachtungen sind.
Beispielausgabe (verkürzt)
Paired t-test
data: daten$stress_vorher and daten$stress_nachher
t = 5.201, df = 19, p-value = 5.13e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.662 1.391
mean of the differences: 1.027
Interpretation der Ergebnisse
Kennwert | Bedeutung |
---|---|
t = 5.201 | Teststatistik – wie stark weicht der Mittelwert der Differenzen von 0 ab |
df = 19 | Freiheitsgrade: Anzahl der Paare minus 1 |
p-value = 0.0000513 | Sehr kleiner p-Wert → Unterschied ist signifikant |
Konfidenzintervall [0.66, 1.39] | Der wahre Unterschied liegt mit 95 %iger Sicherheit in diesem Bereich |
mean of differences = 1.027 | Im Schnitt ist der Stress nach dem Training um 1.03 Punkte niedriger |
Fazit: Das Stresslevel hat sich nach dem Training signifikant reduziert.
Visualisierung der Differenzen
# Unterschied als Histogramm darstellen
diff <- daten$stress_vorher - daten$stress_nachher
hist(diff, main = "Differenz: Stress vorher - nachher", col = "lightgray",
xlab = "Differenzwerte", breaks = 8)
# oder Boxplot
boxplot(daten$stress_vorher, daten$stress_nachher, names = c("Vorher", "Nachher"),
main = "Stressniveau vor und nach dem Training", ylab = "Stress (1-10)",
col = c("lightblue", "lightgreen"))
Zusammenfassung
Schritt | Was Du machst |
---|---|
1 | Zwei verbundene Messungen vorbereiten (z. B. vorher/nachher) |
2 | t.test(x, y, paired = TRUE) durchführen |
3 | p-Wert, Konfidenzintervall und Mittelwertdifferenz interpretieren |
4 | Optional: Visualisieren mit Histogramm oder Boxplot |
Q&A zum Mitdenken
Frage 1: Wann benutzt Du den t-Test für abhängige Stichproben?
Antwort: Wenn Du zwei verbundene Messungen pro Fall hast, z. B. Vorher–Nachher-Daten oder Messwiederholungen.
Frage 2: Was prüft der Test konkret?
Antwort: Ob der Mittelwert der Differenzen signifikant von null abweicht.
Frage 3: Wie führst Du ihn in R durch?
Antwort: Mit t.test(x, y, paired = TRUE)
Frage 4: Was bedeutet ein p-Wert von 0.00005?
Antwort: Es ist extrem unwahrscheinlich, so einen Unterschied durch Zufall zu bekommen. Das Ergebnis ist hochsignifikant.
Alles klar?
Ich hoffe, der Beitrag war für dich soweit verständlich. Wenn du weitere Fragen hast, nutze bitte hier die Möglichkeit, eine Frage an mich zu stellen!