Du hast zwei Gruppen – zum Beispiel Männer und Frauen – und möchtest wissen, ob sie sich in einem bestimmten Merkmal wie Stressempfinden, Lernerfolg oder Reaktionszeit unterscheiden. Dafür brauchst Du den t-Test für unabhängige Stichproben. In diesem Beitrag zeige ich Dir, wie Du ihn in R durchführst und interpretierst.
Wann brauchst Du diesen Test?
Definition:
Der t-Test für unabhängige Stichproben prüft, ob sich die Mittelwerte zweier Gruppen signifikant voneinander unterscheiden.
Nullhypothese: $H_0: \mu_1 = \mu_2$
Alternativhypothese: $H_1: \mu_1 \ne \mu_2$ (zweiseitig)
Voraussetzung: Die Gruppen sind unabhängig voneinander. Jede Person gehört also nur zu einer Gruppe.
Beispiel: Prüfungsstress in zwei Studiengängen
Angenommen, Du hast Daten von Studierenden zweier Studiengänge: Psychologie und BWL. Du willst wissen, ob sich ihr durchschnittlicher Prüfungsstress unterscheidet.
# Beispiel-Datensatz erzeugen
set.seed(42)
gruppe <- rep(c("Psychologie", "BWL"), each = 30)
stress <- c(rnorm(30, mean = 7, sd = 1), rnorm(30, mean = 6.5, sd = 1.2))
daten <- data.frame(gruppe, stress)
Durchführung des t-Tests in R
# t-Test für unabhängige Gruppen
t.test(stress ~ gruppe, data = daten)
R erkennt automatisch, welche Variable die Gruppierung ist (gruppe
) und welche die Zielvariable ist (stress
). Standardmäßig wird kein Varianzgleichheit angenommen (Welch-Test). Du kannst diese Default-Einstellung auch überschreiben, sodass der klassische t-Test durchgeführt wird (siehe weiter unten!).
Beispielausgabe (verkürzt)
Welch Two Sample t-test
data: stress by gruppe
t = 1.865, df = 56.12, p-value = 0.067
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.029 1.109
sample estimates:
mean in group BWL mean in group Psychologie
6.460 7.030
Interpretation der Ergebnisse
Kennwert | Bedeutung |
---|---|
t = 1.865 | Teststatistik – Stärke der Mittelwertabweichung |
df = 56.12 | Freiheitsgrade (ungefähr, da Varianzen ungleich) |
p-value = 0.067 | Der p-Wert – ist größer als 0.05 |
Konfidenzintervall | Enthält 0 → kein signifikanter Unterschied |
Mittelwerte | Psychologie: 7.03, BWL: 6.46 |
Fazit: Kein signifikanter Unterschied auf dem 5%-Niveau. Es gibt einen Trend, aber er ist nicht stark genug, um die Nullhypothese zu verwerfen.
Gleichheit der Varianzen prüfen
Du kannst die Varianzgleichheit mit einem F-Test prüfen:
var.test(stress ~ gruppe, data = daten)
Wenn der p-Wert > 0.05 ist, kannst Du Varianzgleichheit annehmen. Dann kannst Du den klassischen t-Test verwenden:
t.test(stress ~ gruppe, data = daten, var.equal = TRUE)
Zusammenfassung
Schritt | Was Du tust |
---|---|
1 | Daten strukturieren: metrische Zielvariable + Gruppierungsvariable |
2 | Test durchführen: t.test(y ~ gruppe, data = ...) |
3 | Optional: var.test() für Varianzgleichheit |
4 | Ergebnis interpretieren: p-Wert, Konfidenzintervall, Mittelwerte |
5 | Optional: Visualisierung mit boxplot() |
Q&A zum Mitdenken
Frage 1: Wann benutzt Du den t-Test für unabhängige Stichproben?
Antwort: Wenn Du zwei unabhängige Gruppen vergleichen willst – z. B. Männer vs. Frauen.
Frage 2: Was ist der Unterschied zwischen var.equal = TRUE
und FALSE
?
Antwort: TRUE nimmt gleiche Varianzen an (klassischer t-Test), FALSE (Standard) verwendet den robusteren Welch-Test bei ungleichen Varianzen.
Frage 3: Wie kannst Du prüfen, ob die Varianzen gleich sind?
Antwort: Mit dem Befehl var.test()
– ergibt sich ein p-Wert > 0.05, kann Gleichheit angenommen werden.
Frage 4: Was bedeutet ein p-Wert von 0.067?
Antwort: Es gibt keinen statistisch signifikanten Unterschied auf dem 5%-Niveau, aber möglicherweise auf dem 10%-Niveau (Hinweis auf einen Trend).
Alles klar?
Ich hoffe, der Beitrag war für dich soweit verständlich. Wenn du weitere Fragen hast, nutze bitte hier die Möglichkeit, eine Frage an mich zu stellen!