Wie kannst Du Mittelwerte vergleichen – und zwar so, dass es auch statistisch Hand und Fuß hat? Willkommen in der Familie der t-Tests. Sie zählen zu den Klassikern in der Statistik und sind besonders nützlich, wenn Du mit metrischen Daten arbeitest und wissen willst, ob sich Gruppen wirklich unterscheiden – oder ob das alles nur Zufall sein könnte.
Was ist das Ziel eines t-Tests?
Ein t-Test prüft, ob sich Mittelwerte signifikant voneinander unterscheiden. Dabei kann es um ganz verschiedene Fragen gehen:
- Hat Deine Stichprobe einen anderen Mittelwert als der theoretische Erwartungswert?
- Unterscheiden sich zwei Gruppen in ihrem Mittelwert?
- Hat sich in einer Gruppe vorher und nachher etwas verändert?
Diese drei Fragen führen direkt zu den drei Hauptvarianten der t-Tests (mehr dazu gleich).
💡 Definition:
Ein t-Test ist ein statistischer Test, der prüft, ob ein beobachteter Mittelwert von einem Referenzwert oder einem anderen Mittelwert abweicht – unter der Annahme, dass die zugrunde liegenden Daten (annähernd) normalverteilt sind.
Welche Voraussetzungen müssen erfüllt sein?
Damit Du einen t-Test sinnvoll anwenden kannst, sollten folgende Voraussetzungen grob erfüllt sein:
Voraussetzung | Beschreibung |
---|---|
Skalenniveau | Die abhängige Variable sollte metrisch (Intervall- oder Verhältnisskala) sein. |
Verteilung | Die Daten sollten (annähernd) normalverteilt sein – vor allem bei kleinen Stichproben. |
Varianzgleichheit (nur bei 2 Gruppen) | Bei klassischen t-Tests für unabhängige Gruppen wird oft Varianzgleichheit vorausgesetzt. Falls das nicht gegeben ist, kannst Du auf die Welch-Korrektur ausweichen. |
Unabhängigkeit | Beobachtungen innerhalb einer Gruppe sollen unabhängig voneinander sein. Bei gepaarten Designs (z. B. Messwiederholung) wird diese Annahme auf die Differenzen angewendet. |
Wie müssen die Daten aussehen?
Je nach Variante brauchst Du Deine Daten in etwas anderer Form:
Testart | Datentyp | Beispielstruktur |
---|---|---|
One-Sample t-Test | Eine metrische Variable, deren Mittelwert mit einem festen Wert verglichen wird | gewicht |
Two-Sample t-Test | Eine metrische Variable + Gruppierungsvariable | gewicht , gruppe (z. B. „Diät“, „Kontrolle“) |
Paired t-Test | Zwei verknüpfte metrische Variablen pro Fall | vorher , nachher |
Welche Arten von t-Tests gibt es?
Hier ein Überblick über die drei Standardvarianten:
1️⃣ One-Sample t-Test
Du hast eine Stichprobe und willst wissen, ob der Mittelwert von einem bestimmten Wert abweicht. Beispiel: Hat eine Studierendengruppe im Schnitt wirklich 6 Stunden Schlaf?
$\Rightarrow$ Vergleich eines Stichprobenmittelwerts mit einem theoretischen Wert.
2️⃣ Two-Sample t-Test (unabhängige Gruppen)
Du willst zwei Gruppen miteinander vergleichen. Beispiel: Hat eine neue Lernmethode zu besseren Testergebnissen geführt?
$\Rightarrow$ Vergleich der Mittelwerte zweier unabhängiger Gruppen.
🔍 Wenn die Varianzen gleich sind: klassischer t-Test
🔍 Wenn nicht: Welch-Test (Varianzen nicht gleich angenommen)
3️⃣ Paired t-Test (abhängige Messungen)
Du misst bei denselben Personen zweimal. Beispiel: Vorher-Nachher-Vergleich nach einem Workshop zur Stressbewältigung.
$\Rightarrow$ Vergleich der Mittelwerte von zwei Messzeitpunkten bei denselben Personen.
Was tun, wenn die Voraussetzungen verletzt sind?
Wenn die Normalverteilung nicht gegeben ist oder Du mit Ordinaldaten arbeitest, kannst Du nicht-parametrische Alternativen verwenden. Hier ein Überblick:
Parametrischer Test | Nicht-parametrische Alternative | Einsatzfall |
---|---|---|
One-Sample t-Test | Kein direktes Äquivalent, evtl. Sign-Test | Bei kleinen n ohne Normalverteilung |
Two-Sample t-Test | Mann-Whitney-U-Test | Zwei unabhängige Gruppen |
Paired t-Test | Wilcoxon-Vorzeichen-Rang-Test | Vorher-Nachher oder Paarvergleiche |
Beispielideen aus der Psychologie
- One-Sample t-Test:
„Schlafen Psychologiestudierende weniger als 7 Stunden?“ - Two-Sample t-Test:
„Unterscheiden sich Männer und Frauen in ihrem Prüfungsstresslevel?“ - Paired t-Test:
„Hilft eine Atemübung, den Puls zu senken?“
Fazit
Testart | Ziel | Typische Anwendung | Formel |
---|---|---|---|
One-Sample | $\bar{x}$ vs. $\mu_0$ | Vergleich mit bekanntem Wert | $t = \frac{\bar{x} – \mu_0}{s / \sqrt{n}}$ |
Two-Sample | $\bar{x}_1$ vs. $\bar{x}_2$ | Gruppenvergleich | $t = \frac{\bar{x}_1 – \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}$ |
Paired | $\bar{d}$ vs. $0$ | Vorher-Nachher | $t = \frac{\bar{d}}{s_d / \sqrt{n}}$ |
Q&A zum Mitdenken
Frage 1: Wann verwendet man einen paired t-Test?
Antwort: Wenn dieselben Personen zwei Messzeitpunkte durchlaufen, z. B. vor und nach einer Intervention.
Frage 2: Welche Voraussetzung sollte bei kleinen Stichproben erfüllt sein, damit ein t-Test gültig ist?
Antwort: Die Daten sollten annähernd normalverteilt sein.
Frage 3: Was ist die typische nicht-parametrische Alternative zum Two-Sample t-Test?
Antwort: Der Mann-Whitney-U-Test.
Frage 4: Was prüft der t-Test im Kern?
Antwort: Ob der Unterschied der Mittelwerte (zwischen Gruppe oder zu einem Referenzwert) größer ist als zufällig zu erwarten.