Einführung in den T-Test

Wie kannst Du Mittelwerte vergleichen – und zwar so, dass es auch statistisch Hand und Fuß hat? Willkommen in der Familie der t-Tests. Sie zählen zu den Klassikern in der Statistik und sind besonders nützlich, wenn Du mit metrischen Daten arbeitest und wissen willst, ob sich Gruppen wirklich unterscheiden – oder ob das alles nur Zufall sein könnte.

Was ist das Ziel eines t-Tests?

Ein t-Test prüft, ob sich Mittelwerte signifikant voneinander unterscheiden. Dabei kann es um ganz verschiedene Fragen gehen:

  • Hat Deine Stichprobe einen anderen Mittelwert als der theoretische Erwartungswert?
  • Unterscheiden sich zwei Gruppen in ihrem Mittelwert?
  • Hat sich in einer Gruppe vorher und nachher etwas verändert?

Diese drei Fragen führen direkt zu den drei Hauptvarianten der t-Tests (mehr dazu gleich).

💡 Definition:
Ein t-Test ist ein statistischer Test, der prüft, ob ein beobachteter Mittelwert von einem Referenzwert oder einem anderen Mittelwert abweicht – unter der Annahme, dass die zugrunde liegenden Daten (annähernd) normalverteilt sind.

Welche Voraussetzungen müssen erfüllt sein?

Damit Du einen t-Test sinnvoll anwenden kannst, sollten folgende Voraussetzungen grob erfüllt sein:

VoraussetzungBeschreibung
SkalenniveauDie abhängige Variable sollte metrisch (Intervall- oder Verhältnisskala) sein.
VerteilungDie Daten sollten (annähernd) normalverteilt sein – vor allem bei kleinen Stichproben.
Varianzgleichheit (nur bei 2 Gruppen)Bei klassischen t-Tests für unabhängige Gruppen wird oft Varianzgleichheit vorausgesetzt. Falls das nicht gegeben ist, kannst Du auf die Welch-Korrektur ausweichen.
UnabhängigkeitBeobachtungen innerhalb einer Gruppe sollen unabhängig voneinander sein. Bei gepaarten Designs (z. B. Messwiederholung) wird diese Annahme auf die Differenzen angewendet.

Wie müssen die Daten aussehen?

Je nach Variante brauchst Du Deine Daten in etwas anderer Form:

TestartDatentypBeispielstruktur
One-Sample t-TestEine metrische Variable, deren Mittelwert mit einem festen Wert verglichen wirdgewicht
Two-Sample t-TestEine metrische Variable + Gruppierungsvariablegewicht, gruppe (z. B. „Diät“, „Kontrolle“)
Paired t-TestZwei verknüpfte metrische Variablen pro Fallvorher, nachher

Welche Arten von t-Tests gibt es?

Hier ein Überblick über die drei Standardvarianten:

1️⃣ One-Sample t-Test

Du hast eine Stichprobe und willst wissen, ob der Mittelwert von einem bestimmten Wert abweicht. Beispiel: Hat eine Studierendengruppe im Schnitt wirklich 6 Stunden Schlaf?

$\Rightarrow$ Vergleich eines Stichprobenmittelwerts mit einem theoretischen Wert.

2️⃣ Two-Sample t-Test (unabhängige Gruppen)

Du willst zwei Gruppen miteinander vergleichen. Beispiel: Hat eine neue Lernmethode zu besseren Testergebnissen geführt?

$\Rightarrow$ Vergleich der Mittelwerte zweier unabhängiger Gruppen.

🔍 Wenn die Varianzen gleich sind: klassischer t-Test
🔍 Wenn nicht: Welch-Test (Varianzen nicht gleich angenommen)

3️⃣ Paired t-Test (abhängige Messungen)

Du misst bei denselben Personen zweimal. Beispiel: Vorher-Nachher-Vergleich nach einem Workshop zur Stressbewältigung.

$\Rightarrow$ Vergleich der Mittelwerte von zwei Messzeitpunkten bei denselben Personen.

Was tun, wenn die Voraussetzungen verletzt sind?

Wenn die Normalverteilung nicht gegeben ist oder Du mit Ordinaldaten arbeitest, kannst Du nicht-parametrische Alternativen verwenden. Hier ein Überblick:

Parametrischer TestNicht-parametrische AlternativeEinsatzfall
One-Sample t-TestKein direktes Äquivalent, evtl. Sign-TestBei kleinen n ohne Normalverteilung
Two-Sample t-TestMann-Whitney-U-TestZwei unabhängige Gruppen
Paired t-TestWilcoxon-Vorzeichen-Rang-TestVorher-Nachher oder Paarvergleiche

Beispielideen aus der Psychologie

  1. One-Sample t-Test:
    „Schlafen Psychologiestudierende weniger als 7 Stunden?“
  2. Two-Sample t-Test:
    „Unterscheiden sich Männer und Frauen in ihrem Prüfungsstresslevel?“
  3. Paired t-Test:
    „Hilft eine Atemübung, den Puls zu senken?“

Fazit

TestartZielTypische AnwendungFormel
One-Sample$\bar{x}$ vs. $\mu_0$Vergleich mit bekanntem Wert$t = \frac{\bar{x} – \mu_0}{s / \sqrt{n}}$
Two-Sample$\bar{x}_1$ vs. $\bar{x}_2$Gruppenvergleich$t = \frac{\bar{x}_1 – \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}$
Paired$\bar{d}$ vs. $0$Vorher-Nachher$t = \frac{\bar{d}}{s_d / \sqrt{n}}$

Q&A zum Mitdenken

Frage 1: Wann verwendet man einen paired t-Test?
Antwort: Wenn dieselben Personen zwei Messzeitpunkte durchlaufen, z. B. vor und nach einer Intervention.

Frage 2: Welche Voraussetzung sollte bei kleinen Stichproben erfüllt sein, damit ein t-Test gültig ist?
Antwort: Die Daten sollten annähernd normalverteilt sein.

Frage 3: Was ist die typische nicht-parametrische Alternative zum Two-Sample t-Test?
Antwort: Der Mann-Whitney-U-Test.

Frage 4: Was prüft der t-Test im Kern?
Antwort: Ob der Unterschied der Mittelwerte (zwischen Gruppe oder zu einem Referenzwert) größer ist als zufällig zu erwarten.