In diesem Beitrag zeige ich Dir Schritt für Schritt, wie Du in R einen t-Test mit nur einer Stichprobe durchführst – also einen sogenannten One-Sample t-Test. Der eignet sich immer dann, wenn Du den Mittelwert einer einzigen Gruppe mit einem bestimmten Referenzwert vergleichen willst.
Was ist der Zweck eines One-Sample t-Tests?
Stell Dir vor, Du möchtest prüfen, ob Studierende an Deiner Uni im Schnitt wirklich die empfohlenen 7 Stunden schlafen. Du erhebst von 30 Personen ihre tatsächliche Schlafdauer. Jetzt willst Du wissen: Ist der Mittelwert signifikant anders als 7?
Definition:
Ein One-Sample t-Test vergleicht den Mittelwert einer Stichprobe mit einem festgelegten theoretischen Wert $\mu_0$.
Die Nullhypothese lautet: $H_0: \mu = \mu_0$
Die Alternativhypothese: $H_1: \mu \ne \mu_0$ (zweiseitig)
(Oder $H_1: \mu < \mu_0$ bzw. $H_1: \mu > \mu_0$ einseitig)
Beispiel: Schlafdauer von Studierenden
Wir simulieren ein kleines Beispiel. Angenommen, Du hast folgende Schlafangaben (in Stunden):
# Beispiel-Daten erzeugen
schlaf <- c(6.5, 7.0, 6.8, 7.1, 6.9, 6.2, 6.4, 6.7, 6.5, 7.0,
6.6, 6.8, 7.2, 6.5, 6.9, 7.1, 6.4, 6.8, 6.7, 6.9)
Nun möchtest Du testen, ob der Durchschnitt signifikant von 7 Stunden abweicht.
Durchführung in R
# t-Test gegen den Mittelwert 7
t.test(schlaf, mu = 7)
Hier gibst Du die Variable an (schlaf
) und den Referenzwert (mu = 7
). Standardmäßig wird zweiseitig getestet.
Beispielausgabe (verkürzt)
One Sample t-test
data: schlaf
t = -3.028, df = 19, p-value = 0.0068
alternative hypothesis: true mean is not equal to 7
95 percent confidence interval:
6.60 6.87
sample estimates:
mean of x
6.735
Interpretation
Element | Bedeutung |
---|---|
t = -3.028 | Der Testwert – die Abweichung in Standardfehler-Einheiten |
df = 19 | Freiheitsgrade (n – 1) |
p-value = 0.0068 | Wahrscheinlichkeit, ein Ergebnis so extrem (oder extremer) zu sehen, wenn $H_0$ wahr ist |
CI = [6.60, 6.87] | 95 %-Konfidenzintervall für den Mittelwert |
mean = 6.735 | Der tatsächliche Mittelwert in Deiner Stichprobe |
Fazit: Da der p-Wert kleiner als 0.05 ist, verwerfen wir $H_0$. Die Studierenden schlafen signifikant weniger als 7 Stunden.
Einseitiger Test
Wenn Du eine gerichtete Hypothese hast (z. B. „Studierende schlafen weniger als 7″), kannst Du den Test einseitig durchführen:
t.test(schlaf, mu = 7, alternative = "less")
Oder:
t.test(schlaf, mu = 7, alternative = "greater")
Normalverteilung prüfen
Gerade bei kleinen Stichproben solltest Du kontrollieren, ob die Daten annähernd normalverteilt sind.
# Histogramm + Dichte
hist(schlaf, breaks = 8, probability = TRUE, col = "lightblue", main = "Verteilung der Schlafdauer")
lines(density(schlaf), col = "red", lwd = 2)
# Q-Q-Plot
qqnorm(schlaf)
qqline(schlaf, col = "blue")
Wenn das Histogramm symmetrisch ist und die Punkte im Q-Q-Plot etwa auf der Linie liegen, ist die Annahme gerechtfertigt.
Zusammenfassung
Schritt | Aktion |
---|---|
1 | Daten erfassen (metrische Variable) |
2 | Ziel formulieren (Vergleich mit einem festen Wert) |
3 | Test mit t.test() durchführen |
4 | Ergebnis interpretieren (p-Wert, Konfidenzintervall) |
5 | Optional: Normalverteilung prüfen |
Q&A zum Mitdenken
Frage 1: Was testet der One-Sample t-Test?
Antwort: Ob der Mittelwert einer Stichprobe signifikant von einem festgelegten Referenzwert abweicht.
Frage 2: Wann ist der Test aussagekräftig?
Antwort: Wenn die Variable metrisch ist und die Daten (annähernd) normalverteilt sind, vor allem bei kleinen Stichproben.
Frage 3: Wie wird der Test in R durchgeführt?
Antwort: Mit t.test(variable, mu = gewünschter_Wert)
Frage 4: Was bedeutet ein p-Wert kleiner als 0.05?
Antwort: Der beobachtete Unterschied ist statistisch signifikant; wir verwerfen die Nullhypothese.