Klausuraufgabe Zusammenhangshypothesen

Angabe

Abstract

In der vorliegenden Studie wurde untersucht, ob ein Zusammenhang zwischen der täglichen Bildschirmzeit und der subjektiv wahrgenommenen Schlafqualität bei Studierenden besteht. Dazu wurden 30 Studierende der Universität Wien befragt. Die Bildschirmzeit wurde in Stunden pro Tag erfasst, die Schlafqualität mittels eines standardisierten Fragebogens mit einer Skala von 1 (sehr schlecht) bis 10 (sehr gut) bewertet. Ziel war es, den linearen Zusammenhang zwischen diesen Variablen zu analysieren und zu prüfen, ob eine höhere Bildschirmzeit mit einer schlechteren Schlafqualität einhergeht.


Datenerhebung

Die Daten wurden in einer Querschnittsstudie erhoben. Die Variablen umfassen:

  • Bildschirmzeit: Tägliche Bildschirmzeit in Stunden (metrisch).
  • Schlafqualität: Subjektive Bewertung der Schlafqualität auf einer Skala von 1 bis 10 (metrisch).

R-Skript zur Datenanalyse

# Daten eingeben
bildschirmzeit <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11,
3, 4, 5, 6, 7, 8, 9, 10, 11, 12,
4, 5, 6, 7, 8, 9, 10, 11, 12, 13)
schlafqualitaet <- c(9, 8, 7, 7, 6, 5, 5, 4, 3, 3,
8, 7, 7, 6, 5, 5, 4, 3, 3, 2,
7, 7, 6, 5, 5, 4, 3, 3, 2, 2)

# Datenrahmen erstellen
df <- data.frame(bildschirmzeit, schlafqualitaet)

# Deskriptive Statistiken
summary(df)

# Voraussetzungen prüfen
# Shapiro-Wilk-Test auf Normalverteilung
shapiro.test(df$bildschirmzeit)
shapiro.test(df$schlafqualitaet)

# Levene-Test auf Varianzhomogenität
library(car)
leveneTest(schlafqualitaet ~ bildschirmzeit, data = df)

# Parametrischer Test: Pearson-Korrelation
cor.test(df$bildschirmzeit, df$schlafqualitaet, method = "pearson")

# Nichtparametrischer Test: Spearman-Korrelation
cor.test(df$bildschirmzeit, df$schlafqualitaet, method = "spearman")

Output des R-Skripts (Auszug)

# Deskriptive Statistiken
summary(df)
# bildschirmzeit
# Min. : 2.00
# 1st Qu.: 5.00
# Median : 7.50
# Mean : 7.50
# 3rd Qu.:10.00
# Max. :13.00

# schlafqualitaet
# Min. :2.00
# 1st Qu.:4.00
# Median :5.00
# Mean :5.33
# 3rd Qu.:7.00
# Max. :9.00

# Shapiro-Wilk-Test
shapiro.test(df$bildschirmzeit)
# W = 0.954, p-value = 0.217

shapiro.test(df$schlafqualitaet)
# W = 0.961, p-value = 0.356

# Levene-Test
leveneTest(schlafqualitaet ~ bildschirmzeit, data = df)
# F = 1.234, p-value = 0.276

# Pearson-Korrelation
cor.test(df$bildschirmzeit, df$schlafqualitaet, method = "pearson")
# t = -9.876, df = 28, p-value < 0.001
# correlation coefficient = -0.88

# Spearman-Korrelation
cor.test(df$bildschirmzeit, df$schlafqualitaet, method = "spearman")
# S = 1200, p-value < 0.001
# rho = -0.85

Prüfungsfragen

1. Interpretation der Ergebnisse:

a) Wie interpretieren Sie den Pearson-Korrelationskoeffizienten in Bezug auf Richtung und Stärke des Zusammenhangs?

b) Was bedeutet der p-Wert im Kontext des Pearson-Tests?

2. Theoretisches Wissen:

a) Welche Voraussetzungen müssen für die Anwendung des Pearson-Korrelationskoeffizienten erfüllt sein?

b) Warum könnte in manchen Fällen der Spearman-Korrelationskoeffizient bevorzugt werden?

3. Methodische Reflexion:

a) Welche Vorteile bietet die Verwendung beider Korrelationsmaße in einer Analyse?

b) Wie würden Sie vorgehen, wenn die Normalverteilungsannahme verletzt wäre?

Lösungsschema

1. Interpretation der Ergebnisse:

a) Der Pearson-Korrelationskoeffizient beträgt -0.88, was auf einen starken negativen linearen Zusammenhang zwischen Bildschirmzeit und Schlafqualität hinweist. Das bedeutet, dass mit zunehmender Bildschirmzeit die Schlafqualität tendenziell abnimmt.

b) Der p-Wert ist kleiner als 0.001, was darauf hinweist, dass der beobachtete Zusammenhang statistisch signifikant ist. Es besteht also ein sehr geringer Wahrscheinlichkeit, dass dieser Zusammenhang zufällig ist.

2. Theoretisches Wissen:

a) Für die Anwendung des Pearson-Korrelationskoeffizienten sollten folgende Voraussetzungen erfüllt sein:

  • Beide Variablen sind metrisch skaliert.
  • Die Beziehung zwischen den Variablen ist linear.
  • Die Variablen sind normalverteilt.
  • Es liegen keine Ausreißer vor.

b) Der Spearman-Korrelationskoeffizient wird bevorzugt, wenn die Daten nicht normalverteilt sind oder wenn die Beziehung zwischen den Variablen nicht linear, sondern monoton ist.

3. Methodische Reflexion:

a) Die Verwendung beider Korrelationsmaße ermöglicht eine umfassendere Analyse: Während der Pearson-Koeffizient lineare Zusammenhänge misst, erfasst der Spearman-Koeffizient monotone Beziehungen. Dies hilft, die Robustheit der Ergebnisse zu überprüfen und unterschiedliche Aspekte des Zusammenhangs zu beleuchten.

b) Wenn die Normalverteilungsannahme verletzt ist, sollte der Spearman-Korrelationskoeffizient verwendet werden, da er keine Normalverteilung der Variablen voraussetzt und auf Rangdaten basiert.