...

Übungsprojekt: Saubere Daten (mittel)

📘 Szenario

Du hast eine kurze Umfrage mit 6 Aussagen durchgeführt. Je 3 Items messen Alltagsstress, 3 Items messen Erholungsverhalten. Manche Items sind negativ formuliert und müssen umgepolt werden.
Die Skala geht von 1 (stimme überhaupt nicht zu) bis 8 (stimme voll und ganz zu).

Die Items

🧠 Stress:

  1. Ich fühle mich oft gehetzt.
  2. Ich habe zu wenig Zeit für mich selbst.
  3. Ich kann gut mit Stress umgehen. (umgepolt)

🌿 Erholung:

  1. Ich nehme mir bewusst Pausen.
  2. Ich finde es schwer, abzuschalten. (umgepolt)
  3. Ich mache regelmäßig Dinge, die mir gut tun.

Aufgabenstellung

  1. Importiere die Datei stress_erholung.csv.
  2. Rekodiere die Items 3 und 5 mit der Formel 9 - x (damit wird 1 ↔ 8 gespiegelt).
  3. Berechne die beiden Skalenmittelwerte:
    • stress_score aus Items 1, 2, item3_rek
    • erholung_score aus Items 4, item5_rek, 6
      (Tipp: Achte auf fehlende Werte – sie sollen ignoriert werden!)
  4. Berechne eine neue Variable differenz_score, also stress_score - erholung_score
    → Positive Werte bedeuten: mehr Stress als Erholung.
  5. Kontrolliere, ob die Werte plausibel aussehen.

💡 Lösungsweg in R

Hier habe ich ein schnelles Video für dich aufgenommen.

Hier ist die Lösung als R-Code:

# 1. Importieren
daten <- read.csv("stress_erholung.csv")

# 2. Rekodieren der umgepolten Items
daten$item3_rek <- 9 - daten$item3
daten$item5_rek <- 9 - daten$item5

# 3. Skalenmittelwerte berechnen (mit NA-Behandlung)
daten$stress_score <- rowMeans(daten[, c("item1", "item2", "item3_rek")], na.rm = TRUE)
daten$erholung_score <- rowMeans(daten[, c("item4", "item5_rek", "item6")], na.rm = TRUE)

# 4. Differenzvariable berechnen
daten$differenz_score <- daten$stress_score - daten$erholung_score

# 5. Kontrolle
head(daten)

💡 Lösungsweg in SPSS (Schritt für Schritt)

Hier der Lösungsweg im SPSS Nachbau PSPP.

1. Importieren

  • Datei → Daten öffnen → Textdatei → stress_erholung.csv
  • Trennzeichen: Komma → Weiter → Fertigstellen

2. Rekodiere Items 3 und 5 mit 9 - x

  • Menü: Transformieren → Variable berechnen
  • Neue Variable: item3_rek
    • Formel: 9 - item3
  • Wiederhole: item5_rek = 9 - item5

3. Berechne die Skalenmittelwerte

  • Menü: Transformieren → Variable berechnen
  • Neue Variable: stress_score
    • Formel: MEAN.3(item1, item2, item3_rek)
  • Neue Variable: erholung_score
    • Formel: MEAN.3(item4, item5_rek, item6) (Das .3 bedeutet: „mindestens 3 gültige Werte notwendig“, du kannst auch MEAN.2() wählen)

4. Differenz berechnen

  • Transformieren → Variable berechnen
  • Neue Variable: differenz_score
    • Formel: stress_score - erholung_score

5. Ergebnis prüfen

  • Daten-Editor → neue Variablen anzeigen
  • Menü: Analysieren → Deskriptive Statistiken → Häufigkeiten oder Mittelwerte