Prüfungsaufgaben Deskriptive Statistik (mittel)

Aufgabe 1

# ─────────────────────────────────────────────────────────────────────────────
# Aufgabe 1: Gewichtetes Mittel
# Drei Gruppen mit Punktzahlen und Gruppengrößen → gewichtet das Mittel berechnen.
# ─────────────────────────────────────────────────────────────────────────────

# 1. Datensatz anlegen
scores <- c(80, 90, 70)               # Punktzahlen der Gruppen
sizes  <- c(10,  5,  5)               # Gruppengrößen

# 2. Numerator und Denominator
sum(scores * sizes)                   # Summe der gewichteten Punktzahlen
#> [1] 7250
sum(sizes)                            # Summe aller Gewichte
#> [1] 20

# 3. Gewichtetes Mittel
sum(scores * sizes) / sum(sizes)      # Ergebnis: gewogenes Mittel
#> [1] 80.83333

# Interpretationsfragen:
# - Warum unterscheidet sich dieses Mittel (80,83) vom ungewichteten (80)?
# - In welchem Fall ist die Gewichtung besonders wichtig?

Aufgabe 2

# ─────────────────────────────────────────────────────────────────────────────
# Aufgabe 2: Variationskoeffizient
# Wir haben Messwerte, berechnen Koef. = SD/Mittel * 100 % und deuten ihn.
# ─────────────────────────────────────────────────────────────────────────────

# 1. Datensatz anlegen
values <- c(101, 99, 100, 102, 98)     # Fünf Messwerte

# 2. Standardabweichung und Mittel
sd(values)                            # Berechne SD
#> [1] 1.581139
mean(values)                          # Berechne Mittel
#> [1] 100

# 3. Variationskoeffizient in %
100 * sd(values) / mean(values)      # SD relativ zum Mittel
#> [1] 1.581139

# Interpretationsfragen:
# - Was bedeutet ein VK von ≈1,58 %?

Aufgabe 3

# ─────────────────────────────────────────────────────────────────────────────
# Aufgabe 3: Quantile der Wartezeiten
# Wir ermitteln 25%, 50%, 75% Quantile und deuten sie.
# ─────────────────────────────────────────────────────────────────────────────

# 1. Datensatz anlegen
waits <- c(2, 3, 7, 8, 9, 10)         # Sechs Wartezeit‑Messungen

# 2. Quantile bestimmen
quantile(waits, probs = c(.25, .5, .75))  # 25%, 50%(Median), 75%
#>  25%  50%  75% 
#>  4.25 7.00 8.75 

# Interpretationsfragen:
# - Wie interpretieren Sie das 25 %-Quantil von 4,25 Min.?
# - Welche Information liefert ein Quantil, die Median und Mittel nicht liefern?

Aufgabe 4

# ─────────────────────────────────────────────────────────────────────────────
# Aufgabe 4: SD vs. IQR bei Ausreißern
# Ein Vektor mit Ausreißer und einer ohne → vergleiche SD und IQR.
# ─────────────────────────────────────────────────────────────────────────────

# 1. Datensätze anlegen
data1 <- c(10, 12, 11, 13, 200)   # Mit Ausreißer
data2 <- data1[-5]                # Ohne Ausreißer

# 2. Streuungsmaße
sd(data1)  # SD mit Ausreißer
#> [1] 86.71278
sd(data2)  # SD ohne Ausreißer
#> [1] 1.581139
IQR(data1) # IQR mit Ausreißer
#> [1] 1
IQR(data2) # IQR ohne Ausreißer
#> [1] 1

# Interpretationsfragen:
# - Warum bleibt der IQR konstant (1), während die SD massiv steigt?
# - Was empfiehlt sich bei Ausreißern: SD oder IQR?

Aufgabe 5

# ─────────────────────────────────────────────────────────────────────────────
# Aufgabe 5 Dichteplot (Lagemaß & Streuung)
# Wir simulieren 100 Werte (Gauss), schauen Summary und zeichnen Dichteplot.
# ─────────────────────────────────────────────────────────────────────────────

# 1. Zufallssamen setzen
set.seed(42)                       # Reproduzierbarkeit garantieren

# 2. Daten simulieren
x <- rnorm(100, mean = 50, sd = 5)  # 100 Normalverteilte Werte

# 3. Deskriptives Summary
summary(x)                         # Min, 1st Qu., Median, Mean, 3rd Qu., Max
#>   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>  40.37   45.20   49.47   49.23   52.58   53.46 

# 4. Dichteplot
plot(density(x), main="Dichte von x")  # Glatte Dichtekurve zeichnen


# Interpretationsfragen:
# - Stelle die Kurve skizzenhaft dar.