...

Lagemaße in der deskriptiven Statistik

In der deskriptiven Statistik gibt es eine Vielzahl von Lagemaßen, die uns dabei helfen, das Zentrum einer Datenverteilung zu beschreiben – ein Inhalt, der in keiner Einführung in die Statistik fehlen darf. Diese Lagemaße sind essenziell, um die Charakteristiken einer Datenverteilung zu verstehen. Das ist insbesondere auch in der Verwendung der Statistik in der Psychologie bzw. der Arbeitspsychologie von Bedeutung. Die wichtigsten von ihnen, die wir uns heute ansehen, sind das arithmetische Mittel, der Median und der Modus.

Bevor du startest, stelle sicher, dass du weißt, wie eine statistische Datentabelle aussieht.

Lagemaße

Arithmetisches Mittel

Das arithmetische Mittel ist das bekannteste Lagemaß und wird oft einfach als „Durchschnitt“ bezeichnet. Du berechnest es, indem du alle beobachteten Werte addierst und durch die Anzahl der Beobachtungen teilst. Ein einfaches Beispiel:

Stell dir vor, du hast die folgenden fünf Beobachtungen: 4, 6, 8, 10, 12

Das arithmetische Mittel (x_bar) berechnest du so:

x_bar = (x1 + x2 + x3 + x4 + x5)/n =
= (4 + 6 + 8 + 10 + 12)/5 =
= 40/5 =
= 8

Das arithmetische Mittel dieser Daten ist also 8. Besonders geeignet ist das arithmetische Mittel für symmetrische Verteilungen ohne Ausreißer.

Beispiel in R
Du kannst das arithmetische Mittel in R ganz einfach berechnen:

# Beispiel: Berechnung des arithmetischen Mittels
werte <- c(4, 6, 8, 10, 12)
mean(werte)

Das Ergebnis ist 8.

lagemaße in der deskriptiven statistik

Median

Der Median teilt eine sortierte Datenmenge in zwei gleich große Hälften. 50 % der Werte liegen unter dem Median, 50 % darüber. Dies ist besonders nützlich bei asymmetrischen Verteilungen oder Ausreißern.

Beispiel:

Wenn du die folgenden Werte hast:

1, 3, 3, 6, 7, 8, 9

ist der Median 6, da er in der Mitte liegt. Hier ist es besonders leicht ersichtlich, weil die Werte schon aufsteigend sortiert sind.

Bei einer geraden Anzahl an Datenpunkten nimmst du den Durchschnitt der beiden mittleren Werte:

Median = (3 + 4)/2 = 3.5

Beispiel in R
Auch den Median kannst du in R leicht berechnen:

# Beispiel: Berechnung des Medians
werte <- c(1, 3, 3, 6, 7, 8, 9)
median(werte)

Das Ergebnis ist 6.

Modus

Der Modus ist der Wert, der am häufigsten vorkommt. Bei nominalen Daten ist der Modus besonders hilfreich.

Beispiel:
In den Daten 1, 2, 2, 3, 4, 4, 4, 5, 6 ist der Modus 4, da dieser Wert am häufigsten vorkommt.

Beispiel in R
In R gibt es keine eingebaute Funktion für den Modus, aber du kannst dir leicht eine eigene Funktion schreiben:

# Beispiel: Berechnung des Modus
modus <- function(x) {
  uniqx <- unique(x)
  uniqx[which.max(tabulate(match(x, uniqx)))]
}

werte <- c(1, 2, 2, 3, 4, 4, 4, 5, 6)
modus(werte)

Das Ergebnis ist 4.

Arithmetisches Mittel vs. Median vs. Modus

Es ist wichtig zu wissen, wann welches Lagemaß am besten geeignet ist. Das arithmetische Mittel ist nützlich für symmetrische Verteilungen ohne Ausreißer. Der Median ist robuster gegenüber Ausreißern, da er nur von der Position der Werte abhängt. Der Modus ist vor allem für nominale Daten hilfreich.

Lageregeln

Lagemaße können auch dabei helfen, die Form einer Verteilung zu beurteilen:

  • Symmetrische Verteilung: Arithmetisches Mittel, Median und Modus sind gleich.
  • Linkssteile Verteilung: Das arithmetische Mittel ist größer als der Median, der wiederum größer als der Modus ist.
  • Rechtssteile Verteilung: Das arithmetische Mittel ist kleiner als der Median, der wiederum kleiner als der Modus ist.

Fazit

Lagemaße sind essenzielle Werkzeuge, um das Zentrum und die Verteilung von Daten zu beschreiben. Je nachdem, wie deine Daten verteilt sind, wählst du das arithmetische Mittel, den Median oder den Modus. Sie helfen dir, fundierte statistische Analysen durchzuführen.

Alles klar?

Ich hoffe, der Beitrag war für dich soweit verständlich. Wenn du weitere Fragen hast, nutze bitte hier die Möglichkeit, eine Frage an mich zu stellen!