Multikollinearität einfach überprüft: Der Variance Inflation Factor (VIF)

Was ist derTest Variance Inflation Factor (VIF)?

Der Variance Inflation Factor (VIF) ist ein Werkzeug, mit dem du die Multikollinearität in deinem Regressionsmodell überprüfen kannst. Multikollinearität tritt auf, wenn zwei oder mehr unabhängige Variablen in einem Regressionsmodell hoch miteinander korreliert sind, was zu ungenauen und unzuverlässigen Schätzungen der Regressionskoeffizienten führen kann.

Bevor du den VIF-Test durchführen kannst, musst du:

  • Ein lineares Regressionsmodell erstellt haben.
  • Mehrere unabhängige Variablen haben, von denen du denkst, dass sie miteinander korreliert sein könnten.

Wie wird der Test umgesetzt?

Umsetzung in R mit einem Beispiel

In R kannst du den VIF mithilfe des car-Pakets berechnen:

# Paket installieren und laden
install.packages("car")
library(car)

# Fiktiver Datensatz
set.seed(123)
x1 <- rnorm(100)
x2 <- x1 + rnorm(100, sd=0.5)
y <- 3 + 2*x1 + 0.5*x2 + rnorm(100)
daten <- data.frame(y, x1, x2)

# Regressionsmodell erstellen
modell <- lm(y ~ x1 + x2, data=daten)

# VIF berechnen
vif(modell)

Dieser Code gibt dir den VIF-Wert für jede unabhängige Variable in deinem Modell zurück.

Umsetzung in SPSS

In SPSS:

  1. Führe eine lineare Regression durch: „Analysieren“ > „Regression“ > „Linear“.
  2. Füge die abhängige Variable und die unabhängigen Variablen hinzu.
  3. Unter „Statistiken“ wählst du „Kollinearitätsdiagnose“.
  4. Klicke auf „OK“.

In den Ergebnissen findest du den VIF-Wert für jede unabhängige Variable.

Umsetzung in JASP

In JASP:

  1. Wähle „Regression“ > „Lineare Regression“.
  2. Füge die abhängige Variable und die unabhängigen Variablen hinzu.
  3. Aktiviere die Option „Kollinearität“.
  4. Die Tabelle „Kollinearität“ zeigt dir den VIF für jede Variable.

Wie interpretiert und reported man den Variance Inflation Factor?

Angenommen, du erhältst für x1 einen VIF-Wert von 5 und für x2 einen Wert von 4,5.

Ein VIF-Wert von 1 zeigt keine Multikollinearität an. Allgemein gilt, Werte über 10 sind oft Anlass zur Besorgnis, obwohl einige Experten sogar bei Werten über 5 vorsichtig sind. In unserem Beispiel würden die Werte von 5 und 4,5 darauf hinweisen, dass zwischen x1 und x2 möglicherweise eine Multikollinearität besteht.

Im APA-Format würdest du schreiben: „Eine Überprüfung der Multikollinearität ergab VIF-Werte von 5 für x1 und 4,5 für x2, was auf mögliche Multikollinearität zwischen diesen Variablen hinweist.“

Conclusio

Der Variance Inflation Factor (VIF) ist ein unverzichtbares Werkzeug, wenn du die Zuverlässigkeit deines Regressionsmodells sicherstellen möchtest. Multikollinearität kann die Ergebnisse verzerren und zu falschen Schlussfolgerungen führen. Es ist daher entscheidend, sie zu überprüfen und gegebenenfalls zu korrigieren. Egal ob in R, SPSS oder JASP, der VIF gibt dir Klarheit über das Vorhandensein von Multikollinearität in deinem Modell.