Kontingenzkoeffizient: Grundidee, Berechnung und Interpretation

Der Kontingenzkoeffizient ist ein Maß, um die Stärke des Zusammenhangs zwischen zwei nominalskalierten Variablen in einer Kreuztabelle zu quantifizieren. Er ergänzt Tests wie den Chi-Quadrat-Test, indem er die Stärke eines Zusammenhangs unabhängig von der Stichprobengröße ausdrückt.

Grundidee und Berechnung des Kontingenzkoeffizienten

Während der Chi-Quadrat-Test lediglich die Signifikanz eines Zusammenhangs prüft, geht der Kontingenzkoeffizient einen Schritt weiter: Er bewertet die Stärke des Zusammenhangs. Das Ziel ist, eine Aussage darüber zu treffen, wie stark die Abhängigkeit zwischen zwei nominalen Variablen tatsächlich ist.

Wichtige Eigenschaften:

Wertebereich: Der Kontingenzkoeffizient liegt immer zwischen 0 (kein Zusammenhang) und einem oberen Grenzwert kleiner als 1, abhängig von der Tabellengröße.
Er ist nicht symmetrisch: Der Wert wird durch die Anzahl der Kategorien beeinflusst, weshalb er vor allem bei Tabellen mit ähnlichen Dimensionen (z. B. $2 \times 2$) sinnvoll ist.

Die Berechnung basiert auf der Chi-Quadrat-Statistik ($\chi^2$) aus der Kreuztabelle: $C = \sqrt{\frac{\chi^2}{\chi^2 + N}}$

$C$: Kontingenzkoeffizient.
$\chi^2$: Chi-Quadrat-Wert (aus der vorherigen Berechnung).
$N$: Gesamtanzahl der Beobachtungen in der Tabelle.

Beispiel: Berechnung des Kontingenzkoeffizienten

Wir verwenden das gleiche Beispiel wie beim Chi-Quadrat-Test: Eine Umfrage unter 100 Personen untersucht die Vorliebe für Kaffee oder Tee, aufgeteilt nach Geschlecht.

	Kaffee	Tee	Gesamt
Männlich	30	20	50
Weiblich	10	40	50
Gesamt	40	60	100

Chi-Quadrat-Wert ($\chi^2$) berechnen: Wie bereits im Beispiel zum Chi-Quadrat-Test gezeigt, ergibt sich: $\chi^2 = \sum \frac{(O_{ij} – E_{ij})^2}{E_{ij}}$ Angenommen, wir erhalten $\chi^2 = 16,67$.
Kontingenzkoeffizienten berechnen: Setzen wir die Werte in die Formel ein: $C = \sqrt{\frac{\chi^2}{\chi^2 + N}} = \sqrt{\frac{16,67}{16,67 + 100}} = \sqrt{\frac{16,67}{116,67}} \approx 0,38$ Der Kontingenzkoeffizient beträgt also 0,38.

Interpretation des Kontingenzkoeffizienten

Der Wert des Kontingenzkoeffizienten zeigt an, wie stark der Zusammenhang zwischen den beiden Variablen ist:

C = 0: Kein Zusammenhang.
C > 0: Es besteht ein Zusammenhang, dessen Stärke mit steigenden Werten zunimmt.
Obergrenze (< 1): Der Wert kann niemals 1 erreichen, was die Interpretation erschweren kann, besonders bei größeren Tabellen.

In unserem Beispiel von 0,38 kann man von einem moderaten Zusammenhang sprechen.

Ein wichtiger Kritikpunkt am Kontingenzkoeffizienten ist, dass er nicht den vollständigen Wertebereich von 0 bis 1 abdeckt. Stattdessen hängt seine Obergrenze von der Anzahl der Kategorien in der Tabelle ab:

In einer $2 \times 2$-Tabelle ist die Obergrenze relativ hoch.
Bei größeren Tabellen (z. B. $4 \times 5$) ist der maximale Wert deutlich kleiner.

Für exaktere Vergleiche zwischen Tabellen unterschiedlicher Dimensionen kann Cramérs V als Alternative herangezogen werden.

Vorteile und Grenzen

Vorteile:

Einfach zu berechnen, wenn der Chi-Quadrat-Wert vorliegt.
Geeignet für $2 \times 2$- oder ähnlich dimensionierte Kreuztabellen.
Liefert ein intuitives Maß für die Stärke des Zusammenhangs.

Grenzen:

Abhängig von der Tabellengröße, was Vergleiche erschwert.
Kein absolutes Maß: Die Werte können nicht direkt mit anderen Korrelationsmaßen verglichen werden.

Berechnung mit Software

Kontingenzkoeffizient berechnen mit R

In R kann der Kontingenzkoeffizient (C) aus einer Chi-Quadrat-Berechnung abgeleitet werden. Hier ist ein Beispiel:

# Daten: 2x2-Kontingenztabelle
table <- matrix(c(50, 30, 20, 100), nrow = 2)

# Chi-Quadrat-Test
result <- chisq.test(table)

# Kontingenzkoeffizient berechnen
C <- sqrt(result$statistic / (result$statistic + sum(table)))
print(C)

Das Ergebnis ist der Kontingenzkoeffizient, der zwischen 0 (kein Zusammenhang) und einem Maximum unterhalb von 1 liegt (starker Zusammenhang).

Kontingenzkoeffizient berechnen mit SPSS

In SPSS wird der Kontingenzkoeffizient automatisch in einer Kreuztabellenanalyse ausgegeben:

Gehe zu Analysieren > Deskriptive Statistiken > Kreuztabellen.
Ziehe die Variablen in Zeilen und Spalten.
Klicke auf Statistiken und aktiviere die Option Chi-Quadrat.
In der Ausgabe findest du den Kontingenzkoeffizienten unterhalb der Chi-Quadrat-Werte in der Tabelle mit „Maße für die Assoziation“.

Kontingenzkoeffizient berechnen mit PSPP

In PSPP funktioniert die Berechnung ähnlich wie in SPSS:

Wähle Analyse > Deskriptive Statistiken > Kreuztabellen.
Ziehe die Variablen in die entsprechenden Felder.
Aktiviere Chi-Quadrat und erhalte den Kontingenzkoeffizienten in der Ergebnistabelle unter „Maße für die Assoziation“.

Kontingenzkoeffizient berechnen mit JASP

In JASP kannst du den Kontingenzkoeffizienten über eine Kontingenztabellenanalyse abrufen:

Gehe zu Frequencies > Contingency Tables.
Ziehe die unabhängige und abhängige Variable in Zeilen und Spalten.
Aktiviere im Statistikbereich die Option Chi-Square Test und Measure of Association.
Der Kontingenzkoeffizient wird in der Ergebnistabelle angezeigt und ist leicht interpretierbar.

Fazit

Der Kontingenzkoeffizient ist eine nützliche Erweiterung des Chi-Quadrat-Tests, wenn es darum geht, die Stärke eines Zusammenhangs zwischen nominalskalierten Variablen zu bewerten. Allerdings sollte seine Abhängigkeit von der Tabellengröße immer berücksichtigt werden. Für eine präzisere Analyse oder den Vergleich verschiedener Tabellen kann es sinnvoll sein, ergänzende Maße wie Cramérs V zu verwenden.