Definition: Chi-Quadrat-Unabhängigkeitstest

Ziel des Chi-Quadrat-Unabhängigkeitstests ist es, die Unabhängigkeit zweier Zufallsvariablen und zu zeigen.

Hierzu zunächst einige Begriffsklärungen und Definitionen.

Seien und die Ausprägungen zweier Merkmale mit .

Sei der gemeinsame Grundraum.
Sei das statistische Produktmodell mit .

Die Parametermengen der Verteilungen auf und sowie die Parametermenge der gemeinsamen Verteilung auf seien definiert durch

Für die Randverteilungen der gelte außerdem:

Sei nun .
Dann gilt nach dieser Festlegung der Randverteilungen auch sowie .

Das beidseitige Testproblem ergibt sich nun durch:

  • (Unabhängigkeit),
  • (Abhängigkeit).

Die Teststatistik erhalten wir durch

wobei und jeweils die relativen Häufigkeiten über den Grundmengen und sind.

Als Chi-Quadrat-Unabhängigkeitstest mit asymptotischem Niveau bezeichnen wir:

wobei .

Anmerkung

Und wie berechnen sich die jetzt?

Angenommen, wir hätten üü und mit Kontingenztafel/Kreuztabelle:

SamstagSonntag
pünktlich304575
unpünktlich151025
4555100

Dann ergeben sich

  • ü
  • ü
  • ü
  • ü
  • ü
  • ü

Die Formel können wir jetzt ausführen als

Intuitiveres Vorgehen

Intuitiver aber sonst äquivalent ist ein Vorgehen nach der folgenden Formel:

Hier müssen also nicht erst noch die relativen Häufigkeiten berechnet werden, wir können direkt die (i.d.R.) gegebenen absoluten Häufigkeiten nutzen.

Wieder anhand der Kreuztabelle des gerade gegebenen Beispiels:

SamstagSonntag
pünktlich304575
unpünktlich151025
4555100

Als Zwischenschritt berechnen wir zunächst die mit :

Die Tabelle können wir nun ergänzen durch:

SamstagSonntag
pünktlich30 | 33.7545 | 41.2575
unpünktlich15 | 11.2510 | 13.7525
4555100

Die Formel können wir jetzt einfach ausführen als

Herleitung

Umstellung aus dem Skript

Im Skript heißt es:

Das ist äquivalent zu der oben angegebenen Teststatistik, denn

was zu zeigen war.