Generalisierungen
:Involvierte Definitionen
:Veranstaltung
: MatheDSReferenz
:- @riedel2023 (Satz 6.2.38)
- Daniel Jung
- StudyFlix
⠀
Definition: Chi-Quadrat-Unabhängigkeitstest
Ziel des Chi-Quadrat-Unabhängigkeitstests ist es, die Unabhängigkeit zweier Zufallsvariablen
und zu zeigen. Hierzu zunächst einige Begriffsklärungen und Definitionen.
Seien
und die Ausprägungen zweier Merkmale mit . Sei
der gemeinsame Grundraum.
Seidas statistische Produktmodell mit . Die Parametermengen der Verteilungen auf
und sowie die Parametermenge der gemeinsamen Verteilung auf seien definiert durch Für die Randverteilungen der
gelte außerdem: Sei nun
.
Dann gilt nach dieser Festlegung der Randverteilungen auchsowie . Das beidseitige Testproblem ergibt sich nun durch:
(Unabhängigkeit), (Abhängigkeit). Die Teststatistik
erhalten wir durch wobei
und jeweils die relativen Häufigkeiten über den Grundmengen und sind. Als Chi-Quadrat-Unabhängigkeitstest mit asymptotischem Niveau
bezeichnen wir: wobei
.
Anmerkung
Und wie berechnen sich die
jetzt? Angenommen, wir hätten
und ü ü mit Kontingenztafel/Kreuztabelle:
Samstag Sonntag pünktlich 30 45 75 unpünktlich 15 10 25 45 55 100 Dann ergeben sich
ü ü ü ü ü ü Die Formel können wir jetzt ausführen als
Intuitiveres Vorgehen
Intuitiver aber sonst äquivalent ist ein Vorgehen nach der folgenden Formel:
Hier müssen also nicht erst noch die relativen Häufigkeiten berechnet werden, wir können direkt die (i.d.R.) gegebenen absoluten Häufigkeiten nutzen.
Wieder anhand der Kreuztabelle des gerade gegebenen Beispiels:
Samstag Sonntag pünktlich 30 45 75 unpünktlich 15 10 25 45 55 100 Als Zwischenschritt berechnen wir zunächst die
mit :
Die Tabelle können wir nun ergänzen durch:
Samstag Sonntag pünktlich 30 | 33.75 45 | 41.25 75 unpünktlich 15 | 11.25 10 | 13.75 25 45 55 100 Die Formel können wir jetzt einfach ausführen als
Herleitung
Umstellung aus dem Skript
Im Skript heißt es:
Das ist äquivalent zu der oben angegebenen Teststatistik, denn
was zu zeigen war.