Definition: Pearsons Korrelationskoeffizient der Grumdgesamtheit

Seien zwei Zufallsvariablen mit nichtausgearteteten Verteilungen.

Als Pearsons Korrelationskoeffizienten der Grundgesamtheit bezeichnen wir:

Anmerkung

Interpretation

Wir können als Maß für die Güte der affinen Vorhersagbarkeit von durch deuten.

Je näher bei oder liegt, umso besser gruppieren sich die Wertepaare um eine Gerade.

Cf. @henze2019

Herleitung

Der Korrelationskoeffizient ergibt sich als “Abfallprodukt” des folgenden Optimierungsproblems:

Ziel dieses Optimierungsproblems ist es, die Realisierungen von aufgrund der Kenntnis der Realisierungen von möglichst gut vorherzusagen.

Eine einfache Möglichkeit für eine solche Vorhersage ist die hier genutzte Funktion mit , die zu dem Ausdruck führt.

Vereinfacht gesagt suchen wir also Parameter sodass . Da es einfacher ist, dieses Problem über die Minimierung des (quadrierten, siehe auch Methode der kleinsten Quadrate) Erwartungswertes zu lösen, nutzen wir den Ausdruck aus .

Wir versuchen jetzt, etwas zu vereinfachen. Nach der Berechnung der Varianz mittels binomischer Formel, der Translationsinvarianz der Kovarianz sowie der Additivität des Erwartungswertes gilt:

Der minimale Wert für ist also - dann geht der Term nämlich gegen .

Wir müssen nun nur noch einen geeigneten Wert für finden. Hierzu stellen wir

Seien jetzt der Einfachheit halber und . Dann gilt:

Was wir nun mithilfe der Additivität und Homogenität des Erwartungswertes weiter umstellen können:

Wir können das Problem aus Gleichung nun also wie folgt neu formulieren:

Eine Minimierung von erhalten wir durch Wahl von :

Was herzuleiten war.