Proposition: PCA ändert den Mittelwert der Daten nicht

Sei ein Datensatz mit und .
Sei der durch PCA ermittelte komprimierte Datensatz.

Dann gilt für den Erwartungswert:

Beweis

Per definitionem erhalten wir jeden Datenpunkt in durch

wobei mit die durch PCA ermittelte ONB sei.

Dass eine ONB darstellen, sagt uns an dieser Stelle insbesondere, dass

  1. jeder der Vektoren genau die Länge hat und
  2. dass die Vektoren senkrecht zueinander stehen.

Das heißt, jede Dimension von ist eine Linearkombination der Dimensionen aus .

Von diesen Dimensionen wissen wir aber, dass sie allesamt den Erwartungswert haben.

Da der Erwartungswert additiv und homogen ist, ist der Erwartungswert der Linearkombination gleich der gewichteten Summe der Erwartungswerte der einzelnen Dimensionen.

Da die Erwartungswerte der Dimensionen aber alle sind, löst sich auch die gewichtete Summe zu auf - was zu zeigen war.