wobei das empirische Mittel und die empirische Standardabweichung des -ten Merkmals über alle Datenpunkte seien.
Anmerkung
Auswirkung der z-Transformation
Die z-Transformation “standardisiert” die Merkmale der Datenpunkte so, dass ihr Mittelwert und ihre Standardabweichung betragen.
Das führt dazu, dass die Merkmale untereinander vergleichbarer werden. Die Auswirkungen hiervon sieht man sehr schön beim Plotten von KNN-Entscheidungsgrenzen. Mit erhält man bspw. für einen nicht-standardisierten Datensatz:
Auf einem standardisierten Datensatz erhalten wir:
z-Transformation mit scikit-learn
In Python erhalten wir einen z-transformierten Datensatz durch: