Definition: Trägheitsmaß

Sei ein Datensatz.
Seien Zentroiden von Clustern.
Sei eine Funktion, die jedem Datenpunkt einen Zentroiden zuweist.

Als Trägheit (en. Inertia; auch Within-Cluster Sum of Squares [WCSS]) von bezüglich und definieren wir

Anmerkung

Lösung des Inertia-Problems

Die Minimierung des Inertia-Problems, also

ist ein NP-schweres Problem.

Eigenheiten des Trägheitsmaßes

  • Das Trägheitsmaß ist abhängig von der Skalierung der Merkmale.
  • Über je mehr Zentroiden ein Clustering verfügt, desto geringer ist das Trägheitsmaß. Daher können nur Clusterings mit gleicher Clusterzahl verglichen werden.
  • Für ist der Trägheitswert , da jedem Datenpunkt ein Cluster zugewiesen wird.