Konstrukte
:Generalisierungen
:Involvierte Definitionen
:Veranstaltung
: EMLReferenz
: @thimm2024 (Abschnitt 3.1.2, Definition 1)
⠀
Definition: Trägheitsmaß
Sei
ein Datensatz.
SeienZentroiden von Clustern.
Seieine Funktion, die jedem Datenpunkt einen Zentroiden zuweist. Als Trägheit (en. Inertia; auch Within-Cluster Sum of Squares [WCSS]) von
bezüglich und definieren wir
Anmerkung
Lösung des Inertia-Problems
Die Minimierung des Inertia-Problems, also
ist ein NP-schweres Problem.
Eigenheiten des Trägheitsmaßes
- Das Trägheitsmaß ist abhängig von der Skalierung der Merkmale.
- Über je mehr Zentroiden ein Clustering verfügt, desto geringer ist das Trägheitsmaß. Daher können nur Clusterings mit gleicher Clusterzahl verglichen werden.
- Für
ist der Trägheitswert , da jedem Datenpunkt ein Cluster zugewiesen wird.