Generalisierungen
:Eigenschaften
:Involvierte Definitionen
:Veranstaltung
: EDSReferenz
: @beecks2024 (LE4, Clustering)
⠀
Definition: K-Medoid-Clustering
Sei
ein ungelabelter Datensatz mit . Als K-Medoid-Clustering bezeichnen wir einen Algorithmus der Clusteranalyse, der einen Datensatz
iterativ so in Teilmengen partitioniert, dass die Summe der Distanzen der Datenpunkte zu dem Zentroiden des ihnen zugewiesenen Clusters minimal ist. Im unterschied zum K-Means und K-Median-Clustering werden die Zentroiden ausschließlich aus der Menge
gewählt, es handelt sich bei ihnen also stets um Punkte aus dem vorliegenden Datensatz.
Algorithmus: PAM-Algorithmus
Sei
ein ungelabelter Datensatz. Der PAM-Algorithmus (kurz für Partitioning Around Medoids) ist ein gängiger heuristischer Algorithmus zur Durchführung des K-Medoid-Clusterings.
Grob zusammengefasst:
- Wähle zufällig
Medoiden aus dem Datensatz.
Berechne das Trägheitsmaß für den Fall (“Swap”), dasszu einem Zentroiden wird und kein Zentroid mehr ist. - Führe den besten Swap durch und weiter mit
1
, bis die Wahl der Medoiden konvergiert.