Definition: K-Medoid-Clustering

Sei ein ungelabelter Datensatz mit .

Als K-Medoid-Clustering bezeichnen wir einen Algorithmus der Clusteranalyse, der einen Datensatz iterativ so in Teilmengen partitioniert, dass die Summe der Distanzen der Datenpunkte zu dem Zentroiden des ihnen zugewiesenen Clusters minimal ist.

Im unterschied zum K-Means und K-Median-Clustering werden die Zentroiden ausschließlich aus der Menge gewählt, es handelt sich bei ihnen also stets um Punkte aus dem vorliegenden Datensatz.

Algorithmus: PAM-Algorithmus

Sei ein ungelabelter Datensatz.

Der PAM-Algorithmus (kurz für Partitioning Around Medoids) ist ein gängiger heuristischer Algorithmus zur Durchführung des K-Medoid-Clusterings.

Grob zusammengefasst:

  1. Wähle zufällig Medoiden aus dem Datensatz.

  2. Berechne das Trägheitsmaß für den Fall (“Swap”), dass zu einem Zentroiden wird und kein Zentroid mehr ist.
  3. Führe den besten Swap durch und weiter mit 1, bis die Wahl der Medoiden konvergiert.