Proposition: Berechnung von Abstandsmaßen für gemischte Datenpunkte

Für die Abstandsberechnung bei Datenpunkten mit gemischten Attributtypen gehen wir je nach Attributtyp folgendermaßen vor. Das Gesamtmaß erhalten wir schließlich als Summe der jeweiligen Distanzen.

  • nominales/symmetrisch binäres Attribut:
    • Symmetrische Binäre Distanz
  • asymmetrisch binäres Attribut:
    • Asymmetrische Binäre Distanz
  • ordinales Attribut:
    • ,
    • wobei wir und entsprechend der normierten Rangberechnung erhalten
  • numerisches Attribut:
    • zunächst MinMax-Skalierung, dann Manhattan-Distanz