Definition: Resnik-Ähnlichkeitsmaß (Graphbasiert)

Als Resnik-Ähnlichkeitsmaß bezeichnen wir ein graphtraversierendes semantisches Ähnlichkeitsmaß, das die semantische Nähe zweier Konzepte über ihren kleinsten gemeinsamen Vorfahren (LCA) in einer taxonomischen Hierarchie bestimmt.

Die Grundidee des Resnik-Maßes ist, dass der Informationsgehalt der gemeinsamen Spezialisierung zweier Konzepte durch die Tiefe ihres LCA ausgedrückt wird: Je tiefer der LCA in der Taxonomie liegt, desto größer ist die semantische Ähnlichkeit.

Gegeben seien zwei Konzepte und eines Taxonomiegraphen .

Das Resnik-Ähnlichkeitsmaß ist definiert durch:

wobei

  • die maximale Tiefe der Taxonomie und
  • die Länge des kürzesten Pfades entlang der is-a-Relation bezeichnet.