Beispiele:Generalisierungen:Involvierte Definitionen:Veranstaltung: IRReferenz: @wagenpfeil2024 (KE7, p. 12 f.)
⠀
Definition: Graphbasiertes Semantisches Maß
Als Graphbasiertes Semantisches Maß bezeichnen wir semantische Maße, die die Struktur eines Graphen (z. B. einer Ontologie oder eines Thesaurus) zur Berechnung der semantischen Nähe zwischen Knoten nutzen.
Grundlage dieser Maße ist die Annahme, dass die Position und Vernetzung von Knoten im Graphen semantische Information transportiert. Je stärker zwei Knoten strukturell miteinander verbunden sind, desto größer ist ihre semantische Nähe.
Auf Graphen basierende semantische Maße lassen sich in zwei grundlegende Klassen einteilen:
- Graphtraversierende Verfahren:
- Diese Verfahren berechnen semantische Nähe durch die Exploration von Pfaden im Graphen.
- Nachteilig ist, dass die Traversierung des Graphen recht teuer bzgl. Speicher- und Laufzeitverhalten sein kann.
- Typische Ansätze sind:
- Kürzester Pfad:
- Bewertung der Anzahl oder Länge der Kanten zwischen zwei Knoten
- Dabei gilt: Je weniger Kanten und damit je kürzer der Weg zwischen zwei Knoten, desto ähnlicher sind sich die Konzepte.
- Zufallswege (Random Walks):
- Wege im Pfad werden als Markovketten betrachtet, um die Übergangswahrscheinlichkeiten oder Pendelzeiten von einem Konzept
zu einem anderen Konzept . - Dabei gilt: je mehr Relationen zwischen
und bestehen, desto größer ist die semantische Ähnlichkeit - Eigenschaftsbasierte Verfahren:
- Diese Verfahren nutzen die den Knoten und Kanten zugewiesenen Eigenschaften/Attribute, um semantische Nähe über den Vergleich von Merkmalsausprägungen zu bestimmen.
Anmerkung
Zyklische und Azyklische Graphen
Graphen können sowohl zyklisch oder azyklisch sein. Viele Verfahren reduzieren zyklische Graphen auf azyklische Strukturen, indem sie sich auf taxonomische Relationen wie bspw.
is-abeschränken.
Wahl des kürzesten Pfades
Graphtraversierende semantische Maße bestimmen die semantische Ähnlichkeit zweier Konzepte i.d.R. bloß über den kürzesten Pfad im Graphen.
Das kann problematisch sein, weil der kürzeste Pfad lediglich die strukturelle Distanz misst, jedoch nicht berücksichtigt, welche semantischen Bedeutungen die einzelnen Relationen zwischen den Klassen tragen. Dadurch kann die tatsächliche semantische Nähe verfälscht werden.