Definition: Merkmalsanalysebasiertes semantisches Maß

Als merkmalanalysebasiertes semantisches Maß bezeichnen wir ein semantisches Maß, das die semantische Nähe zwischen Instanzen einer Ontologie über den Vergleich der ihnen zugewiesenen Eigenschaften, Relationen und kontextuellen Merkmale bestimmt.

Es berücksichtigt vier miteinander interagierende Ebenen:

  • Domänenwissen: Übergreifendes Wissen, das die die Auswahl, Gewichtung und Kombination der verwendeten Merkmale aller Ebenen beeinflusst.
  • Kontextebene:
    • Einbezug von externem/anwendungsbezogenem Wissen, das beschreibt, wie Instanzen genutzt oder interpretiert werden
    • Definition des Anwendungskontextes1, über den festgelegt wird, welche Relationen besonders relevant sind, wie sie im Graph gefunden werden und wie sie schließlich verglichen werden können
      • Bspw. könnten zwei Forscher über die Menge der verwandten Themen, die zu ihren bisherigen Publikationen passen, verglichen werden
  • Ontologieebene:
    • Nutzung der ontologischen Struktur (z. B. Klassen, Relationen, Domänen und Reichweiten) zur Ähnlichkeitsberechnung auf Basis des zuvor definierten Anwendungskontext. Vergleich bspw. durch:
      • count: Vergleich der Kardinalität erreichter Elemente
      • inter: Vergleich der Schnittmenge erreichter Elemente
      • simil: Berechnung der Ähnlichkeit von Attributwerten erreichter Elemente
  • Datenebene: Vergleich konkreter Attributwerte (z. B. Strings oder Zahlen) mittels Maßen wie Levenshtein-Distanz, Hamming-Abstand oder Jaro-Maß

Die Einzelbewertungen der Ebenen werden schließlich über eine Verschmelzungsfunktion (bspw. gewichtete Summe oder Mittelwert) zu einem Gesamtähnlichkeitswert aggregiert.

Footnotes

  1. Siehe dazu: Albertoni, R., & De Martino, M. (2006). Semantic similarity of ontology instances tailored on the application context. On the Move to Meaningful Internet Systems 2006: CoopIS, DOA, GADA, and ODBASE, 4275, 10201038