Definition: Normalized-Term-Overlap

Als Normalized-Term-Overlap (kurz NTO) bezeichnen wir ein graphbasiertes semantisches Ähnlichkeitsmaß, das den Überlappungsgrad zweier Knotenmengen relativ zur kleineren Vorfahrenmenge misst.

Sei ein Graph.
Seien jeweils zwei Knotenmengen (bspw. Worte einer Query und eines Dokuments).
Sei die Menge aller Elemente in und ihrer Vorfahren, also .

Dann erhalten wir das NTO-Ähnlichkeitsmaß durch