Definition: F4-Modified

Als F4-Modified bezeichnen wir eine Erweiterung des F4-Rankingverfahrens, die speziell für die Bewertung neu hinzukommender Terme in der Query-Expansion entwickelt wurde.

Die Modifikation basiert auf der Beobachtung, dass für neu hinzugefügte Terme (auf Basis von Query Expansion) keine sinnvolle priorische Relevanzwahrscheinlichkeit angenommen werden kann. Stattdessen wird ein Prior gewählt, der die Häufigkeit des Terms in der gesamten Kollektion widerspiegelt:

um die Gewichtung neu aufgenommener Terme stabiler zu machen.

Der Relevanzwert eines Terms ergibt sich zu:

wobei dieselben Parameter wie bei F4 verwendet werden:

  • die Anzahl der Dokumente in der Kollektion sei,
  • die Anzahl relevanter Dokumente,
  • die Anzahl der Dokumente, die den Term enthalten,
  • die Anzahl der relevanten Dokumente, die den Term enthalten,
  • : kollektionsbasierter Prior (für Query-Expansion ).

Für vom Nutzer selbst gewählte Query-Terme kann gesetzt werden. Damit entspricht F4-Modified der 0.5-Variante von F4.