Generalisierungen:Involvierte Definitionen:- Prior (Statistik)
- Query-Optimierungsverfahren (Query Expansion)
Referenz:- @wagenpfeil2024 (KE3, p. 23 ff.)
- User choices: A new yardstick for the evaluation of ranking algorithms for interactive query expansion - Efthimiadis 1995, p. 607 f.
- On relevance weight estimation and query expansion. - Robertson 1986
⠀
Definition: F4-Modified
Als F4-Modified bezeichnen wir eine Erweiterung des F4-Rankingverfahrens, die speziell für die Bewertung neu hinzukommender Terme in der Query-Expansion entwickelt wurde.
Die Modifikation basiert auf der Beobachtung, dass für neu hinzugefügte Terme (auf Basis von Query Expansion) keine sinnvolle priorische Relevanzwahrscheinlichkeit angenommen werden kann. Stattdessen wird ein Prior
gewählt, der die Häufigkeit des Terms in der gesamten Kollektion widerspiegelt: um die Gewichtung neu aufgenommener Terme stabiler zu machen.
Der Relevanzwert eines Terms
ergibt sich zu: wobei dieselben Parameter wie bei F4 verwendet werden:
die Anzahl der Dokumente in der Kollektion sei, die Anzahl relevanter Dokumente, die Anzahl der Dokumente, die den Term enthalten, die Anzahl der relevanten Dokumente, die den Term enthalten, : kollektionsbasierter Prior (für Query-Expansion ). Für vom Nutzer selbst gewählte Query-Terme kann
gesetzt werden. Damit entspricht F4-Modified der 0.5-Variante von F4.