Generalisierungen:Involvierte Definitionen:- Belief
- Term (Tokenization)
- Index
- IRS
- DIR
Veranstaltung: IRReferenz:
⠀
Definition: CORI-Algorithmus (Ressourcenselektion mittels Bayesian Inference Network)
Als CORI-Algorithmus bezeichnen wir einen Algorithmus der bei brokerbasierten IDR-Architekturen bei der Ressourcenselektion eingesetzt wird.
CORI nutzt ein Bayesian Inference Network, um den Belief
- also, dass der durch die Query ausgedrückte Informationsbedarf durch die IRS-Ressource befriedigt wird - zu berechnen. Dabei werden sowohl die Query
als auch die IRS-Ressourcen durch Index-Terme repräsentiert:
- Ressource-Terme:
- Query-Terme:
Der Belief
, also dass der Ressource-Term in der IRS-Ressource beobachtet wird, wird wie folgt approximiert: wobei
für die -te Collection und damit stellvertretend für steht, der Anzahl der Dokumente in entspricht, die enthalten, der Anzahl der Index-Terme in entspricht, der durchschnittlichen Anzahl Index-Terme in den Ressourcen entspricht, die Anzahl der Ressourcen ist, die Anzahl der Ressourcen ist, die enthalten, die minimale Belief-Komponente sei (typischerweise ). Um schließlich die Wahrscheinlichkeit für die Query
zu erhalten, können die der Query (mit ) unterschiedlich kombiniert werden, bspw. über das arithmetische Mittel.
