Definition: CORI-Algorithmus (Ressourcenselektion mittels Bayesian Inference Network)

Als CORI-Algorithmus bezeichnen wir einen Algorithmus der bei brokerbasierten IDR-Architekturen bei der Ressourcenselektion eingesetzt wird.

CORI nutzt ein Bayesian Inference Network, um den Belief - also, dass der durch die Query ausgedrückte Informationsbedarf durch die IRS-Ressource befriedigt wird - zu berechnen.

Dabei werden sowohl die Query als auch die IRS-Ressourcen durch Index-Terme repräsentiert:

  • Ressource-Terme:
  • Query-Terme:

Der Belief , also dass der Ressource-Term in der IRS-Ressource beobachtet wird, wird wie folgt approximiert:

wobei

  • für die -te Collection und damit stellvertretend für steht,
  • der Anzahl der Dokumente in entspricht, die enthalten,
  • der Anzahl der Index-Terme in entspricht,
  • der durchschnittlichen Anzahl Index-Terme in den Ressourcen entspricht,
  • die Anzahl der Ressourcen ist,
  • die Anzahl der Ressourcen ist, die enthalten,
  • die minimale Belief-Komponente sei (typischerweise ).

Um schließlich die Wahrscheinlichkeit für die Query zu erhalten, können die der Query (mit ) unterschiedlich kombiniert werden, bspw. über das arithmetische Mittel.