Definition: Testkollektion (Information Retrieval)

Als Testkollektion bezeichnen wir im Information Retrieval die Menge an Dokumenten, Inhalten, Queries und vordefinierten Relevanzurteilen, die zur systemorientierten Evaluation eines IRS genutzt werden.

Konkret:

  • Feste Topics bilden eine vordefinierte Menge an Menge möglicher thematischer Informationsbedürfnisse.
  • Feste Queries übersetzen die Topics in konkrete Abfragen.
  • Feste Dokumente (Korpus) bilden die zugrunde liegende Dokumentenbasis
  • Feste Relevanzurteile legen fest, wie Relevant die einzelnen Dokumente hinsichtlich der verschiedenen Queries sind.