Definition: Distributed Information Retrieval

Als Distributed Information Retrieval (kurz DIR) bezeichnen wir die datenquellenübergreifende Durchführung des Information Retrievals, i.d.R. unter Zusammenführung getrennter Information Retrieval Systeme.

Ein DIR ist immer dann notwendig, wenn kein zentraler Index vorhanden ist oder erstellt werden kann, aber dennoch alle Datenquellen durchsuchbar sein sollen. Beispielsweise dann, wenn ein zentraler Index zu groß werden würde.

Typen von DIRs umfassen:

  • P2P
  • Broker
  • Crawling (im Skript nicht weiter beschrieben)
  • Metadata Harvesting