Definition: TF-IDF-Kosinus-Ähnlichkeit von Dokumenten

Seien und zwei Textdokumente.

Die Ähnlichkeit von und können wir mittels TF-IDF-Kosinus-Ähnlichkeit berechnen durch:

wobei

  • und