Definition: Kosinus-Ähnlichkeit von Dokumenten

Seien und zwei Textdokumente.

Die Ähnlichkeit von und können wir mittels Kosinus-Ähnlichkeit berechnen durch:

wobei die jeweiligen Bag-of-Words-Vektoren der Dokumente seien.