Definition: Lexikon (Textdaten)

Als Lexikon bezeichnen wir eine Sammlung der Attribute eines Textdokumentes oder eines Korpus.

Neben der Vektorraumdarstellung (meist ein Bag of Words) umfasst das Lexikon auch Zusatzinformationen wie Verweise zu anderen Dokumenten oder Metadaten (Autoren, Erstellzeitpunkt, Schlagwörter).