Definition: Train/Test-Split

Sei ein gelabelter Datensatz.

Um die Güte eines Modells zu ermitteln, teilen wir den gegeben Datensatz in der Regel in zwei Teile auf:

  • Trainingsdatensatz:
  • Testdatensatz:

Diese Aufteilung geschieht i.d.R. zufällig und so dass der Trainingsdatensatz zwischen bis des Gesamtdatensatzes ausmacht.

Wir sprechen hierbei auch von einem Train/Test-Split.