Typen
:Konstrukte
:Involvierte Definitionen
:Veranstaltung
: EMLReferenz
: @thimm2024 (Abschnitt 2.1.2)
⠀
Definition: Train/Test-Split
Sei
ein gelabelter Datensatz. Um die Güte eines Modells
zu ermitteln, teilen wir den gegeben Datensatz in der Regel in zwei Teile auf:
- Trainingsdatensatz:
- Testdatensatz:
Diese Aufteilung geschieht i.d.R. zufällig und so dass der Trainingsdatensatz zwischen
bis des Gesamtdatensatzes ausmacht. Wir sprechen hierbei auch von einem Train/Test-Split.