Definition: Stichprobe

Sei ein Datensatz mit Datenpunkten.

Als Stichprobe bezeichnen wir Teilmengen von .
Typische Vorgehensweisen zum Erstellen von Stichproben umfassen:

  • Ohne Zurücklegen
  • Mit Zurücklegen
  • Clusterstichprobe
    • Zunächst wird in die disjunkten Gruppen/Cluster aufgeteilt.
    • Anschließend können Stichproben auf Basis des Clusterings, bspw. aus der Gruppen entnommen werden - wobei .
  • Geschichtete Stichprobe
    • Können genutzt werden, um sicherzustellen, dass eine Stichprobe alle Ausprägungen eines Attributs enthält
    • Der Datensatz wird nach den Ausprägungen eines Attributs in disjunkte Teilmengen aufgeteilt, die wir als Schichten bezeichnen.
    • Stichproben können nun gebildet werden, indem aus jeder Schicht mindestens ein Datenpunkt entnommen wird.