Definition: Histogramm

Als Histogramm bezeichnen wir eine besondere Form des Säulendiagramms, das als grafische Darstellung der Häufigkeitsverteilung einer stetigen oder diskreten Zufallsvariablen genutzt wird.

In einem Histogramm werden die Werte der Zufallsvariablen in Klassen (en. Bins) unterteilt. Für jede dieser Klassen wird eine statistische Kennzahl bestimmt, in der Regel die Auftrittshäufigkeit der Klasse innerhalb eines Datensatzes. Aus dieser Kennzahl leitet sich dann die Höhe des zu der Klasse gehörigen Balkens in dem Diagramm ab.

Für die Auswahl der Bins unterscheiden wir zwei geläufige Ansätze:

  • Gleichmäßige Breite
    • Die Bins erstrecken sich über die Ausprägungen des betrachteten Attributs.
    • Die Anzahl der Datenpunkte pro Bin variiert.
  • Gleichmäßige Höhe
    • Pro Bin legen wir die Anzahl der Datenpunkte fest (bspw: alle Bins müssen 8 Datenpunkte enthalten).
    • Die Breite der Bins variiert über das betrachtete Attribut.

Für Histogramme gelten dieselben Regeln wie für Säulendiagramme.