Definition: Explorative Datenanalyse

Die Explorative Datenanalyse, eingeführt 1977 in John W. Tukeys Buch Exploratory Data Analysis ist ein Prozess zur Untersuchung von Datensätzen. Er umfasst:

  • Filterung,
  • Aggregation,
  • und Visualisierung der Daten.

Ziel der explorativen Datenanalyse ist es nach @mcgregor2021, ein Grundverständis für die vorliegenden Daten zu gewinnen und erste Ideen für die weitere Analyse zu gewinnen. Insbesondere interessieren uns die beiden Gruppierungen:

  • Welche Datenpunkte ähneln sich? (sameness)
  • Welche Datenpunkte unterscheiden sich? (differentness)

Anmerkung

Achtung

Die Explorative Datenanalyse ist nützlich, um uns erste Ideen über den Datensatz zu geben.

Um Vermutungen zu bestätigen ist es aber in der Regel notwendig, mit Domänenexperten zu sprechen.