Definition: Epizyklischer Prozess der Datenanalyse

Als epizyklischen Prozess der Datenanalyse definieren wir ein iteratives Vorgehensmodell zur Datenanalyse. Es umfasst fünf Kernaktivitäten, für die jeweils ein Verfeinerungsschritt durchgeführt wird.

Die fünf Kernaktivitäten umfassen:

  • Entwicklung einer Fragestellung
    • Benötigt: Anwendungs- und Domänenwissen,
    • Einbezug des aktuellen Forschungsstandes (Literaturrecherche)
  • Explorative Analyse der Daten
    • Filtern, aggregieren, explorative Visualisierung
  • Erstellung von Analysemodellen
    • Überwachte vs. unüberwachte Methoden
  • Interpretation der Ergebnisse
    • Funktioniert unser Ansatz?
    • Beantwortet das Analysemodell unsere Frage?
  • Kommunikation der Ergebnisse
    • Zielgruppenorientierte Präsentation, Inhalt, Stil

Die Kernaktivitäten werden wie folgt iterativ verfeinert:

  • Erwartungen für die Kernaktivität festlegen,
    • Bspw: welche Datenattribute betrachten wir? welche Modelle möchte ich anwenden?
  • Kernaktivität durchführen und mit den Erwartungen vergleichen
    • Bspw: waren die gewählten Analysemethoden angemessen und ausreichend zur Beantwortung der Fragestellung?
  • Erwartungen oder Voraussetzungen der Kernaktivität anpassen
    • Bspw: Anderen Datensatz oder anderes Modell auswählen.

Anmerkung

Beispiel für Kernaktivitäten und Verfeinerungen

Erwartungen für die Kernaktivität festlegenKernaktivität durchführen und mit Erwartungen vergleichenErwartungen oder Voraussetzungen anpassen
FragestellungFragestellung sollte für die Zielgruppe relevant seinLiteraturrecherche und Domänenexperten befragenFragestellung nachschärfen
Explorative AnalyseDatensatz ist der Fragestellung angemessenExplorative Visualisierungen erstellenFragestellung überarbeiten oder weitere Daten sammeln
Erstellung von AnalysemodellenModell sollte die Fragestellung beantwortenVergleich mit Baseline-Modellen, Berechnung geeigneter PerformanzfunktionenModell um neue Features erweitern
InterpretationInterpretation der Analyse ermöglicht eine spezifische und bedeutungsvolle Antwort für die FragestellungGesamtheit aller Analysen betrachten; Kontentration auf Effektgröße und UnsicherheitExplorative Analyse oder Analysemodelle überarbeiten
KommunikationAnalysevorgehen und die Ergebnisse sind für die Zielgruppe nachvollziehbar und wertvollFeedback von der Zielgruppe erhaltenÜberarbeitung der Analyse oder des Vortragsstils