Typen
:Generalisierungen
:Involvierte Definitionen
:Veranstaltung
: EDSReferenz
:- @beecks2024 (LE3, Epizyklischer Prozess der Datenanalyse)
- The Art of Data Science, Peng and Matsui
⠀
Definition: Epizyklischer Prozess der Datenanalyse
Als epizyklischen Prozess der Datenanalyse definieren wir ein iteratives Vorgehensmodell zur Datenanalyse. Es umfasst fünf Kernaktivitäten, für die jeweils ein Verfeinerungsschritt durchgeführt wird.
Die fünf Kernaktivitäten umfassen:
- Entwicklung einer Fragestellung
- Benötigt: Anwendungs- und Domänenwissen,
- Einbezug des aktuellen Forschungsstandes (Literaturrecherche)
- Explorative Analyse der Daten
- Filtern, aggregieren, explorative Visualisierung
- Erstellung von Analysemodellen
- Überwachte vs. unüberwachte Methoden
- Interpretation der Ergebnisse
- Funktioniert unser Ansatz?
- Beantwortet das Analysemodell unsere Frage?
- Kommunikation der Ergebnisse
- Zielgruppenorientierte Präsentation, Inhalt, Stil
Die Kernaktivitäten werden wie folgt iterativ verfeinert:
- Erwartungen für die Kernaktivität festlegen,
- Bspw: welche Datenattribute betrachten wir? welche Modelle möchte ich anwenden?
- Kernaktivität durchführen und mit den Erwartungen vergleichen
- Bspw: waren die gewählten Analysemethoden angemessen und ausreichend zur Beantwortung der Fragestellung?
- Erwartungen oder Voraussetzungen der Kernaktivität anpassen
- Bspw: Anderen Datensatz oder anderes Modell auswählen.
Anmerkung
Beispiel für Kernaktivitäten und Verfeinerungen
Erwartungen für die Kernaktivität festlegen Kernaktivität durchführen und mit Erwartungen vergleichen Erwartungen oder Voraussetzungen anpassen Fragestellung Fragestellung sollte für die Zielgruppe relevant sein Literaturrecherche und Domänenexperten befragen Fragestellung nachschärfen Explorative Analyse Datensatz ist der Fragestellung angemessen Explorative Visualisierungen erstellen Fragestellung überarbeiten oder weitere Daten sammeln Erstellung von Analysemodellen Modell sollte die Fragestellung beantworten Vergleich mit Baseline-Modellen, Berechnung geeigneter Performanzfunktionen Modell um neue Features erweitern Interpretation Interpretation der Analyse ermöglicht eine spezifische und bedeutungsvolle Antwort für die Fragestellung Gesamtheit aller Analysen betrachten; Kontentration auf Effektgröße und Unsicherheit Explorative Analyse oder Analysemodelle überarbeiten Kommunikation Analysevorgehen und die Ergebnisse sind für die Zielgruppe nachvollziehbar und wertvoll Feedback von der Zielgruppe erhalten Überarbeitung der Analyse oder des Vortragsstils