Generalisierungen
:Involvierte Definitionen
:Weitere Phasen
:- danach: Analysephase
- zuvor: Projektauftragsphase
Veranstaltung
: EDSReferenz
:- @beecks2024 (LE3, Data Science Process Modell)
- @schulz2022
⠀
Phase: Datenbereitstellungsphase
Die Phase Datenbereitstellung des Data Science Process Models (DASC-PM) startet mit den Ursprungsdatenquellen, die bereits in der Auftragsplanung identifiziert wurden.
Kernaufgabe der Phase ist:
- Datenaufbereitung: Ziel der Datenaufbereitung ist es, die Ursprungsdatenquellen in ein geeignetes Format für die anzuwendenden Analyseverfahren zu überführen.
Begleitende Aufgaben umfassen:
- Datenmanagement:
- Datenschutz, Anonymisierung, Pseudonymisierung,
- Verwaltung von Zugriffsrechten auf die Daten,
- Backups von Ursprungsdaten,
- Backups von bereits aufbereiteten Daten,
- Archivierbarkeit der Daten
- Explorative Datenanalyse:
- besseres inhaltliches Verständnis der vorliegenden Daten und Datenquellen,
- Identifikation erster Ansatzpunkte für tiefergehende Analysen,
- klären, ob Menge und Qualität der Daten für die Fragestellung ausreichen,
Als Ergebnis der vorangegangenen Schritte entsteht eine analytische Datenquelle, die für die weitere Analyse geeignet ist.