Phase: Datenbereitstellungsphase

Die Phase Datenbereitstellung des Data Science Process Models (DASC-PM) startet mit den Ursprungsdatenquellen, die bereits in der Auftragsplanung identifiziert wurden.

Kernaufgabe der Phase ist:

  • Datenaufbereitung: Ziel der Datenaufbereitung ist es, die Ursprungsdatenquellen in ein geeignetes Format für die anzuwendenden Analyseverfahren zu überführen.

Begleitende Aufgaben umfassen:

  • Datenmanagement:
    • Datenschutz, Anonymisierung, Pseudonymisierung,
    • Verwaltung von Zugriffsrechten auf die Daten,
    • Backups von Ursprungsdaten,
    • Backups von bereits aufbereiteten Daten,
    • Archivierbarkeit der Daten
  • Explorative Datenanalyse:
    • besseres inhaltliches Verständnis der vorliegenden Daten und Datenquellen,
    • Identifikation erster Ansatzpunkte für tiefergehende Analysen,
    • klären, ob Menge und Qualität der Daten für die Fragestellung ausreichen,

Als Ergebnis der vorangegangenen Schritte entsteht eine analytische Datenquelle, die für die weitere Analyse geeignet ist.