Definition: Data Life Cycle

Der Data Life Cycle beschreibt die folgenden fünf Stufen, die Daten von ihrer Entstehung bis zu ihrer Löschung in der Regel durchlaufen:

  • Acquire
    Daten werden aus unterschiedlichen Umgebungen gesammelt und müssen - je nach Umgebung - anschließend digitalisiert und bspw. als CSV oder in einer Datenbank abgespeichert werden.
  • Clean
    Prüfung der Datenqualität und Korrektur fehlender und falscher Werte.
  • Use/Reuse
    Analyse der Daten zur Erkenntnisextraktion, zur Erstellung von Modellen, zur Visualisierung.
  • Publish
    Mglw. Veröffentlichung der Daten und des Quellcodes oder in Form eines Papers.
  • Preserve/Destroy
    Je nach Datenschutzrecht müssen die Daten nach Abschluss des Projektes gelöscht oder können archiviert werden.

1

Footnotes

  1. @stodden2020 (p. 61)