Konstrukte
:Involvierte Definitionen
:Veranstaltung
: EDSReferenz
:- @beecks2024 (LE3, Data Science Life Cycle)
- @stodden2020
⠀
Definition: Data Life Cycle
Der Data Life Cycle beschreibt die folgenden fünf Stufen, die Daten von ihrer Entstehung bis zu ihrer Löschung in der Regel durchlaufen:
- Acquire
Daten werden aus unterschiedlichen Umgebungen gesammelt und müssen - je nach Umgebung - anschließend digitalisiert und bspw. als CSV oder in einer Datenbank abgespeichert werden.- Clean
Prüfung der Datenqualität und Korrektur fehlender und falscher Werte.- Use/Reuse
Analyse der Daten zur Erkenntnisextraktion, zur Erstellung von Modellen, zur Visualisierung.- Publish
Mglw. Veröffentlichung der Daten und des Quellcodes oder in Form eines Papers.- Preserve/Destroy
Je nach Datenschutzrecht müssen die Daten nach Abschluss des Projektes gelöscht oder können archiviert werden.
Footnotes
-
@stodden2020 (p. 61) ↩