Generalisierungen
:Involvierte Definitionen
:Veranstaltung
: EDSReferenz
: @beecks2024 (LE3, Team Data Science Process)
⠀
Definition: Team Data Science Process
Der Team Data Science Process (kurz TDSP) ist ein von Microsoft entwickelter systematischer Ansatz zur Planung, Erstellung, Bereitstellung und Wartung von Data-Science-Lösungen.
Der TDSP besteht aus den Phasen:
- Geschäftsverständnis: Definieren der Kriterien für den Projekterfolg, Bestimmung von Zielvariablen und zugehörigen Metriken und Identifikation der Datenquellen.
- Datenerfassung und Verständnis: Sammeln, Erkunden und Vorbereiten der Daten für die Analyse.
- Modellierung: Entwickeln und Trainieren von Modellen, um Geschäftsfälle zu adressieren.
- Deployment: Implementieren der Modelle in der Produktionsumgebung und Bereitstellen der Lösung für den Endnutzer.
- Kundenakzeptanz: Finalisierung des Projektes und evtl. Übergabe an eine andere Organisationseinheit / Abteilung.
Anmerkung
Business Understanding
Die Phase Business Understanding des Team Data Science Processes umfasst folgende Schritte:
Definieren der Kriterien für den Projekterfolg,
Bestimmung von Zielvariablen und zugehörigen Metriken,
Identifikation der Datenquellen.
Datenerfassung und Auswertung
Die Phase Datenerfassung und Auswertung des Team Data Science Processes umfasst folgende Schritte:
- Bestimmung eines geeigneten Datensatzes, in Bezug zu den Zielvariablen,
- Entwicklung einer Data Pipeline zur Bereitstellung und Aktualisierung der Daten in der Analyseumgebung.
- Datenaufbereitung und explorative Datenanalyse
Modellierung
Die Phase Modellierung des Team Data Science Processes umfasst folgende Schritte:
- Bestimmung einer geeigneten Menge von Features (Feature Engineering)
- Trainieren eines ML-Modells zur Vorhersage der Zielvariablen
- Evaluierung des Modells
Deployment
Die Phase Deployment des Team Data Science Processes umfasst folgende Schritte:
- Bereitstellung des Analysemodells unter Anbindung einer Datenpipeline in der Anwendungsumgebung
- Bspw. durch Bereitstellung einer API für Client-Anwendungen oder als Web Service.
Kundenakzeptanz
Die Phase Kundenakzeptanz des Team Data Science Processes umfasst folgende Schritte:
- Finalisieren des Projektes, Überprüfung der Erfolgskriterien,
- Erstellung eines Abschlussberichtes, der die technischen Aspekte und gestellten Anforderungen dokumentiert,
- Evtl. Projektübergabe an die jeweilige Organisationseinheit