Definition: Team Data Science Process

Der Team Data Science Process (kurz TDSP) ist ein von Microsoft entwickelter systematischer Ansatz zur Planung, Erstellung, Bereitstellung und Wartung von Data-Science-Lösungen.

Der TDSP besteht aus den Phasen:

  1. Geschäftsverständnis: Definieren der Kriterien für den Projekterfolg, Bestimmung von Zielvariablen und zugehörigen Metriken und Identifikation der Datenquellen.
  2. Datenerfassung und Verständnis: Sammeln, Erkunden und Vorbereiten der Daten für die Analyse.
  3. Modellierung: Entwickeln und Trainieren von Modellen, um Geschäftsfälle zu adressieren.
  4. Deployment: Implementieren der Modelle in der Produktionsumgebung und Bereitstellen der Lösung für den Endnutzer.
  5. Kundenakzeptanz: Finalisierung des Projektes und evtl. Übergabe an eine andere Organisationseinheit / Abteilung.

Anmerkung

Business Understanding

Die Phase Business Understanding des Team Data Science Processes umfasst folgende Schritte:

  • Definieren der Kriterien für den Projekterfolg,

  • Bestimmung von Zielvariablen und zugehörigen Metriken,

  • Identifikation der Datenquellen.

Datenerfassung und Auswertung

Die Phase Datenerfassung und Auswertung des Team Data Science Processes umfasst folgende Schritte:

  • Bestimmung eines geeigneten Datensatzes, in Bezug zu den Zielvariablen,
  • Entwicklung einer Data Pipeline zur Bereitstellung und Aktualisierung der Daten in der Analyseumgebung.
  • Datenaufbereitung und explorative Datenanalyse

Modellierung

Die Phase Modellierung des Team Data Science Processes umfasst folgende Schritte:

  • Bestimmung einer geeigneten Menge von Features (Feature Engineering)
  • Trainieren eines ML-Modells zur Vorhersage der Zielvariablen
  • Evaluierung des Modells

Deployment

Die Phase Deployment des Team Data Science Processes umfasst folgende Schritte:

  • Bereitstellung des Analysemodells unter Anbindung einer Datenpipeline in der Anwendungsumgebung
  • Bspw. durch Bereitstellung einer API für Client-Anwendungen oder als Web Service.

Kundenakzeptanz

Die Phase Kundenakzeptanz des Team Data Science Processes umfasst folgende Schritte:

  • Finalisieren des Projektes, Überprüfung der Erfolgskriterien,
  • Erstellung eines Abschlussberichtes, der die technischen Aspekte und gestellten Anforderungen dokumentiert,
  • Evtl. Projektübergabe an die jeweilige Organisationseinheit