Definition: DASC-PM

Das Data Science Process Model (kurz DASC-PM) ist ein iteratives Vorgehensmodell für Data-Science-Projekte mit den folgenden Phasen:

  1. Projektauftrag: Ein Ereignis aus der Domäne führt zu der Entwicklung eines oder mehrerer geprüfter Use Cases, die in einem Projektauftrag münden.
  2. Datenbereitstellung: Aus den identifizierten Ursprungsdatenquellen werden durch Datenaufbereitung geeignete analytische Datenquellen für die weitere Analyse erzeugt.
  3. Analyse: Auf Basis der analytischen Datenquelle und der identifizierten Anforderungen werden geeignete Analyseverfahren ausgewählt (oder neu entwickelt) und angewendet, um zu einem Analyseergebnis zu gelangen.
  4. Nutzbarmachung: Aus der analytischen Datenquelle und den Analyseergebnissen werden durch technische und fachliche Bereitstellung nutzbare Analyseartefakte erstellt und in eine Produktivumgebung integriert.
  5. Nutzung: Die zuvor erstellten Analyseartefakte werden durch die Anwender verwendet. Die Analyseartefakte werden regelmäßig auf fachliche Qualität geprüft und die technische Bereitstellung wird überwacht (monitoring), um Nutzungserkenntnisse zu gewinnen.

Definition: Die sieben Schlüsselbereiche

Neben dem Prozessmodell definiert DASC-PM sieben Schlüsselbereiche.

Im Zentrum stehen die auf Data Science fokussierten Bereiche Daten und Analyseverfahren sowie die auf die Domäne fokussierten Bereiche Nutzbarmachung und Nutzung.

Die zentralen Aspekte sind in die Domäne eingebettet, die den Kontext für die zugrundeliegenden Aufgaben gibt.

Die Wissenschaftlichkeit steht weisend über dem gesamten Prozess, während die IT-Infrastruktur die technischen Grundvoraussetzungen bereitstellt.