Definition: Daten

Als Daten bezeichnen wir alle Formen von Informationen, die gesammelt, gespeichert, verarbeitet und analysiert werden können.

Typischerweise können Daten numerisch, textuell, visuell oder auditiv sein. Sie umfassen

  • strukturierte Daten (z.B. Tabellen in Datenbanken),
  • unstrukturierte Daten (z.B. Texte und Bilder) sowie
  • semi-strukturierte Daten (z.B. eine E-Mail mit strukturiertem Header und unstrukturiertem Body).

Anmerkung

Datengetriebenheit

Daten in der Data Science können beispielsweise

  • digital / analog vorliegen,
  • statisch oder als Stream vorliegen,
  • online oder offline sein,
  • quantitativ oder qualitativ sein,
  • unsicher oder präzise sein,
  • Fehler enthalten,
  • Verrauscht sein,
  • Fehlende Werte enthalten,
  • ein oder mehrdimensional (Bilder, Audiodateien, …) sein.