Definition: Spark SQL

Spark SQL ist eine modulare Erweiterung von Apache Spark, die für die Verarbeitung strukturierter Daten entwickelt wurde.

Es ermöglicht:

  • das Arbeiten mit DataFrames und Datasets,
  • das Ausführen von SQL-Abfragen,
  • die Integration mit gängigen Datenquellen.