/vault

❯

❯

Proposition - Einlesen von Daten in Spark

Proposition - Einlesen von Daten in Spark

Feb 27, 20254 min read

Involvierte Definitionen:
- Definition - Apache Spark
- HDFS
Veranstaltung: DEDS
Referenz:

⠀

Proposition: Einlesen von Daten in Spark

In Spark können wir ein .csv auf zwei Arten einlesen:

df = spark.read.csv(path=data_path),

wobei data_path einen Pfad im HDFS erwartet.

df = sc.textFile(path=data_path),

wobei sc der aktuelle SparkContextist und data_path einen Pfad im HDFS oder im Filesystem des Clients erwartet.

ist lazy

Graph View

Mentioned in

Definition - Apache Spark
Definition - HDFS
Definition - Spark SQL

Made by Malte Zietlow using Quartz v4.3.1 © 2026

Home
🔬 GitHub
⚙️ LinkedIn