Generalisierungen
:Involvierte Definitionen
:Veranstaltung
: DEDSReferenz
:- @storl2024 (Analyse von Big Data)
⠀
Definition: Map-Combine-Reduce
Als Map-Combine-Reduce definieren wir eine Erweiterung des MapReduce Paradigmas, bei der der Netzwerktraffic des Shuffle-Schrittes reduziert wird.
- Map: Verarbeitet Eingabedaten und erzeugt Zwischenpaare (Key, Value).
- Combine: Auf den Map-Nodes werden die Daten schon nach Key voraggergiert.
- Shuffle: Die Zwischenpaare (Key, Value) werden so auf neue Nodes verteilt, dass jeder Node alle Werte mit einem bestimmten Key erhält.
- Reduce: Aggregiert diese Paare und erzeugt die Endergebnisse.