Definition: Range-based Sharding

Als Range-based Sharding bezeichnen wir eine Sharding-Methode, bei der die Daten basierend auf Wertebereichen, bspw. des Primary-Keys, auf die Shards verteilt werden.

  • Jeder Shard enthält Daten, die in einen bestimmten Bereich fallen (bspw. alle daten aus Januar oder alle Filme mit dem Genre Drama), was den Zugriff auf zusammenhängende Daten erleichtern kann.
  • In der Regel keine gleichmäßige Verteilung über die Nodes.
  • Benötigt häufiger Repartitioning/Balancing.

Bekannte NoSQL-Datenbanken, die unter anderem Range-based Sharding implementieren sind:

  • MongoDB, BigTable, HBase, …