Definition: Hash-based Sharding

Als Hash-based Sharding bezeichnen wir eine Sharding-Methode, bei der ein Hash-Algorithmus auf bspw. den Primary-Key der Datensätze angewendet wird, um zu bestimmen, in welchen Shard die Daten gespeichert werden sollen.

  • Diese Methode sorgt für eine gleichmäßige Verteilung der Daten über die Shards hinweg.
  • Es gibt jedoch keine “themenbezogene Datenlokalität” (bspw. alle Daten aus Januar auf einem Node, alle Filme mit dem Genre Drama auf einem Node.)

Bekannte NoSQL-Datenbanken, die unter anderem Hash-based Sharding implementieren sind:

  • MongoDB, Riak, Redis, Cassandra, Azure Table, …