Generalisierungen
:Eigenschaften
:Involvierte Definitionen
:Veranstaltung
: MatheDSReferenz
: @riedel2023 (S. 78 f.)
⠀
Definition: Stochastisches Gradientenabstiegsverfahren
Sei
eine partiell differenzierbare Funktion mit Teilfunktionen , sodass . Als stochastisches Gradientenabstiegsverfahren definieren wir die Iteration in Richtung des jeweils steilsten Abstiegs einer zufällig gewählten Teilfunktion von
, also: wobei
- der Startpunkt
fest gewählt ist, der Index einer in jedem Schritt zufällig (diskret gleichverteilt) zu wählenden Teilfunktion sei, - der Parameter
die Schrittweite des Verfahrens beschreibt.
Anmerkung
Variierende Schrittweite?
Klar, natürlich kann man statt
auch eine Folge wählen :)
Wie ist das mit den Teilfunktionen gemeint?
Nun, viele Funktionen lassen sich in eine Summe von Teilfunktionen aufteilen. Beispielsweise lässt sich die Kostenfunktion eines Datensatzes aufteilen in die Summe der Kostenfunktionen der einzelnen Einträge aus dem Datensatz.
In diesen Fällen ist die Berechnung des normalen Gradientenabstiegsverfahrens sehr aufwändig. Stochastic Gradient Descent führt dort in der Praxis oft schneller zum Ziel.