Involvierte Definitionen
:Veranstaltung
: MatheDSReferenz
: @riedel2023 (Satz 3.3.24)
⠀
Proposition: Konvergenz des stochastischen Gradientenabstiegsverfahren für konvexe Funktionen
Sei
eine partiell differenzierbare Funktion mit Teilfunktionen , sodass .
Die Teilfunktionenseien konvex, total differenzierbar und -glatt.
Seiein Parameter.
Seidie Schrittweite in der -ten Iteration mit .
Seidas Supremum des durchschnittlichen Gradienten über alle Minimalstellen wie folgt: Sei
die durch das stochastische Gradientenabstiegsverfahren definierte Folge mit beliebigem Startpunkt . Dann gilt für alle
: wobei
ein gemittelter Wert der sei mit