Theorem: Gradientenabstiegsverfahren konvergiert für -glatte und konvexe Funktionen

Sei zweimal total differenzierbar.
Sei außerdem -glatt und konvex.
Sei ein globales Minimum von

Sei die durch das Gradientenabstiegsverfahren definierte Folge mit

  • beliebigem Startpunkt und
  • Schrittweite .

Dann gilt für alle :

Insbesondere gilt damit mit Konvergenzordnung .

Anmerkung

Tipp

Die Konvergenz folgt, da

eine Nullfolge ist.