Typen
:Konstrukte
:Generalisierungen
:Eigenschaften
:Hinreichende Bedingungen
:Involvierte Definitionen
:Veranstaltung
: MatheDSReferenz
: @riedel2023
⠀
Tipp: Ziel des Gradientenabstiegsverfahrens
Sei
eine partiell differenzierbare Funktion. Ziel des Gradientenabstiegsverfahrens ist es, eine globale Minimalstelle
zu bestimmen, also
Definition: Gradientenabstiegsverfahren
Sei
eine partiell differenzierbare Funktion. Als Gradientenabstiegsverfahren definieren wir die Iteration in Richtung des jeweils steilsten Abstiegs von
, also: wobei
- der Startpunkt
fest gewählt ist und - der Parameter
die Schrittweite des Verfahrens beschreibt.
Anmerkung
Einschränkungen für konkave Funktionen
Ist
eine konkave Funktion, so können zwei Probleme auftreten:
- das Verfahren kann gegen ein lokales Minimum konvergieren.
- das Verfahren kann gegen einen Sattelpunkt konvergieren.
Ist
jedoch konvex, werden diese Fälle durch die Propositionen
- Lokale Minima konvexer Funktionen sind auch globale Minima und
- Konvexe Funktion hat ihr globales Minimum an der Stelle an der der Gradient null ist
ausgeschlossen.
Herleitung
In der Definition haben wir das Gradientenabstiegsverfahren durch die Eigenschaft hergeleitet, dass der Gradient in die Richtung des stärksten Wachstums weist.
Wie in @riedel2023 (S. 77) wollen wir hier noch die eine Herleitung mittels des Satzes von Taylor bzw. der Taylor-Approximation erläutern.
Ist also
Dann gilt mit der mehrdimensionalen Taylor-Approximation für beliebige
heißt: eine Bewegung von
Ziel des Gradientenabstiegsverfahrens ist das Finden einer Minimalstelle
Da
Mithilfe der Lagrange-Funktion erhalten wir das optimale
wobei
denn wir Bewegen uns von