Konstrukte
:Generalisierungen
:Eigenschaften
:Involvierte Definitionen
:Veranstaltung
: EMLReferenz
: @thimm2024 (Abschnitt 4.1.2)
⠀
Theorem: Bellmann-Update
Sei
ein Markov-Entscheidungsprozess. Als Bellmann-Update definieren wir die iterative Berechnung des optimalen Zustandsnutzens: