Konstrukte:Generalisierungen:Eigenschaften:Involvierte Definitionen:Veranstaltung: EMLReferenz: @thimm2024 (Abschnitt 4.1.2)
⠀
Theorem: Bellmann-Update
Sei
ein Markov-Entscheidungsprozess. Als Bellmann-Update definieren wir die iterative Berechnung des optimalen Zustandsnutzens: