Definition: Optimaler Zustandsnutzen

Sei ein Markov-Entscheidungsprozess.
Sei die optimale Strategie.

Als optimalen (diskontierten) Nutzen von definieren wir: