Definition: Teilprobelauf eines Zustands

Sei ein (zunächst unbekannter) Markov-Entscheidungsprozess.
Sei eine Strategie.
Sei mit ein Probelauf bezüglich .

Als Teilprobelauf bezüglich bezeichnen wir

Anders gesagt handelt es sich also genau um die Menge der Teilsequenzen von , die mit einer Beobachtung beginnen, deren Zustand dem Zustand entspricht.