Definition: Teilprobeläufe eines Zustands aus einer Menge strategie-induzierter Probeläufe

Sei ein (zunächst unbekannter) Markov-Entscheidungsprozess.
Sei eine feste Strategie.

Als Teilprobeläufe eines Zustands aus einer Menge -induzierter Probeläufe bezeichnen wir

wobei eine Menge von Probeläufen bezüglich sei.