Definition: Passives Reinforcement-Learning

Als Passives Reinforcement-Learning bezeichnen wir Methoden, die darauf abzielen, die Nutzenwerte von Zuständen einer Umgebung zu erlernen, ohne dabei ein explizites Modell der Umgebung zu nutzen.

Als Grundlage des passiven Reinforcement-Learnings dient eine bereits festgelegte Strategie, die für die Erzeugung von Probeläufen in der Umgebung genutzt wird.