Beispiele:
- TD-Berechnung des Zustandsnutzens bezüglich einer Strategie
- ADP Berechnung des Zustandsnutzens bezüglich einer Strategie
Involvierte Definitionen:
- Strategie
- Probelauf bezüglich einer Strategie
- siehe auch Aktives Reinforcement-Learning
Veranstaltung: EML
Referenz: @thimm2024 (Abschnitt 4.2)

⠀

Definition: Passives Reinforcement-Learning

Als Passives Reinforcement-Learning bezeichnen wir Methoden, die darauf abzielen, die Nutzenwerte von Zuständen einer Umgebung zu erlernen, ohne dabei ein explizites Modell der Umgebung zu nutzen.

Als Grundlage des passiven Reinforcement-Learnings dient eine bereits festgelegte Strategie, die für die Erzeugung von Probeläufen in der Umgebung genutzt wird.

/vault

Definition - Passives Reinforcement-Learning

⠀

Graph View

Mentioned in