/vault

❯

Reinforcement Learning

❯

Definition - Approximierte Belohnungsfunktion

Definition - Approximierte Belohnungsfunktion

Aug 03, 20249 min read

Konstrukte:
- Epsilon-Greedy ADP
Generalisierungen:
- Belohnungsfunktion
Involvierte Definitionen:
Veranstaltung: EML
Referenz: @thimm2024 (Abschnitt 4.2.2, Definition 3)

⠀

Definition: Approximierte Belohnungsfunktion

Sei ein (zunächst unbekannter) Markov-Entscheidungsprozess.
Sei eine Menge von Probeläufen bezüglich einer Strategie .

Dann können wir approximieren durch:
$ü$
Wobei wir voraussetzen, dass der Reward für alle Beobachtungen identisch ist.

Graph View

Mentioned in

Algorithmus - Epsilon-Greedy ADP
Definition - Approximierte Transitionswahrscheinlichkeitsfunktion
Definition - Approximierter Zustandsnutzen bezüglich einer Strategie
Definition - Belohnungsfunktion

Made by Malte Zietlow using Quartz v4.3.1 © 2026

Home
🔬 GitHub
⚙️ LinkedIn