/vault

❯

Reinforcement Learning

❯

Proposition - Charakterisierung des optimalen Zustandsnutzens durch Q-Funktion

Proposition - Charakterisierung des optimalen Zustandsnutzens durch Q-Funktion

Sep 11, 20246 min read

Involvierte Definitionen:
Veranstaltung: EML
Referenz: @thimm2024 (Abschnitt 4.3.3)

⠀

Proposition: Charakterisierung des optimalen Zustandsnutzens durch Q-Funktion

Sei ein Markov-Entscheidungsprozess.
Sei .

Dann gilt:

Graph View

Mentioned in

Algorithmus - Epsilon-Greedy Q-Learning
Definition - Optimaler Zustandsnutzen
Definition - Q-Funktion (Reinforcement Learning)
Proposition - Charakterisierung der optimalen Strategie durch Q-Funktion

Made by Malte Zietlow using Quartz v4.3.1 © 2026

Home
🔬 GitHub
⚙️ LinkedIn