/vault

❯

Reinforcement Learning

❯

Definition - Temporal Difference Learning

Definition - Temporal Difference Learning

Feb 16, 20254 min read

Beispiele:
- TD-Berechnung des Zustandsnutzens bezüglich einer Strategie
- Epsilon-Greedy Q-Learning
Generalisierungen:
- Online-Lernverfahren
Involvierte Definitionen:
- Zustandsnutzen bezüglich einer Strategie
Veranstaltung: EML
Referenz: @thimm2024 (Abschnitt 4.2.3)

⠀

Definition: Temporal Difference Learning

Als Temporal Difference Learning (kurz TD-Learning) bezeichnen wir eine Klasse von Verfahren im Bereich des Reinforcement Learnings.

Beim TD-Learning wird die Schätzung des Nutzens eines besuchten Zustandes schon während der Durchführung der Probeläufe aktualisiert (und nicht erst nach deren Abschluss).

Graph View

Mentioned in

Definition - Online-Lernverfahren
Algorithmus - Epsilon-Greedy Q-Learning
Definition - TD-Berechnung des Zustandsnutzens bezüglich einer Strategie

Made by Malte Zietlow using Quartz v4.3.1 © 2025

Home
🔬 GitHub
⚙️ LinkedIn