Beispiele
:Generalisierungen
:Involvierte Definitionen
:Veranstaltung
: EMLReferenz
: @thimm2024 (Abschnitt 4.2.3)
⠀
Definition: Temporal Difference Learning
Als Temporal Difference Learning (kurz TD-Learning) bezeichnen wir eine Klasse von Verfahren im Bereich des Reinforcement Learnings.
Beim TD-Learning wird die Schätzung des Nutzens eines besuchten Zustandes schon während der Durchführung der Probeläufe aktualisiert (und nicht erst nach deren Abschluss).