Beispiele:Generalisierungen:Involvierte Definitionen:Veranstaltung: EMLReferenz: @thimm2024 (Abschnitt 4.2.3)
⠀
Definition: Temporal Difference Learning
Als Temporal Difference Learning (kurz TD-Learning) bezeichnen wir eine Klasse von Verfahren im Bereich des Reinforcement Learnings.
Beim TD-Learning wird die Schätzung des Nutzens eines besuchten Zustandes schon während der Durchführung der Probeläufe aktualisiert (und nicht erst nach deren Abschluss).