Definition: Temporal Difference Learning

Als Temporal Difference Learning (kurz TD-Learning) bezeichnen wir eine Klasse von Verfahren im Bereich des Reinforcement Learnings.

Beim TD-Learning wird die Schätzung des Nutzens eines besuchten Zustandes schon während der Durchführung der Probeläufe aktualisiert (und nicht erst nach deren Abschluss).