Beispiele
:Generalisierungen
:Involvierte Definitionen
:Veranstaltung
: EMLReferenz
: @thimm2024 (Abschnitt 4.3.2)
⠀
Definition:
-Greedy-Learning Sei
ein MDP.
Seieine Strategie. Als
-Greedy-Learning bezeichnen wir eine Meta-Strategie zum Umgang mit dem Exploration-Exploitation-Dilemma. Beim
-Greedy-Learning wird in einem Zustand
- eine zufällige Aktion mit Wahrscheinlichkeit
ausgeführt, - die Aktion
mit Wahrscheinlichkeit ausgeführt.