Hi,
hat sich schon mal jemand von euch mit Reinforcement Learning beschäftigt. Mir stellt sich nämlich gerade eine Frage zu diesem Thema
Und zwar geht es um folgende Ausführung der Bellman Gleichung (3.10):
http://www.univ.kiev.ua/~yawd/books/AI/3/node8.html
Was soll dieses \sum_{a} \pi(s,a) bedeuten bzw. welchen Wert liefert \pi(s,a)!?
Vielen Dank, Thomas.