View on GitHub

Appunti di Reinforcement Learning

< Torna all’indice dei conenuti

Note

On-policy VS off-policy

Glossario

Termine Definizione Sinonimi
trajectory $\tau=\langle s_0, a_0, …, s_T, a_T\rangle$ episode, rollout