Reinforcement Learning with Function Approximation: Survey and Practice Experience
Proceedings of International Conference on Modelling of Business, Industrial and Transport Systems 2008
Jurijs Čižovs

Šī raksta mērķis ir sniegt pārskatu par Function Approximation un Policy Gradient metodēm. Lai to izdarītu, tiek realizēti algoritmi Tile Coding un Gradient Descent with Backpropagation Artificial Neural Network. Izmantojot pakalna mašīnas uzdevumu, tiek demonstrēti eksperimentu rezultāti.


Atslēgas vārdi
Reinforcement learning, Value Function Approximation, Gradient Policy, Tile Coding, Neural Network

Čižovs J. Reinforcement Learning with Function Approximation: Survey and Practice Experience // Proceedings of International Conference on Modelling of Business, Industrial and Transport Systems, Latvija, Rīga, 7.-10. maijs, 2008. - 204-210. lpp

Publikācijas valoda
English (en)
RTU Zinātniskā bibliotēka.
E-pasts: uzzinas@rtu.lv; Tālr: +371 28399196