Reinforcement Learning with Function Approximation: Survey and Practice Experience

Jurijs Čižovs

Reinforcement Learning with Function Approximation: Survey and Practice Experience

Proceedings of International Conference on Modelling of Business, Industrial and Transport Systems 2008
Jurijs Čižovs

Šī raksta mērķis ir sniegt pārskatu par Function Approximation un Policy Gradient metodēm. Lai to izdarītu, tiek realizēti algoritmi Tile Coding un Gradient Descent with Backpropagation Artificial Neural Network. Izmantojot pakalna mašīnas uzdevumu, tiek demonstrēti eksperimentu rezultāti.

Keywords
Reinforcement learning, Value Function Approximation, Gradient Policy, Tile Coding, Neural Network

Publication language
English (en)

Publication Type
Full-text conference paper published in other conference proceedings
Funding for basic activity
Unknown
Field of research
1. Natural sciences
Sub-field of research
1.2 Computer and information sciences
ID: 3069