Particulars of Neural Networks Applying in Reinforcement Learning

Jurijs Čižovs

Particulars of Neural Networks Applying in Reinforcement Learning

Proceedings of 14th International Conference on Soft Computing „MENDEL 2008” 2008
Jurijs Čižovs

Klasiskās apmācības ar pastiprināšanu metodes nespēj veiksmīgi darboties reālos uzdevumos, kas var ietvert sevī nepārtrauktas stāvokļu un darbību telpas. Tā saucamie Value Function Approximation un Policy Gradient ļauj risināt minēto problēmu ar tabulveidīgās Q-funkcijas aizvietošanu vai izmantojot gradientu metodi. Tomēr „dimensijas lāsta” problēma vairākos gadījumos paliek atklāta. Šajā darbā tiek izvirzīta ideja, tiek stādīts priekšā algoritms un iegūtie rezultāti. Pamatideja ir daudzslāņu mākslīgo neironu tīklu izmantošana, lai aproksimētu tabulveidīgo Q-funkciju. Daži risinājumi tiek izstrādāti, lai padarītu algoritmu pielietojamu nepārtraukto mainīgo telpām.

Keywords
intelligent agents, reinforcement learning, Artificial Neural Networks, policy approximation

Publication language
English (en)

Publication Type
Full-text conference paper published in other conference proceedings
Funding for basic activity
Unknown
Field of research
1. Natural sciences
Sub-field of research
1.2 Computer and information sciences
ID: 3066