Particulars of Neural Networks Applying in Reinforcement Learning
Proceedings of 14th International Conference on Soft Computing „MENDEL 2008” 2008
Jurijs Čižovs

Klasiskās apmācības ar pastiprināšanu metodes nespēj veiksmīgi darboties reālos uzdevumos, kas var ietvert sevī nepārtrauktas stāvokļu un darbību telpas. Tā saucamie Value Function Approximation un Policy Gradient ļauj risināt minēto problēmu ar tabulveidīgās Q-funkcijas aizvietošanu vai izmantojot gradientu metodi. Tomēr „dimensijas lāsta” problēma vairākos gadījumos paliek atklāta. Šajā darbā tiek izvirzīta ideja, tiek stādīts priekšā algoritms un iegūtie rezultāti. Pamatideja ir daudzslāņu mākslīgo neironu tīklu izmantošana, lai aproksimētu tabulveidīgo Q-funkciju. Daži risinājumi tiek izstrādāti, lai padarītu algoritmu pielietojamu nepārtraukto mainīgo telpām.


Atslēgas vārdi
intelligent agents, reinforcement learning, Artificial Neural Networks, policy approximation

Čižovs J. Particulars of Neural Networks Applying in Reinforcement Learning // Proceedings of 14th International Conference on Soft Computing „MENDEL 2008”, Čehija, Brno, 18.-20. jūnijs, 2008. - 154-160. lpp

Publikācijas valoda
English (en)
RTU Zinātniskā bibliotēka.
E-pasts: uzzinas@rtu.lv; Tālr: +371 28399196