Ambiguous States Determination in Non-Markovian Environments

Jurijs Čižovs; Tatjana Zmanovska; Arkādijs Borisovs

Ambiguous States Determination in Non-Markovian Environments

2008
Jurijs Čižovs, Tatjana Zmanovska, Arkādijs Borisovs

Klasiskās apmācības ar pastiprināšanu metodes veiksmīgi funkcionē tā saucamajās nemarkova vidēs. Šajā darbā tiek izvirzīta ideja un algoritma izpildīšana nemarkova videi. Ierosinātā pieeja piedāvā daudznozīmīgo stāvokļu apmeklēšanas paņēmienu. Raksts definē un sīki apskata daudznozīmīgu stāvokļu formas nemarkova vidēs. Apmeklēšana ir svarīga fāze pirms politikas uzbūvei nemarkova vidēs izmantojot stāvokļu iekšējo reprezentāciju. Savukārt, stāvokļu iekšējai reprezentācijai ir jāsaglābj konverģences noteikumi, apmācības ar pastiprinājumu īpašības un priekšrocības. Raksta būtiska daļa ir veltīta daudznozīmīgo stāvokļu izrādīšanas pazīmēm un atrāšanas algoritmiem. Kā ir rādīts rakstā, pats grūtākais uzdevums ir atšķirt viena un tā paša stāvokļa divus eksemplārus. Raksts iekļauj sevī teorētisko ievadu, problēmu aprakstu un tās izpausmi šūnu pasaulē. Tika formulēti daudznozīmīgu stāvokļu trīs formas un izvirzīta tās atklāšanās ideja. Lai iegūtu praktiskus rezultātus, tika izstrādāta programmatūra, kas dotai pasaulei veido visu daudznozīmīgu stāvokļu sarakstu. Pamatojoties uz iegūtiem rezultātiem, izvirzīti secinājumi. Šīs darbs ir nepieciešamā iepriekšēja fāze aģenta nemarkova vidē funkcionēšanas uzdevuma izpētē.

Atslēgas vārdi
reinforcement learning, non-Markovian deterministic environments, intelligent agent control

Čižovs, J., Zmanovska, T., Borisovs, A. Ambiguous States Determination in Non-Markovian Environments. Informācijas tehnoloģija un vadības zinātne. Nr.36, 2008, 140.-147.lpp. ISSN 1407-7493.

Publikācijas valoda
English (en)

Publikācijas veids
Publikācija RTU zinātniskajā žurnālā
Pamatdarbībai piesaistītais finansējums
Nav zināms
Pētniecības nozare
2. Inženierzinātnes un tehnoloģijas
Pētniecības apakšnozare
2.2. Elektrotehnika, elektronika, informācijas un komunikāciju tehnoloģijas
ID: 4856