Clustering Methodology for Time Series Mining
2009
Peteris Grabusts, Arkādijs Borisovs

Vispārīgā gadījumā laikrinda tiek traktēta kā datu virkne noteiktā laika intervālā. Laikrindu analīze ir pietiekami labi pazīstams uzdevums, taču pēdējā laikā tiek veikti pētījumi ar nolūku mēģināt pielietot klasterizāciju laikrindu analīzē – laikrindu datu sadalīšanu līdzīgās grupās. Laikrindu attēlošanas klasteru formā galvenā motivācija ir laikrindu raksturlielumu labāka izpratne. Darba galvenais mērķis bija izpētīt laikrindu klasterizācijas izmantošanas metodoloģiju, apzināt laikrindu līdzības novērtējumus un izmantot tos laikrindu klasterizācijas rezultātu novērtēšanā. Par līdzības novērtējumu tradicionāli tiek izmantots Eiklīda attālums, taču pēdējā laikā līdzības mēra noteikšanai izmanto vairāk komplicētas metodes, piemēram, garākās kopīgās virknes metodi (LCSS). Dotajā darbā tika veikti divi uzdevumi. Pirmais bija noteikt laikrindu līdzības novērtējuma iespējas. Eksperimenta mērķis bija pārbaudīt LCSS metodes piemērotību reālu laikrindu līdzības novērtēšanai. Tika konstatēts, ka LCSS metode dod labākus rezultātus laikrindu līdzības noteikšanā nekā Eiklīda distance. Otrais uzdevums bija izpētīt klasterizācijas algoritmu iespējas laikrindu klasterizācijā. Tika izmantoti divi klasiskie klasterizācijas algoritmi: k-vidējo un hierarhiskās klasterizācijas algoritms. Eksperimentu rezultātā tika izdarīts secinājums, ka konkrēto laikrindu klasterizācijas rezultāti ar k-vidējo algoritma palīdzību atbilst iegūtajiem rezultātiem ar LCSS metodi. Tas deva pārliecību, ka laikrindu klasterizācijas rezultāti ir adekvāti.


Atslēgas vārdi
time series, similarity measures, k-means clustering, hierarchical clustering, LCSS method

Grabusts, P., Borisovs, A. Clustering Methodology for Time Series Mining. Informācijas tehnoloģija un vadības zinātne. Nr.40, 2009, 81.-86.lpp. ISSN 1407-7493.

Publikācijas valoda
English (en)
RTU Zinātniskā bibliotēka.
E-pasts: uzzinas@rtu.lv; Tālr: +371 28399196