Practice of Web Data Mining Methods Application
2009
Pāvels Osipovs, Arkādijs Borisovs

Interneta informācijas pieauguma tempi mūsdienās izvirza augstas prasības informācijas apstrādes algoritmu efektivitātei. Šajā rakstā ir apskatīti daži Web Data Mining jomas algoritmi, kuri ir pierādījuši savu efektivitāti vairākās eksistējošās lietojumprogrammās. Raksts ir sadalīts divās daļas, no kurām pirmajā ir dots teorētisks algoritmu apraksts, bet otrajā piemēri to veiksmīgam pielietojumam uzdevumu atrisināšanai. Dokumentu neprecīzo dublikātu meklēšanas algoritmi tiek aktīvi izmantoti visās galvenajās meklēšanas sistēmās. Ir doti sekojošu algoritmu apraksti: jostas roze, parakstu ,metodes, uz attēliem balstītie algoritmi, kā arī tādas klasifikācijas metodes kā klasterizācija pēc izplūduša k-vidēja (Fuzzy c-means/FCM clustering) un skudru kolonijas klasterizācijas algoritms (Standard Ant Clustering Algorithm SACA). Noslēgumā aprakstīts veiksmīgs pielietojums izplūdušajai klasterizācijai, pielietojot programmatūras rīku komplektu Data Engine, bankas «BCI Bank» efektivitātes paaugstināšanas uzdevumā. Tāpat aprakstīta vienlaicīga skudru kolonijas klasterizācijas algoritma izmantošana kopā ar lineāro ģenētisko programmēšanu tam, lai piedāvātu ļoti noslogota Interneta portāla „Monash” slodzes prognozes efektivitātes palielināšanos.


Keywords
web data mining, duplicate document detection, internet users behavior patterns

Osipovs, P., Borisovs, A. Practice of Web Data Mining Methods Application. IT and Management Science. Vol.40, 2009, pp.101-107. ISSN 1407-7493.

Publication language
English (en)
The Scientific Library of the Riga Technical University.
E-mail: uzzinas@rtu.lv; Phone: +371 28399196