Zinātniskās darbības atbalsta sistēma
Latviešu English

Publikācija: Izplūdušās klasifikācijas metodoloģija bioinformātikas datu apstrādei un analīzei

Publikācijas veids Promocijas darbs
Pamatdarbībai piesaistītais finansējums Nav zināms
Aizstāvēšana: 01.02.2016 14:30, Rīgas Tehniskās universitātes Datorzinātnes un informācijas tehnoloģijas fakultātē, Sētas ielā 1, 202. auditorijā
Publikācijas valoda Latviešu (lv)
Nosaukums oriģinālvalodā Izplūdušās klasifikācijas metodoloģija bioinformātikas datu apstrādei un analīzei
Nosaukums angļu valodā Fuzzy Classification Methodology for Processing and Analyzing Bioinformatics Data
Pētniecības nozare 2. Inženierzinātnes un tehnoloģijas
Pētniecības apakšnozare 2.2. Elektrotehnika, elektronika, informācijas un komunikāciju tehnoloģijas
Autori Madara Gasparoviča-Asīte
Atslēgas vārdi Bioinformatics, data mining, classification, fuzzy logic
Anotācija Promocijas darbs veltīts izplūdušās klasifikācijas metodoloģijas izstrādei ar pielietojumu bioinformātikas datu apstrādē un analīzē. Izplūdušie klasifikācijas algoritmi izvēlēti pielietošanai bioinformātikas datu analīzē, jo cilvēkam ļauj lietot labi uztveramus lingvistiskos jēdzienus. Darbā risināmā bioinformātikas diagnostikas problēma darba ietvaros formalizēta kā datu ieguves klasifikācijas uzdevums, kur iepriekš zināma klase, kas ir diagnoze vai slimības veids. Izplūdušās metodoloģijas katrā daļā iekļaujamie algoritmi un metodes noteiktas eksperimentāli, veidojot plašu pētījumu ar divdesmit piecām reālās bioinformātikas datu kopām. Tika pētītas dažādas metodes un noteiktas piemērotākās tieši bioinformātikas datiem. Praktisko eksperimentu gaitā identificētas metodoloģijas daļas, kurām nepieciešami uzlabojumi. Promocijas darbā izstrādāta uz klasterizāciju balstītā piederības funkciju konstruēšanas metode. Izvēlētajā klasifikācijas algoritmā FuzzyBexa iestrādāta FURIA likumu stiepšanas stratēģija un autores izstrādātā likumu fazifikācijas metode, kas izmanto informāciju par konstruētajām piederības funkcijām. Uz metodoloģiju balstītās izstrādātās izplūdušās klasifikācijas sistēmas eksperimentāla validācija pierāda tās efektivitāti bioinformātikas datu klasifikācijā. Izstrādāto metodoloģiju ērti pielāgot lietošanai ar citiem izplūdušajiem klasifikācijas algoritmiem. Metodoloģiju iespējams pielietot arī citu jomu ar līdzīgu datu struktūru (daudzi desmiti tūkstoši atribūti un proporcionāli maz – tikai aptuveni simts ieraksti) apstrādē un analīzē. Kopējais darba apjoms ir 160 lapaspuses (t.sk. pielikumi), tas satur 31 tabulu, 47 attēlus un 6 pielikumus. Darbā ir atsauces uz 133 bibliogrāfijas avotiem.
Anotācija angļu valodā The main aim of Thesis is to develop a fuzzy classification methodology for the use in processing and analysis of bioinformatics data. The use of fuzzy algorithms is suggested for the task of bioinformatics data analysis due to their use of linguistic terms that are easily comprehensible for humans. The task of bioinformatics-based diagnostics approached in Thesis is formalized as a classification task in data mining, where one has access to a predefined class (diagnosis) for each observed case. The algorithms and methods to be included in any step of the methodology are determined experimentally by testing on twenty five actual bioinformatics data sets. The study focused on investigating different methods and evaluating for suitability for bioinformatics data. The methodology steps that needed improvement were identified in experimental examination. Therefore in this Thesis are also proposed a membership function construction method that is based on clustering approach, a modification of the accepted classification algorithm FuzzyBexa by introducing the principle of rule-stretching that is used in FURIA as well as a novel rule fuzzification method that applies information from the constructed membership functions. The experimental validation of the fuzzy classification system that implements the proposed methodology proves its efficacy in the bioinformatics classification task. The developed methodology can be easily adapted for other fuzzy classification algorithms. The methodology can also be applied to other areas with the necessity to process and analyze similar data structures (tens of thousands of attributes and comparatively few, approximately hundred, records). The work contains 160 p. (include appendixes), 31 tables, 47 figures,6 appendixes and 133 referances
Atsauce Gasparoviča-Asīte, Madara. Izplūdušās klasifikācijas metodoloģija bioinformātikas datu apstrādei un analīzei. Promocijas darbs. Rīga: [RTU], 2015. 160 lpp.
Kopsavilkums Kopsavilkums
ID 21548