Pregled bibliografske jedinice broj: 835244
Učenje stabala odlučivanja zanemarivanjem kompleksnih primjera
Učenje stabala odlučivanja zanemarivanjem kompleksnih primjera, 2016., diplomski rad, preddiplomski, Odjel za informatiku, Rijeka
CROSBI ID: 835244 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Učenje stabala odlučivanja zanemarivanjem kompleksnih primjera
(Learning comprehensible trees by disregarding complex instances)
Autori
Barić, Ivana
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Odjel za informatiku
Mjesto
Rijeka
Datum
08.09
Godina
2016
Stranica
43
Mentor
Martinčić-Ipšić, Sanda
Ključne riječi
C4.5; J48; klasifikacijsko stablo; klasifikator; stabla odlučivanja; strojno učenje;; dubina lista; primjeri; algoritam
(Data Mining; Classification Tree; C4.5; J48; Instances; Machine learning; Eclipse; Comprehensible Trees; depth of the tree)
Sažetak
U završnom radu opisan je postupak učenja stabala odlučivanja zanemarujući kompleksne primjere. Tema obuhvaća implementaciju algoritma koji uvažava točnost klasificiranih podataka na isti način kao što to čini i klasifikacijsko stablo. Razumljivost je najvažnija prednost klasifikacijskih stabala u odnosu na većinu drugih klasifikatora stoga je vrlo bitna pri izgradnji i implementaciji algoritma. U uvodu se opisuje područje primjene stabala odlučivanja te različitih algoritama koji se koriste kako bi se otkrili što ispravniji, korisniji i razumljiviji modeli iz podataka te je dana sama definicija što je dubinska analiza podataka. Nadalje opisuje se sam problem tj. zašto se gradi novi algoritam koji uvažava dubinu stabla. Predstavljen je kratak opis strojnog učenja (engl. Data Mining), algoritma C4.5 (J48) te je dan primjer korištenja tog algoritma u strojnom učenju. Opis algoritma, kao i sam program koji služi za implementaciju algoritma te programski alat Eclipse također su opisani u daljnjim poglavljima. U prijedlogu algoritma predstavljen je algoritam koji je zapravo bio glavni zadatak ovog završnog rada. Glavnu ideju algoritma predstavlja ocjenjivanje naučenih primjera (engl. Instances) koji se oslanjaju na dubinu lista d u stablu koji je potreban da se primjeri točno klasificiraju u klase kojima pripadaju. Kako bi naučili stabla koristi se već postojeći algoritam C4.5 na svakom slučajnom podskupu atributa.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo, Informacijske i komunikacijske znanosti
POVEZANOST RADA
Ustanove:
Fakultet informatike i digitalnih tehnologija, Rijeka
Profili:
Sanda Martinčić - Ipšić
(mentor)