Analiza utjecaja obrade podataka na uspješnost klasifikacijskih algoritama strojnog učenja (CROSBI ID 458409)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Stević, David
Dumić, Emil
hrvatski
Analiza utjecaja obrade podataka na uspješnost klasifikacijskih algoritama strojnog učenja
U ovom radu analizirana je uspješnost nekoliko klasifikacijskih algoritama strojnog učenja u ovisnosti o predobradi ulaznih podataka. U praktičnom dijelu rada ispitana je uspješnost klasifikacijskih algoritama nadziranog strojnog učenja, a to su logistička regresija, k-najbližih susjeda, algoritam stabla odluke, neuronske mreže i stroj potpornih vektora, u ovisnosti o standardizaciji, smanjenju ili povećanju broja uzoraka za balansiranje klasa, smanjenju broja značajki, eliminaciji kolinearnih značajki, različitim načinima kodiranja oznaka klasa. Ispitivanje se provodi nad nekim skupovima realnih podataka, posebno na skupu podataka za učenje i skupu podataka za ispitivanje, preuzetih s javno dostupnih stranica poput www.kaggle.com. Uspješnost klasifikacijskih algoritama uspoređuje se nad skupom podataka za ispitivanje pomoću različitih mjera poput točnosti, F1 mjere, preciznosti i odziva, izračunatih iz matrice zabune.
strojno učenje ; logistička regresija ; K najbližih susjeda ; stablo odluke ; stroj potpornih vektora ; neuronske mreže
nije evidentirano
engleski
Effects of data processing on the performance of machine learning classification models
nije evidentirano
machine learning ; logistic regression ; K nearest neighbors ; decision tree ; support vector machine ; neural networks
nije evidentirano
Podaci o izdanju
55
28.09.2021.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Varaždin