Pregled bibliografske jedinice broj: 1046630
Usporedba algoritama grupiranja primjenom programske knjižnice Scikit-Learn
Usporedba algoritama grupiranja primjenom programske knjižnice Scikit-Learn, 2019., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 1046630 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Usporedba algoritama grupiranja primjenom programske knjižnice Scikit-Learn
(Comparison of clustering algorithms using the Scikit-Learn library)
Autori
Aćimović, Dunja
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
12.07
Godina
2019
Stranica
17
Mentor
Delač, Goran
Ključne riječi
grupiranje, algoritam k-srednjih vrijednosti, DBSCAN, hijerarhijsko grupiranje, aglomerativno grupiranje, Dunnov indeks, Davies-Bouldin indeks, Silho- uette koeficijent, Scikit-Learn, model miješane gustoće, GMM, Ward, kriterij poveza- nosti, mini batch
(clustering, k-means algorithm, DBSCAN, hierarchical clustering, agglo- merative clustering, Dunn index, Davies-Bouldin index, Silhouette score, Scikit-Learn, Gaussian mixture model, GMM, Ward, linkage criteria)
Sažetak
Algoritme grupiranja se mogu usporediti na više načina, neki od njih su: iscrtavanje podataka, mjerenje trajanja grupiranja, izračun indeksa unutarnjeg i vanjskog vredno- vanja. Rezultati ove usporedbe pokazuju da je algoritam k-srednjih vrijednosti brz i jednostavan, ali sklon greškama, te da najbolje grupira konveksne skupove u obliku kruga. Hijerarhijsko aglomerativno grupiranje je puno preciznije, ali potrebno mu je više vremena, te ga ne možemo koristiti za grupiranje velike količine podataka. DB- SCAN je brz i precizan i velika mu je prednost što ne zahtjeva unaprijed zadan broj grupa, ali nije jednako učinkovit za raspršene skupove podataka. Model miješane gus- toće (GMM) je brz i učinkovit sa svim konveksnim skupovima podataka, čak i kad nisu u kružnom obliku, ali ne grupira dobro nekonveksne skupove podataka, jer im ne može prilagoditi Gaussovu krivulju.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb
Profili:
Goran Delač
(mentor)