Usporedba metoda grupiranja primjenom programskog jezika Python (CROSBI ID 448960)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Bjelčić, Tomislav
Delač, Goran
hrvatski
Usporedba metoda grupiranja primjenom programskog jezika Python
Grupiranje je postupak particioniranja skupa neoznačenih podatka na podskupove sa međusobno sličnim podacima. Ovaj rad opisuje osnovne pojmove problema grupiranja i uspoređuje četiri različita algoritama grupiranja na jednostavnim skupovima podataka. Algoritam K-srednjih vrijednosti je najpoznatiji, najučinkovitiji algoritam grupiranja koji se zasniva na modelu centroida. Zahtjeva poznavanje broja grupa i može grupirati konveksne oblike grupa. Hijerarhijsko aglomerativno grupiranje zasniva se na kriteriju spajanja, gradi hijerarhiju grupa spajanjem i nije učinkovit kao K-sredina ali je primjenjiv na svim vrstama podataka. DBSCAN se zasniva na modelu gustoće točaka koje prepoznaje i grupira gusto raspoređene podatke. DBSCAN je brz, poznaje koncept šuma i može grupirati proizvoljne oblike. EM algoritam Gaussovih mješavina nastoji procijeniti parametre modela Gaussovih mješavina koji podatke promatra kao realizacije više Gaussovih razdioba. EM algoritam je brz i može grupirati konveksne grupe raznih oblika. Opisani algoritmi su pokrenuti, vrednovani i uspoređeni na 6 različita, relativno jednostavna skupa dvodimenzijskih podataka sa realnim značajkama.
Grupiranje ; nenadzirano strojno učenje ; mjera udaljenosti
nije evidentirano
engleski
Comparison of Clustering Methods Using Python Programming Language
nije evidentirano
Clustering ; unsupervised machine learning ; distance measure ; similarity measure
nije evidentirano
Podaci o izdanju
58
06.07.2021.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb