Pregled bibliografske jedinice broj: 380069
Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka
Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka, 2008., diplomski rad, PMF-matematički odjel, Zagreb
CROSBI ID: 380069 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka
(Application of the k-means algorithm in clustering of a collection of textual data)
Autori
Rukavina, Marijana
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad
Fakultet
PMF-matematički odjel
Mjesto
Zagreb
Datum
22.12
Godina
2008
Stranica
56
Mentor
Grubišić, Luka
Ključne riječi
algoritam k-sredina; dubinska analiza teksta; klasteriranje podataka
(k-means algorithm; data-mining; data clustering)
Sažetak
Klasteriranje podataka je zanimljivo i primjenjljivo područje, ali još uvijek nov i neprestano razvijajući pristup u analizi podataka. Najrazličitija znanstvena područja imaju veliku korist od ove discipline. Danas postoje brojni komercijalni i nekomercijalni alati koji imaju svoju primjenu u klasteriranju podataka. Primjerice, Weka, jedan od besplatnih alata, razvijen na sveučilištu Waikato, pruža mogućnost direktnog klasteriranja podataka ili indirektno, pozivanjem Weke iz aplikacije pisane u Javi. Zatim, komercijalni alat, MatLab-ov COMPACT (Comparative Package for Clustering Assessment) GUI za klasteriranje podataka. Cilj ovog diplomskog rada je bio upoznati i povezati različite tehnologije, opisati metodologiju klasteriranja i dati ilustrativan primjer primjene opisanog. Aplikacija, priložena ovom radu, ne vrši klasteriranje na nivou prethodno spomenutih alata, ali daje dobru ilustraciju svega što se događa u tom procesu klasteriranja. Prednost joj je u povezivanju različitih tehnologija, što je omogućilo primjenjljivost na bilo koju bazu podataka i sintezu različtih elemenata koji mogu doprinjeti klasteriranju podataka. Uz rad prilažem CD na kojem se nalazi kod aplikacije i sve ostale potrebne datoteke. Otvorena je mogućnost daljnje modifikacije aplikacije. Eventualne promjene mogle bi se odvijati u sljedećim smjerovima: upotreba SVD metode kod generiranja matrice \emph{;rijeći}; $\times$ \emph{;dokumenti};, umjesto $0-1$ elemenata korištenje TFIDF funkcije za vrijednosti matrice, korištenje drugih algoritama ili čak povezivanje MatLab-ovog COMPACT-a s aplikacijom, ubotreba složenijeg označavanja klastera i drugo.
Izvorni jezik
Hrvatski
Znanstvena područja
Matematika
POVEZANOST RADA
Projekti:
037-0372783-2750 - Spektralne dekompozicije - numericke metode i primjene (Drmač, Zlatko, MZOS ) ( CroRIS)
Ustanove:
Prirodoslovno-matematički fakultet, Matematički odjel, Zagreb
Profili:
Luka Grubišić
(mentor)