Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka

Rukavina, Marijana

Pregled bibliografske jedinice broj: 380069

Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka

Rukavina, Marijana

Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka, 2008., diplomski rad, PMF-matematički odjel, Zagreb

CROSBI ID: 380069 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka
(Application of the k-means algorithm in clustering of a collection of textual data)

Autori
Rukavina, Marijana

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad

Fakultet
PMF-matematički odjel

Mjesto
Zagreb

Datum
22.12

Godina
2008

Stranica
56

Mentor
Grubišić, Luka

Ključne riječi
algoritam k-sredina; dubinska analiza teksta; klasteriranje podataka
(k-means algorithm; data-mining; data clustering)

Sažetak
Klasteriranje podataka je zanimljivo i primjenjljivo područje, ali još uvijek nov i neprestano razvijajući pristup u analizi podataka. Najrazličitija znanstvena područja imaju veliku korist od ove discipline. Danas postoje brojni komercijalni i nekomercijalni alati koji imaju svoju primjenu u klasteriranju podataka. Primjerice, Weka, jedan od besplatnih alata, razvijen na sveučilištu Waikato, pruža mogućnost direktnog klasteriranja podataka ili indirektno, pozivanjem Weke iz aplikacije pisane u Javi. Zatim, komercijalni alat, MatLab-ov COMPACT (Comparative Package for Clustering Assessment) GUI za klasteriranje podataka. Cilj ovog diplomskog rada je bio upoznati i povezati različite tehnologije, opisati metodologiju klasteriranja i dati ilustrativan primjer primjene opisanog. Aplikacija, priložena ovom radu, ne vrši klasteriranje na nivou prethodno spomenutih alata, ali daje dobru ilustraciju svega što se događa u tom procesu klasteriranja. Prednost joj je u povezivanju različitih tehnologija, što je omogućilo primjenjljivost na bilo koju bazu podataka i sintezu različtih elemenata koji mogu doprinjeti klasteriranju podataka. Uz rad prilažem CD na kojem se nalazi kod aplikacije i sve ostale potrebne datoteke. Otvorena je mogućnost daljnje modifikacije aplikacije. Eventualne promjene mogle bi se odvijati u sljedećim smjerovima: upotreba SVD metode kod generiranja matrice \emph{;rijeći}; $\times$ \emph{;dokumenti};, umjesto $0-1$ elemenata korištenje TFIDF funkcije za vrijednosti matrice, korištenje drugih algoritama ili čak povezivanje MatLab-ovog COMPACT-a s aplikacijom, ubotreba složenijeg označavanja klastera i drugo.

Izvorni jezik
Hrvatski

Znanstvena područja
Matematika

POVEZANOST RADA

Projekti:
037-0372783-2750 - Spektralne dekompozicije - numericke metode i primjene (Drmač, Zlatko, MZOS ) ( CroRIS)

Ustanove:
Prirodoslovno-matematički fakultet, Matematički odjel, Zagreb

Profili:

Luka Grubišić (mentor)

CROSBI Hrvatska znanstvena bibliografija

Pregled bibliografske jedinice broj: 380069

Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka

Citiraj ovu publikaciju:

Pregled bibliografske jedinice broj: 380069

Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka

Citiraj ovu publikaciju:

Podijeli: