Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 380069

Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka


Rukavina, Marijana
Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka, 2008., diplomski rad, PMF-matematički odjel, Zagreb


CROSBI ID: 380069 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka
(Application of the k-means algorithm in clustering of a collection of textual data)

Autori
Rukavina, Marijana

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad

Fakultet
PMF-matematički odjel

Mjesto
Zagreb

Datum
22.12

Godina
2008

Stranica
56

Mentor
Grubišić, Luka

Ključne riječi
algoritam k-sredina; dubinska analiza teksta; klasteriranje podataka
(k-means algorithm; data-mining; data clustering)

Sažetak
Klasteriranje podataka je zanimljivo i primjenjljivo područje, ali još uvijek nov i neprestano razvijajući pristup u analizi podataka. Najrazličitija znanstvena područja imaju veliku korist od ove discipline. Danas postoje brojni komercijalni i nekomercijalni alati koji imaju svoju primjenu u klasteriranju podataka. Primjerice, Weka, jedan od besplatnih alata, razvijen na sveučilištu Waikato, pruža mogućnost direktnog klasteriranja podataka ili indirektno, pozivanjem Weke iz aplikacije pisane u Javi. Zatim, komercijalni alat, MatLab-ov COMPACT (Comparative Package for Clustering Assessment) GUI za klasteriranje podataka. Cilj ovog diplomskog rada je bio upoznati i povezati različite tehnologije, opisati metodologiju klasteriranja i dati ilustrativan primjer primjene opisanog. Aplikacija, priložena ovom radu, ne vrši klasteriranje na nivou prethodno spomenutih alata, ali daje dobru ilustraciju svega što se događa u tom procesu klasteriranja. Prednost joj je u povezivanju različitih tehnologija, što je omogućilo primjenjljivost na bilo koju bazu podataka i sintezu različtih elemenata koji mogu doprinjeti klasteriranju podataka. Uz rad prilažem CD na kojem se nalazi kod aplikacije i sve ostale potrebne datoteke. Otvorena je mogućnost daljnje modifikacije aplikacije. Eventualne promjene mogle bi se odvijati u sljedećim smjerovima: upotreba SVD metode kod generiranja matrice \emph{;rijeći}; $\times$ \emph{;dokumenti};, umjesto $0-1$ elemenata korištenje TFIDF funkcije za vrijednosti matrice, korištenje drugih algoritama ili čak povezivanje MatLab-ovog COMPACT-a s aplikacijom, ubotreba složenijeg označavanja klastera i drugo.

Izvorni jezik
Hrvatski

Znanstvena područja
Matematika



POVEZANOST RADA


Projekti:
037-0372783-2750 - Spektralne dekompozicije - numericke metode i primjene (Drmač, Zlatko, MZOS ) ( CroRIS)

Ustanove:
Prirodoslovno-matematički fakultet, Matematički odjel, Zagreb

Profili:

Avatar Url Luka Grubišić (mentor)


Citiraj ovu publikaciju:

Rukavina, Marijana
Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka, 2008., diplomski rad, PMF-matematički odjel, Zagreb
Rukavina, M. (2008) 'Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka', diplomski rad, PMF-matematički odjel, Zagreb.
@phdthesis{phdthesis, author = {Rukavina, Marijana}, year = {2008}, pages = {56}, keywords = {algoritam k-sredina, dubinska analiza teksta, klasteriranje podataka}, title = {Primjena algoritama k-sredina u dubinskoj analizi kolekcije tekstualnih podataka}, keyword = {algoritam k-sredina, dubinska analiza teksta, klasteriranje podataka}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Rukavina, Marijana}, year = {2008}, pages = {56}, keywords = {k-means algorithm, data-mining, data clustering}, title = {Application of the k-means algorithm in clustering of a collection of textual data}, keyword = {k-means algorithm, data-mining, data clustering}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font