Pregled bibliografske jedinice broj: 891152
Usporedba metoda za klasifikaciju tekstualnih dokumenata
Usporedba metoda za klasifikaciju tekstualnih dokumenata, 2017., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 891152 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Usporedba metoda za klasifikaciju tekstualnih dokumenata
(Comparison of Text Classification Methods)
Autori
Bošnjak, Renato
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
04.07
Godina
2017
Stranica
25
Mentor
Pripužić, Krešimir
Ključne riječi
klasifikacija teksta ; klasifikator najbližih susjeda ; naivni Bayesov klasifikator ; Apache Lucene
(text classification ; k-nearest neighbors classification ; naive Bayes classifier ; Apache Lucene)
Sažetak
Zbog postojanja vrlo velike količine tekstualnih dokumenata potrebno ih je, radi brže, jeftinije i lakše obrade, organizirati, odnosno podijeliti prema zajedničkim svojstvima na zadane klase. Takav postupak nazivamo klasifikacija koja je, osim na tekstualne dokumente, primjenjiva i na druge vrste podataka. S obzirom na svojstva podataka koje organiziramo, potrebno je odabrati onu metodu klasifikacije koja će najbolje odrediti pripadnost klasi. Odluka se temelji na teorijskim saznanjima o pojedinim metodama i usporedbi dobivenih rezultata. Moguće je da iste metode, primijenjene na različite skupove podataka, rezultiraju vrlo različitom točnosti određivanja klasa. U radu su opisana dva klasifikatora koji pripadaju različitim vrstama strojnog učenja. To su klasifikator najbližih susjeda i naivni Bayesov klasifikator. Za primjenu klasifikacije moguće je koristiti Apache Lucene, programsku knjižnicu otvorenog koda.
Izvorni jezik
Hrvatski
Znanstvena područja
Elektrotehnika, Računarstvo
POVEZANOST RADA
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb
Profili:
Krešimir Pripužić
(mentor)