Usporedba metoda za klasifikaciju tekstualnih dokumenata (CROSBI ID 412204)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Bošnjak, Renato
Pripužić, Krešimir
hrvatski
Usporedba metoda za klasifikaciju tekstualnih dokumenata
Zbog postojanja vrlo velike količine tekstualnih dokumenata potrebno ih je, radi brže, jeftinije i lakše obrade, organizirati, odnosno podijeliti prema zajedničkim svojstvima na zadane klase. Takav postupak nazivamo klasifikacija koja je, osim na tekstualne dokumente, primjenjiva i na druge vrste podataka. S obzirom na svojstva podataka koje organiziramo, potrebno je odabrati onu metodu klasifikacije koja će najbolje odrediti pripadnost klasi. Odluka se temelji na teorijskim saznanjima o pojedinim metodama i usporedbi dobivenih rezultata. Moguće je da iste metode, primijenjene na različite skupove podataka, rezultiraju vrlo različitom točnosti određivanja klasa. U radu su opisana dva klasifikatora koji pripadaju različitim vrstama strojnog učenja. To su klasifikator najbližih susjeda i naivni Bayesov klasifikator. Za primjenu klasifikacije moguće je koristiti Apache Lucene, programsku knjižnicu otvorenog koda.
klasifikacija teksta ; klasifikator najbližih susjeda ; naivni Bayesov klasifikator ; Apache Lucene
nije evidentirano
engleski
Comparison of Text Classification Methods
nije evidentirano
text classification ; k-nearest neighbors classification ; naive Bayes classifier ; Apache Lucene
nije evidentirano
Podaci o izdanju
25
04.07.2017.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb