Oblikovanje korjenovatelja za hrvatski jezik u svrhu pretraživanja informacija (CROSBI ID 392128)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Pandžić, Ivan
Tadić, Marko
Ljubešić, Nikol
hrvatski
Oblikovanje korjenovatelja za hrvatski jezik u svrhu pretraživanja informacija
U radu je opisan razvoj tri inačice korjenovatelja (k1, k2, k3) za hrvatski jezik. Korjenovatelji se k2 i k3 od sličnih korjenovatelja temeljenih na pravilima razlikuju po tome što koriste tvorbene nastavke imenica, pridjeva i glagola kako bi odredili moguće pseudokorijene pojavnica, a i po korištenju transformacija koje rješavaju neke probleme uzrokovane glasovnim promjenama. Pretpostavku da će korjenovatelj koji sadrži proširena pravila postići bolje rezultate od drugih sličnih korjenovatelja za hrvatski jezik provjerili smo usporedbom preciznosti, odziva i F1-mjere s istim vrijednostima agresivnoga korjenovateljem (k1).
korjenovanje temeljeno na pravilima; računalna lingvistika; obrada prirodnoga jezika; F1-mjera; hrvatski jezik
nije evidentirano
engleski
Development of the Croatian stemmer for usage in information retrieval
nije evidentirano
rule-based stemming; computational linguistics; natural language processing; F1-measure; Croatian language
nije evidentirano
Podaci o izdanju
49
10.07.2012.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Filozofski fakultet u Zagrebu
Zagreb