Pregled bibliografske jedinice broj: 727534
Oblikovanje korjenovatelja za hrvatski jezik u svrhu pretraživanja informacija
Oblikovanje korjenovatelja za hrvatski jezik u svrhu pretraživanja informacija, 2012., diplomski rad, diplomski, Filozofski fakultet, Zagreb
CROSBI ID: 727534 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Oblikovanje korjenovatelja za hrvatski jezik u svrhu pretraživanja informacija
(Development of the Croatian stemmer for usage in information retrieval)
Autori
Pandžić, Ivan
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Filozofski fakultet
Mjesto
Zagreb
Datum
10.07
Godina
2012
Stranica
49
Mentor
Tadić, Marko
Neposredni voditelj
Ljubešić, Nikol
Ključne riječi
korjenovanje temeljeno na pravilima; računalna lingvistika; obrada prirodnoga jezika; F1-mjera; hrvatski jezik
(rule-based stemming; computational linguistics; natural language processing; F1-measure; Croatian language)
Sažetak
U radu je opisan razvoj tri inačice korjenovatelja (k1, k2, k3) za hrvatski jezik. Korjenovatelji se k2 i k3 od sličnih korjenovatelja temeljenih na pravilima razlikuju po tome što koriste tvorbene nastavke imenica, pridjeva i glagola kako bi odredili moguće pseudokorijene pojavnica, a i po korištenju transformacija koje rješavaju neke probleme uzrokovane glasovnim promjenama. Pretpostavku da će korjenovatelj koji sadrži proširena pravila postići bolje rezultate od drugih sličnih korjenovatelja za hrvatski jezik provjerili smo usporedbom preciznosti, odziva i F1-mjere s istim vrijednostima agresivnoga korjenovateljem (k1).
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti, Filologija
POVEZANOST RADA
Projekti:
130-1300646-0645 - Hrvatski jezični resursi i njihovo obilježavanje (Tadić, Marko, MZOS ) ( CroRIS)
130-1301679-1380 - Hrvatska rječnička baština i hrvatski europski identitet (Boras, Damir, MZOS ) ( CroRIS)
Ustanove:
Filozofski fakultet, Zagreb
Profili:
Marko Tadić
(mentor)