Automatsko izlučivanje ključnih riječi iz tekstova na hrvatskome jeziku metodama strojnog učenja (CROSBI ID 360094)
Ocjenski rad | magistarski rad (mr. sc. i mr. art.)
Podaci o odgovornosti
Renee Ahel
Dalbelo Bašić, Bojana
hrvatski
Automatsko izlučivanje ključnih riječi iz tekstova na hrvatskome jeziku metodama strojnog učenja
Ključne riječi omogućuju sažimanje sadržaja dokumenta, kao i pretraživanje dokumenata preko više kategorija. Ovaj rad opisuje robustan sustav za au- tomatsko izlučivanje ključnih riječi iz novinskih članaka na hrvatskome jeziku. Kandidati za ključne riječi se oblikuju na temelju lingvističkih i statističkih značajki. Za odabir najboljih kandidata koristi se naivni Bayesov klasifikator. Na temelju dokumenata iz skupa za učenje, koji imaju unaprijed dodijeljene ključne riječi od strane dokumentalista, stvara se predikcijski model. Učinkovitost sustava se mjeri usporedbom izlučenih ključnih riječi s dodijeljenima od strane profesionalnih dokumentalista na nekoliko zbirki dokumenata različite kakvoće. U nedostatku usporedivih rezultata, zaključak je da sustav pokazuje dobru učinkovitost.
izlučivanje ključnih riječi; naivni Bayesov klasifikator; hrvatski jezik
nije evidentirano
engleski
Automatic keyphrase extraction from Croatian text using machine learning methods
nije evidentirano
keyphrase extraction; keyword extraction; naive Bayes classifier; Croatian language
nije evidentirano
Podaci o izdanju
113
08.06.2010.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb