Pregled bibliografske jedinice broj: 476484
Automatsko izlučivanje ključnih riječi iz tekstova na hrvatskome jeziku metodama strojnog učenja
Automatsko izlučivanje ključnih riječi iz tekstova na hrvatskome jeziku metodama strojnog učenja, 2010., magistarski rad, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 476484 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Automatsko izlučivanje ključnih riječi iz tekstova na hrvatskome jeziku metodama strojnog učenja
(Automatic keyphrase extraction from Croatian text using machine learning methods)
Autori
Renee Ahel
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, magistarski rad
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
08.06
Godina
2010
Stranica
113
Mentor
Dalbelo Bašić, Bojana
Ključne riječi
izlučivanje ključnih riječi; naivni Bayesov klasifikator; hrvatski jezik
(keyphrase extraction; keyword extraction; naive Bayes classifier; Croatian language)
Sažetak
Ključne riječi omogućuju sažimanje sadržaja dokumenta, kao i pretraživanje dokumenata preko više kategorija. Ovaj rad opisuje robustan sustav za au- tomatsko izlučivanje ključnih riječi iz novinskih članaka na hrvatskome jeziku. Kandidati za ključne riječi se oblikuju na temelju lingvističkih i statističkih značajki. Za odabir najboljih kandidata koristi se naivni Bayesov klasifikator. Na temelju dokumenata iz skupa za učenje, koji imaju unaprijed dodijeljene ključne riječi od strane dokumentalista, stvara se predikcijski model. Učinkovitost sustava se mjeri usporedbom izlučenih ključnih riječi s dodijeljenima od strane profesionalnih dokumentalista na nekoliko zbirki dokumenata različite kakvoće. U nedostatku usporedivih rezultata, zaključak je da sustav pokazuje dobru učinkovitost.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb
Profili:
Bojana Dalbelo Bašić
(mentor)