Pregled bibliografske jedinice broj: 428135
Metoda maksimalne entropije i njena primjena za označavanje slijednog niza tekstnih podataka
Metoda maksimalne entropije i njena primjena za označavanje slijednog niza tekstnih podataka, 2009., diplomski rad, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 428135 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Metoda maksimalne entropije i njena primjena za označavanje slijednog niza tekstnih podataka
(Maximum Entropy Method and its Application on Text Tagging)
Autori
Ćurković, Grga
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
23.09
Godina
2009
Stranica
49
Mentor
Dalbelo Bašić, Bojana
Neposredni voditelj
Mijić, Jure
Ključne riječi
prepoznavanje i klasifikacija naziva; maksimalna entropija; strojno učenje; obrada prirodnog jezika; crpljenje obavijesti; hrvatski jezik
(named entity recognition and classification; maximum entropy; machine learning; natural language processing; information extraction; Croatian language)
Sažetak
Rad opisuje teorijsku podlogu prepoznavanja i klasifikacije naziva, daje pregled metoda za strojno prepoznavanje s naglaskom na metode strojnog učenja. Opisuje se odabrana programska implementacija sustava za prepoznavanje i klasifikaciju naziva te binarne, morfološke, leksičke i rječničke značajke korištene za izgradnju modela maksimalne entropije. Opisan je automatski postupak za odabir optimalnih značajki. Napravljena je analiza širine kontekstnog prozora, broja korištenih značajki, veličine korpusa za treniranje te broja iteracija u ovisnosti o uspješnosti označavanja. Na temelju provedenih analiza odabrani su parametri modela koji pokazuje obećavajuće rezultate.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb
Profili:
Bojana Dalbelo Bašić
(mentor)