Označavanje vrste riječi u tekstovima na hrvatskome jeziku (CROSBI ID 365297)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Osmann, Vjekoslav
Dalbelo Bašić, Bojana
Šnajder, Jan
hrvatski
Označavanje vrste riječi u tekstovima na hrvatskome jeziku
Označavanje vrsta riječi važna je predradnja u brojnim područjima istraživanja obrade prirodnog jezika. Počevši od obrade rečenica na sintaktičkoj razini, preko trenutno vrlo aktualnih radova u analizi stavova i mišljenja autora tekstova, do strojnog prevođenja, informacija o vrsti svake od riječi u tekstu vrlo je korisna. U okviru ovog diplomskog rada dan je pregled dosadašnjih radova u označavanju vrsta riječi s osvrtom na rezultate različitih pristupa programskom ostvarenju automatiziranog označivača za brojne svjetske jezike, kao i uvod u vezanu lingvističku problematiku. Programski je ostvaren automatizirani označivač zasnovan na skrivenim Markovljevim modelima te su komentirani postignuti rezultati na hrvatskom jeziku - 92, 33% na ograničenom dostupnom korpusu označenom u okviru rada. Ključne riječi:
označavanje vrste riječi; hrvatski jezik; skriven Markovljev model; nadzirano strojno ucenje; obrada prirodnog jezika; računalna lingvistika
nije evidentirano
engleski
Tagging parts of speech Croatian texts
nije evidentirano
part of speech tagging; croatian language; hidden Markov model; supervised machine learning; natural language processing; computational linguistics
nije evidentirano
Podaci o izdanju
68
30.03.2011.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb