Sintaktički analizator hrvatskoga jezika temeljen na nenadziranom strojnom učenju (CROSBI ID 365303)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Saratlija, Josip
Šnajder, Jan
hrvatski
Sintaktički analizator hrvatskoga jezika temeljen na nenadziranom strojnom učenju
Sintaktička analiza ili parsanje jest postupak analize rečenica prirodnog jezika sa svrhom određivanja njihove strukture u odnosu na određeni skup pravila odnosno formalnu gramatiku. Strojna sintaktička analiza rečenice preduvjet je za više razine strojne obrade teksta, poput semantičke analize ili ekstrakcije informacija. U okviru diplomskog rada proučeni su pristupi parsanju temeljeni na nenadziranom strojnom učenju. Implementiran je model nazvan parsanje temeljeno na podacima (engl. Data-Oriented Parsing - DOP) koji rečenice parsa pridjeljujući im sastavna stabla (engl. constituency tree). Model je naučen te evaluiran na hrvatskom jeziku. U svrhu evaluacije načinjena je manja banka stabala od sto parsanih rečenica. Model na tom skupu postiže neoznačenu F1 mjeru nešto manju od 50%.
sintaktička analiza; parsanje; nenadzirano učenje; hrvatski jezik
nije evidentirano
engleski
Unsupervised Parser for Croatian Language
nije evidentirano
syntactic analysis; parsing; unsupervised learning; Croatian language
nije evidentirano
Podaci o izdanju
50
28.06.2011.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb