Pregled bibliografske jedinice broj: 521145
Sintaktički analizator hrvatskoga jezika temeljen na nenadziranom strojnom učenju
Sintaktički analizator hrvatskoga jezika temeljen na nenadziranom strojnom učenju, 2011., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 521145 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Sintaktički analizator hrvatskoga jezika temeljen na nenadziranom strojnom učenju
(Unsupervised Parser for Croatian Language)
Autori
Saratlija, Josip
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
28.06
Godina
2011
Stranica
50
Mentor
Šnajder, Jan
Ključne riječi
sintaktička analiza; parsanje; nenadzirano učenje; hrvatski jezik
(syntactic analysis; parsing; unsupervised learning; Croatian language)
Sažetak
Sintaktička analiza ili parsanje jest postupak analize rečenica prirodnog jezika sa svrhom određivanja njihove strukture u odnosu na određeni skup pravila odnosno formalnu gramatiku. Strojna sintaktička analiza rečenice preduvjet je za više razine strojne obrade teksta, poput semantičke analize ili ekstrakcije informacija. U okviru diplomskog rada proučeni su pristupi parsanju temeljeni na nenadziranom strojnom učenju. Implementiran je model nazvan parsanje temeljeno na podacima (engl. Data-Oriented Parsing - DOP) koji rečenice parsa pridjeljujući im sastavna stabla (engl. constituency tree). Model je naučen te evaluiran na hrvatskom jeziku. U svrhu evaluacije načinjena je manja banka stabala od sto parsanih rečenica. Model na tom skupu postiže neoznačenu F1 mjeru nešto manju od 50%.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb
Profili:
Jan Šnajder
(mentor)