Pregled bibliografske jedinice broj: 1229790
Izazovi morfosintaktičkog označavanja na primjerima španjolskog i hrvatskog jezika
Izazovi morfosintaktičkog označavanja na primjerima španjolskog i hrvatskog jezika, 2021., diplomski rad, preddiplomski, Filozofski fakultet, ZAGREB
CROSBI ID: 1229790 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Izazovi morfosintaktičkog označavanja na
primjerima španjolskog i hrvatskog jezika
(Challenges in POS/MSD tagging with Spanish and
Croatianexamples)
Autori
Kozolić, Klara
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Filozofski fakultet
Mjesto
ZAGREB
Datum
23.06
Godina
2021
Stranica
54
Mentor
Mikelić Preradović, Nives
Neposredni voditelj
Nives Mikelic Preradovic
Ključne riječi
morfosintaktičko označavanje, španjolski, hrvatski, POS oznake, MSD oznake, POS označivači
(morphosyntactic tagging, Spanish, Croatian, POS tags, MSD tags, POS taggers)
Sažetak
Posljednjih se desetljeća sve brže razvijaju jezične tehnologije kao težnja da se jezik kao sredstvo ljudske komunikacije kodira. One ubrzavaju usvajanje jezika, ali i olakšavaju lingvistička, psihološka i ostala istraživanja. Vrlo važnu ulogu za razvoj kvalitetnih i točnih jezičnih tehnologija imaju korpusi koji se označavaju na različitim razinama, a jedna od njih je dodavanje POS ili MSD oznake riječi s obzirom na stupanj flektivnosti jezika. U ovom radu će se opisati POS i MSD označavanje i navesti poteškoće koji se općenito javljaju pri tom procesu. Kako bi primjeri bili konkretni odabran je španjolski jezik kao manje flektivni jezik i hrvatski jezik kao visoko flektivni jezik. Španjolski će biti testiran na primjerima Stanfordskog POS označivača i TreeTagger označivača putem sučelja programskog jezika Python. Isprobat će se rečenice na španjolskom iz raznih registara i s mogućim poteškoćama za označivače. Isti proces bit će ponovljen na web sučelju ReLDIanno označivača za hrvatski jezik. Usporedit će se dobiveni rezultati između španjolskih označivača i razlike u problemima kod označavanja manje flektivnih i visoko flektivnih jezika na primjerima španjolskog i hrvatskog.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti
POVEZANOST RADA
Ustanove:
Filozofski fakultet, Zagreb