Pregled bibliografske jedinice broj: 1018528
Analiza distribucije glagolskih vrsta u općem korpusu hrvatskoga jezika
Analiza distribucije glagolskih vrsta u općem korpusu hrvatskoga jezika, 2019., diplomski rad, preddiplomski, Filozofski fakultet, Zagreb
CROSBI ID: 1018528 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Analiza distribucije glagolskih vrsta u općem korpusu hrvatskoga jezika
(Verb class distribution analysis in a general corpus of Croatian language)
Autori
Blazsetin, Danijel
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Filozofski fakultet
Mjesto
Zagreb
Datum
05.09
Godina
2019
Stranica
40
Mentor
Bago, Petra
Ključne riječi
korpusna lingvistika, obrada prirodnog jezika, klasifikacija glagola, hrvatske gramatike, hrvatski jezik
(corpus linguistics, natural language processing, verb classification, grammar textbooks, Croatian language)
Sažetak
Hrvatske gramatike i preskriptivni priručnici klasificiraju glagole u glagolske vrste prema njihovim morfosintaktičkim karakteristikama. Frekvencijski se podaci o glagolskim vrstama u hrvatskim priručnicima temelje na malom broju glagola. Zaključci poput brojnosti ili produktivnosti nekog razreda doneseni su bez uvida u veliki korpus. Dosadašnje su podjele crpile glagole iz korpusa koji su sastavljeni od književnih djela i kao takvi predstavljaju umjetni oblik hrvatskoga jezika, a gramatike opisuju standardnu inačicu hrvatskoga jezika. U ovom se radu analiziraju glagoli iz korpusa hrWaC koji sadrži 1, 4 milijardi pojavnica i oko 90 000 glagola. Analizom glagola iz korpusa hrWaC opisivat će se manje formalni i nestandardni idiom hrvatskoga jezika, odnosno jezik svakodnevice. Oslanjajući se na korpus, rad problematizira glagolsku klasifikaciju u vrste i reevaluira postojeće podatke o glagolskim vrstama u hrvatskim gramatikama. Rad ukratko opisuje glagole i njihove morfološke karakteristike te postojeće klasifikacije. Izlučivanjem glagola iz hrvatskoga mrežnog korpusa hrWaC i njihovim obrađivanjem, odnosno klasifikacijom, rad pruža novi uvid u frekvencijsku distribuciju glagolskih vrsta. Rad ističe probleme i poteškoće koje su se javile pri izradi ovoga modela i preispituje dosadašnje glagolske klasifikacije.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti