Pregled bibliografske jedinice broj: 330055
Pristupi izradi strojnog tezaurusa za hrvatski jezik
Pristupi izradi strojnog tezaurusa za hrvatski jezik, 2008., doktorska disertacija, Filozofski fakultet, Zagreb, Hrvatska
CROSBI ID: 330055 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Pristupi izradi strojnog tezaurusa za hrvatski jezik
(Approaches to the Development of the Machine Lexicon for Croatian Language)
Autori
Mikelić Preradović, Nives
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija
Fakultet
Filozofski fakultet
Mjesto
Zagreb, Hrvatska
Datum
01.04
Godina
2008
Stranica
470
Mentor
Boras, Damir
Ključne riječi
valencijski leksikon; naglasno-sklonidbeni modela imenica i pridjeva; naglasno-konjugacijski model glagola; naglasno morfološki analizator i generator; dubinski padeži; sustav za pretvorbu teksta u govor; sintaktičko-semantičke klase; valencijski okvir
(valence lexicon; accentual conjugational paradigm of verbs; accentual declensional paradigm of nouns; accentual declensional paradigm of adjectives;)
Sažetak
Ova disertacija bavi se dvama problemima, od kojih prvi predstavlja moguće početke razvoja sustava pretvorbe teksta u govor za hrvatski jezik kroz izradu naglasno-izgovornog leksikona glagola, imenica i pridjeva. Na temelju naglasno- sklonidbenih modela imenica i pridjeva te naglasno-konjugacijskih modela glagola definiranih u ovom radu, razvijen je alat koji automatski generira naglasne oblike riječi u svim padežima, odnosno licima, uzimajući njihov osnovni oblik iz leksičke baze i pridružujući im valjane paradigmatske nastavke i naglaske. Ako se ovaj alat bude implementirao kao dio naglasnog izgovornog leksikona u hrvatskom sustavu pretvorbe teksta u govor, izgovor leksema će se moći generirati automatski za riječi koje se nalaze u leksičkoj bazi, uz pomoć pravila pretvorbe grafema u foneme. Drugi problem kojim se bavi ovaj rad je izrada valencijskog leksikona hrvatskih glagola – CROVALLEX-a. Verzija 2.008 sadrži 1739 glagola s 5118 valencijskih okvira (što je u prosjeku 3 valencijska okvira po glagolu) te 173 sintaktičko- semantičke klase. Pri njegovom stvaranju vodilo se računa o čitljivosti i dostupnosti, lakoj orijentaciji i razumljivosti. Osnovni ciljevi izrade ovog leksikona su unapređivanje opće jezične kulture te upotrebnog naglasnog i općejezičnog standarda hrvatskoga jezika kroz jednostavni i intuitivni pristup širokom rasponu informacija rječničkog tipa. No, cilj izrade ovog leksikona također je bio i napraviti modul za automatsku obradu tekstova na hrvatskom jeziku. CROVALLEX valencijski leksikon bi svoj doprinos prvenstveno mogao pokazati u automatskoj sintaktičkoj analizi, ako se uklopi u automatski sustav za stvaranje prikaza rečenica hrvatskog jezika uz pomoć tektogramatičkog parsera.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti
POVEZANOST RADA
Projekti:
130-1301679-1380 - Hrvatska rječnička baština i hrvatski europski identitet (Boras, Damir, MZOS ) ( CroRIS)
130-1301799-1999 - Oblikovanje i upravljanje javnim znanjem u informacijskom prostoru (Tuđman, Miroslav, MZOS ) ( CroRIS)
Ustanove:
Filozofski fakultet, Zagreb