Napredna pretraga

Pregled bibliografske jedinice broj: 330055

Pristupi izradi strojnog tezaurusa za hrvatski jezik


Mikelić Preradović, Nives
Pristupi izradi strojnog tezaurusa za hrvatski jezik 2008., doktorska disertacija, Filozofski fakultet, Zagreb, Hrvatska


Naslov
Pristupi izradi strojnog tezaurusa za hrvatski jezik
(Approaches to the Development of the Machine Lexicon for Croatian Language)

Autori
Mikelić Preradović, Nives

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija

Fakultet
Filozofski fakultet

Mjesto
Zagreb, Hrvatska

Datum
01.04

Godina
2008

Stranica
470

Mentor
Boras, Damir

Ključne riječi
Valencijski leksikon; naglasno-sklonidbeni modela imenica i pridjeva; naglasno-konjugacijski model glagola; naglasno morfološki analizator i generator; dubinski padeži; sustav za pretvorbu teksta u govor; sintaktičko-semantičke klase; valencijski okvir
(Valence lexicon; accentual conjugational paradigm of verbs; accentual declensional paradigm of nouns; accentual declensional paradigm of adjectives;)

Sažetak
Ova disertacija bavi se dvama problemima, od kojih prvi predstavlja moguće početke razvoja sustava pretvorbe teksta u govor za hrvatski jezik kroz izradu naglasno-izgovornog leksikona glagola, imenica i pridjeva. Na temelju naglasno- sklonidbenih modela imenica i pridjeva te naglasno-konjugacijskih modela glagola definiranih u ovom radu, razvijen je alat koji automatski generira naglasne oblike riječi u svim padežima, odnosno licima, uzimajući njihov osnovni oblik iz leksičke baze i pridružujući im valjane paradigmatske nastavke i naglaske. Ako se ovaj alat bude implementirao kao dio naglasnog izgovornog leksikona u hrvatskom sustavu pretvorbe teksta u govor, izgovor leksema će se moći generirati automatski za riječi koje se nalaze u leksičkoj bazi, uz pomoć pravila pretvorbe grafema u foneme. Drugi problem kojim se bavi ovaj rad je izrada valencijskog leksikona hrvatskih glagola – CROVALLEX-a. Verzija 2.008 sadrži 1739 glagola s 5118 valencijskih okvira (što je u prosjeku 3 valencijska okvira po glagolu) te 173 sintaktičko- semantičke klase. Pri njegovom stvaranju vodilo se računa o čitljivosti i dostupnosti, lakoj orijentaciji i razumljivosti. Osnovni ciljevi izrade ovog leksikona su unapređivanje opće jezične kulture te upotrebnog naglasnog i općejezičnog standarda hrvatskoga jezika kroz jednostavni i intuitivni pristup širokom rasponu informacija rječničkog tipa. No, cilj izrade ovog leksikona također je bio i napraviti modul za automatsku obradu tekstova na hrvatskom jeziku. CROVALLEX valencijski leksikon bi svoj doprinos prvenstveno mogao pokazati u automatskoj sintaktičkoj analizi, ako se uklopi u automatski sustav za stvaranje prikaza rečenica hrvatskog jezika uz pomoć tektogramatičkog parsera.

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti



POVEZANOST RADA


Projekt / tema
130-1301679-1380 - Hrvatska rječnička baština i hrvatski europski identitet (Damir Boras, )
130-1301799-1999 - Oblikovanje i upravljanje javnim znanjem u informacijskom prostoru (Miroslav Tuđman, )

Ustanove
Filozofski fakultet, Zagreb

Autor s matičnim brojem:
Nives Mikelić Preradović, (247800)