Izrada klasifikacije morfologije riječi hrvatskoga jezika za potrebe računalne obrade (CROSBI ID 349804)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Trumbić, Marina
Stankov, Slavomir
Žitko, Branko
hrvatski
Izrada klasifikacije morfologije riječi hrvatskoga jezika za potrebe računalne obrade
Izrada klasifikacija morfologije riječi potrebna je zbog računalne izvedbe sustava koji bi poštivao propise što ga na razini morfologije daje gramatika hrvatskoga jezika. Sustav bi trebao generirati sve moguće oblike jedne riječi. Stoga je polazna zamisao ovoga rada bila omogućiti korisniku slobodu i pomoć prilikom unosa riječi. Rad je baziran jednim dijelom na lingvističkom opisu, ali su mnoge preinake uvedene zbog računalne obrade. Ovaj morfološki opis daleko je od savršenstva i krajnje definiranosti, izrađen, definiran i ostavljen nadolazećim generacijama na provjeru i nadogradnju. Sam je cilj rada dvojake naravi: 1. aktivan leksikon 2. olakšati unos riječi u leksikon (klasifikacijom i kazalom pojmova) Konačni cilj, pomalo idealistički, bi bio omogućiti svim korisnicima koji posjeduju osnovno znanje gramatike da unose riječi u leksikon i tako bogate njegovu bazu. Da bi to postalo moguće prvo treba pronaći odgovarajući temelj klasifikacije, temelj koji bi bio zajednički svim vrstama riječi. A potom klasifikaciju povezati sa kazalom pojmova koje se mogu pojaviti prilikom unosa riječi. Cilj kazala je da posluži kao svojevrsna pomoć budućim korisnicima ili programerima koji budu koristili ovaj sustav. Da bi generiranje svih oblika jedne riječi bilo uspješno, morfološki sustav sastoji se od: 1. klasifikacije 2. uzorka 3. uzorka promjene 4. iznimaka 5. čvorova (baza za unos riječi) 6. kazala pojmova 7. nepromjenjivih riječi Svi sedam nabrojenih sastavnica možemo definirati kao tablice, matrice koje se međusobno preklapaju i nadopunjavaju. Svaka iznosi svoj dio morfološkoga problema i može se čitati odvojeno, ali tek sve zajedno daju mogućnost računalnog generiranja svih mogućih oblika jedne riječi. Ovaj rad predstavlja jedan mali pokušaj da se poboljša i osigura napredak jezičnih tehnologija. Ovo nije prvi morfološki opis riječi hrvatskoga jezika, ali svakako nije ni posljednji. Bilo bi lažno tvrditi da je ovaj rad konačan. Njime se samo predstavlja jedan pokušaj ili dobra početna baza na kojoj se daljnjim radovima mogu ispraviti svi propusti i nedostaci da bi se u konačnici strukturirala morfologija hrvatskoga jezika za potrebe računalne obrade.
jezične tehnologije hrvatskoga jezika; klasifikacija riječi hrvatskoga jezika; morfologija hrvatskoga jezika; osnovni oblik riječi; osnova riječi; gramatemi; vrste riječi hrvatskoga jezika
nije evidentirano
engleski
Croatian morphology word classification for computer processing
nije evidentirano
croatian language technology; croatian word classification; morphology of croatian language; lemmas; word stem; lemma endings; croatian POS (part of speech)
nije evidentirano
Podaci o izdanju
60
18.12.2007.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Filozofski fakultet u Splitu
Split