Pregled bibliografske jedinice broj: 343233
Izrada klasifikacije morfologije riječi hrvatskoga jezika za potrebe računalne obrade
Izrada klasifikacije morfologije riječi hrvatskoga jezika za potrebe računalne obrade, 2007., diplomski rad, Filozofski fakultet, Split
CROSBI ID: 343233 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Izrada klasifikacije morfologije riječi hrvatskoga jezika za potrebe računalne obrade
(Croatian morphology word classification for computer processing)
Autori
Trumbić, Marina
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad
Fakultet
Filozofski fakultet
Mjesto
Split
Datum
18.12
Godina
2007
Stranica
60
Mentor
Stankov, Slavomir
Neposredni voditelj
Žitko, Branko
Ključne riječi
jezične tehnologije hrvatskoga jezika; klasifikacija riječi hrvatskoga jezika; morfologija hrvatskoga jezika; osnovni oblik riječi; osnova riječi; gramatemi; vrste riječi hrvatskoga jezika
(croatian language technology; croatian word classification; morphology of croatian language; lemmas; word stem; lemma endings; croatian POS (part of speech))
Sažetak
Izrada klasifikacija morfologije riječi potrebna je zbog računalne izvedbe sustava koji bi poštivao propise što ga na razini morfologije daje gramatika hrvatskoga jezika. Sustav bi trebao generirati sve moguće oblike jedne riječi. Stoga je polazna zamisao ovoga rada bila omogućiti korisniku slobodu i pomoć prilikom unosa riječi. Rad je baziran jednim dijelom na lingvističkom opisu, ali su mnoge preinake uvedene zbog računalne obrade. Ovaj morfološki opis daleko je od savršenstva i krajnje definiranosti, izrađen, definiran i ostavljen nadolazećim generacijama na provjeru i nadogradnju. Sam je cilj rada dvojake naravi: 1. aktivan leksikon 2. olakšati unos riječi u leksikon (klasifikacijom i kazalom pojmova) Konačni cilj, pomalo idealistički, bi bio omogućiti svim korisnicima koji posjeduju osnovno znanje gramatike da unose riječi u leksikon i tako bogate njegovu bazu. Da bi to postalo moguće prvo treba pronaći odgovarajući temelj klasifikacije, temelj koji bi bio zajednički svim vrstama riječi. A potom klasifikaciju povezati sa kazalom pojmova koje se mogu pojaviti prilikom unosa riječi. Cilj kazala je da posluži kao svojevrsna pomoć budućim korisnicima ili programerima koji budu koristili ovaj sustav. Da bi generiranje svih oblika jedne riječi bilo uspješno, morfološki sustav sastoji se od: 1. klasifikacije 2. uzorka 3. uzorka promjene 4. iznimaka 5. čvorova (baza za unos riječi) 6. kazala pojmova 7. nepromjenjivih riječi Svi sedam nabrojenih sastavnica možemo definirati kao tablice, matrice koje se međusobno preklapaju i nadopunjavaju. Svaka iznosi svoj dio morfološkoga problema i može se čitati odvojeno, ali tek sve zajedno daju mogućnost računalnog generiranja svih mogućih oblika jedne riječi. Ovaj rad predstavlja jedan mali pokušaj da se poboljša i osigura napredak jezičnih tehnologija. Ovo nije prvi morfološki opis riječi hrvatskoga jezika, ali svakako nije ni posljednji. Bilo bi lažno tvrditi da je ovaj rad konačan. Njime se samo predstavlja jedan pokušaj ili dobra početna baza na kojoj se daljnjim radovima mogu ispraviti svi propusti i nedostaci da bi se u konačnici strukturirala morfologija hrvatskoga jezika za potrebe računalne obrade.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
177-0361994-1996 - Oblikovanje i vrednovanje inteligentnih sustava e-učenja. (Žitko, Branko, MZOS ) ( CroRIS)
Ustanove:
Prirodoslovno-matematički fakultet, Split