Pregled bibliografske jedinice broj: 778757
Jezični alati za obradu njemačkog jezika: distribucija slogova u njemačkom jeziku
Jezični alati za obradu njemačkog jezika: distribucija slogova u njemačkom jeziku, 2015., diplomski rad, preddiplomski, Odjel za informatiku, Rijeka
CROSBI ID: 778757 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Jezični alati za obradu njemačkog jezika: distribucija slogova u njemačkom jeziku
(Language Processing Tools for German Language: The Distribution of Syllables in German Language)
Autori
Babić, Nikola
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Odjel za informatiku
Mjesto
Rijeka
Datum
22.09
Godina
2015
Stranica
24
Mentor
Martinčić - Ipšić, Sanda
Ključne riječi
slog; distribucija slogova; naglasak; izgovor; fonem; morfem
(syllable; distribution of syllables; accent; pronunciation; phoneme; morpheme)
Sažetak
Jezični alati služe za detaljnu računalnu analizu prirodnog jezika, čije rezultate možemo iskoristiti u raznim istraživanjima. Moguća je analiza na temelju točno određenih elemenata koji se nalaze u prirodnom jeziku. Takvi alati su poznati pod nazivom „Natural Language Processing Tools“. Svrha ovog rada je prikazivanje aspekta rastavljanja slogova vezano uz pravila njemačkog jezika i provjera dobivenih rezultata istraživanja. Za provođenje statističke analize slogova korišten je korpus koji sadrži riječi iz pojednostavljenog njemačkog rječnika. Konačni rezultat programske analize se uspoređuje s postojećim rastavljenim slogovima riječi unutar njemačkog rječnika, što ukazuje na određene pogreške u slučaju prepuštanja programskog rastavljanja slogova. Rastavljanje na slogove je važan korak u problemu određivanja naglasaka riječi pri umjetnoj tvorbi govora. Boljim razumijevanjem prirodnog jezika smo korak bliže boljem razumijevanju nas samih, pošto je jezik proizvod ljudski bića. Uz pomoć programa za automatsko rastavljanje riječi na slogove bila je omogućena statistička analiza pojedinih detalja slogova unutar njemačkog jezika. Uspješno je analizirana učestalost broja slogova unutar svake riječi, duljina svakog pojedinog sloga i frekvencija pojavljivanja 16 modela sloga u svakoj riječi. Na kraju analize rezultata je ustanovljeno: • da su slogovi duljine tri slova najučestaliji (46%), te da slogovi većih duljina nisu zastupljeni u tolikoj mjeri (ukupno oko 20%) ; • da ima najviše riječi koje sadrže po četiri i pet različitih slogova (oko 40%) ; • da je najveći broj različitih slogova među slogovima sastavljenih od 5 riječi (oko 25%) • da je „CVC“ najzastupljeniji model sloga (44%) što odmah potvrđuje rezultate o slogovima duljine tri slova.
Izvorni jezik
Engleski
Znanstvena područja
Informacijske i komunikacijske znanosti
POVEZANOST RADA
Ustanove:
Fakultet informatike i digitalnih tehnologija, Rijeka
Profili:
Sanda Martinčić - Ipšić
(mentor)