Pregled bibliografske jedinice broj: 1114577
Računalno prepoznavanje i označavanje negacije u hrvatskom
Računalno prepoznavanje i označavanje negacije u hrvatskom, 2020., diplomski rad, diplomski, Filozofski fakultet, Zagreb
CROSBI ID: 1114577 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Računalno prepoznavanje i označavanje negacije u
hrvatskom
(Recognizing and Annotating Negation in Croatian)
Autori
Žanpera, Natalija
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Filozofski fakultet
Mjesto
Zagreb
Datum
30.09
Godina
2020
Stranica
96
Mentor
Šojat, Krešimir ; Kocijan, Kristina
Ključne riječi
negacija ; prefiksalna negacija ; pridjevi ; hrvatski jezik ; obrada prirodnog jezika ; NooJ
(negation ; prefixal negation ; adjectives ; Croatian language ; natural language processing ; NooJ)
Sažetak
Ovaj rad bavi se prefiksalnom negacijom pridjeva hrvatskoga jezika, odnosno negacijom na morfološkoj razini. Definicija negacije unutar ovoga rada odnosi se na izravnu negaciju, prema kojoj „bez prefiksa nešto jest, dodavanjem prefiksa više nije ili dobiva suprotno značenje.“ Točnije, rad se bavi pridjevima koji dodavanjem negacijskoga prefiksa čine suprotni pojam, stoga se radi o morfološki povezanim ili istokorijenskim antonimima. Prvi dio rada donosi prikaz negacije i negacijskih prefikasa kroz hrvatske gramatike i ostale relevantne jezične izvore, a gdje je to moguće radi se i usporedba s engleskim jezikom. Također se prikazuju dosadašnja istraživanja ovog fenomena iz kognitivne i računalne domene. Prikupljanjem korpusa za računalnu obradu napravljena je i analiza prefiksalno negiranih pridjeva iz hrvatskog mrežnog korpusa „hrWaC“, pri čemu su opovrgnute neke dosadašnje teorijske postavke. Korpus sadrži 2024 konkordancije u kojima je bilo potrebno pronaći 2113 pridjeva. Drugi dio rada odnosi se na pisanje rječnika i gramatike u programu za računalnu obradu prirodnog jezika – NooJ, sa svrhom da gramatika prepozna kojim prefiksom i s kojom pridjevskom osnovom je stvorena nova riječ te novonastaloj riječi dodijeli morfološke oznake osnove i promijeni joj polaritet iz pozitivnoga u negativni. U rječnik su unesena 322 pridjeva – osnove, odnosno pridjevi bez negacijskoga prefiksa kojima je stoga dodijeljena oznaka pozitivnog polariteta te im je dodijeljena paradigma. Za tu svrhu napravljeno je 50 flektivnih gramatika s deklinacijskim obrascima. Zatim je napravljena morfološka gramatika za prepoznavanje i promjenu polariteta pridjeva i naposljetku sintaktička gramatika za primjenu na korpusu. Naposljetku se izračunala učinkovitost gramatike, prema parametrima preciznosti i odziva. Preciznost gramatike je 95.3%, ukazujući na probleme u označavanju zbog homografije, a odziv je 100%, odnosno nijedan prefiksalno negirani pridjev nije promaknuo morfološkoj gramatici u prepoznavanju i označavanju. Ova gramatika pruža model za daljnja istraživanja ovoga fenomena, poput nadograđivanja sa svrhom razrješenja morfosintaktičke višeznačnosti, ali i detaljnije analize sa svrhom prepoznavanja ostalih jezičnih obrazaca.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti, Filologija
POVEZANOST RADA
Ustanove:
Filozofski fakultet, Zagreb