Računalno prepoznavanje i označavanje negacije u hrvatskom (CROSBI ID 439868)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Žanpera, Natalija
Šojat, Krešimir ; Kocijan, Kristina
hrvatski
Računalno prepoznavanje i označavanje negacije u hrvatskom
Ovaj rad bavi se prefiksalnom negacijom pridjeva hrvatskoga jezika, odnosno negacijom na morfološkoj razini. Definicija negacije unutar ovoga rada odnosi se na izravnu negaciju, prema kojoj „bez prefiksa nešto jest, dodavanjem prefiksa više nije ili dobiva suprotno značenje.“ Točnije, rad se bavi pridjevima koji dodavanjem negacijskoga prefiksa čine suprotni pojam, stoga se radi o morfološki povezanim ili istokorijenskim antonimima. Prvi dio rada donosi prikaz negacije i negacijskih prefikasa kroz hrvatske gramatike i ostale relevantne jezične izvore, a gdje je to moguće radi se i usporedba s engleskim jezikom. Također se prikazuju dosadašnja istraživanja ovog fenomena iz kognitivne i računalne domene. Prikupljanjem korpusa za računalnu obradu napravljena je i analiza prefiksalno negiranih pridjeva iz hrvatskog mrežnog korpusa „hrWaC“, pri čemu su opovrgnute neke dosadašnje teorijske postavke. Korpus sadrži 2024 konkordancije u kojima je bilo potrebno pronaći 2113 pridjeva. Drugi dio rada odnosi se na pisanje rječnika i gramatike u programu za računalnu obradu prirodnog jezika – NooJ, sa svrhom da gramatika prepozna kojim prefiksom i s kojom pridjevskom osnovom je stvorena nova riječ te novonastaloj riječi dodijeli morfološke oznake osnove i promijeni joj polaritet iz pozitivnoga u negativni. U rječnik su unesena 322 pridjeva – osnove, odnosno pridjevi bez negacijskoga prefiksa kojima je stoga dodijeljena oznaka pozitivnog polariteta te im je dodijeljena paradigma. Za tu svrhu napravljeno je 50 flektivnih gramatika s deklinacijskim obrascima. Zatim je napravljena morfološka gramatika za prepoznavanje i promjenu polariteta pridjeva i naposljetku sintaktička gramatika za primjenu na korpusu. Naposljetku se izračunala učinkovitost gramatike, prema parametrima preciznosti i odziva. Preciznost gramatike je 95.3%, ukazujući na probleme u označavanju zbog homografije, a odziv je 100%, odnosno nijedan prefiksalno negirani pridjev nije promaknuo morfološkoj gramatici u prepoznavanju i označavanju. Ova gramatika pruža model za daljnja istraživanja ovoga fenomena, poput nadograđivanja sa svrhom razrješenja morfosintaktičke višeznačnosti, ali i detaljnije analize sa svrhom prepoznavanja ostalih jezičnih obrazaca.
negacija ; prefiksalna negacija ; pridjevi ; hrvatski jezik ; obrada prirodnog jezika ; NooJ
nije evidentirano
engleski
Recognizing and Annotating Negation in Croatian
nije evidentirano
negation ; prefixal negation ; adjectives ; Croatian language ; natural language processing ; NooJ
nije evidentirano
Podaci o izdanju
96
30.09.2020.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Filozofski fakultet u Zagrebu
Zagreb