Pregled bibliografske jedinice broj: 507771
Pristupi morfosintaktičkom označavanju hrvatskih tekstova
Pristupi morfosintaktičkom označavanju hrvatskih tekstova, 2011. (ostalo).
CROSBI ID: 507771 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Pristupi morfosintaktičkom označavanju hrvatskih tekstova
(Approaches to Morphoysntactic Tagging of Croatian Texts)
Autori
Agić, Željko
Izvornik
Odjel za informatiku Sveučilišta u Rijeci
Vrsta, podvrsta
Ostale vrste radova, ostalo
Godina
2011
Ključne riječi
morfosintaktičko označavanje; skriveni Markovljevi modeli; hrvatski jezik
(morphosyntactic tagging; hidden Markov models; Croatian language)
Sažetak
U predavanju se prikazuju pristupi rješavanju problema strojnog morfosintaktičkog označavanja hrvatskih tekstova, razvijeni na Odsjeku za informacijske znanosti i Odsjeku za lingvistiku Filozofskog fakulteta Sveučilišta u Zagrebu, u sklopu projekata znanstvenog programa Računalnolingvistički modeli i jezične tehnologije za hrvatski jezik. Prvo se definira pojam morfosintaktičkog označavanja i ilustrira njegova kompleksnost sa stanovišta razrješavanja višeznačnosti riječi, koja programska rješenja ovoga problema svrstava u područje umjetne i računalne inteligencije te obradbe prirodnog jezika, odnosno jezičnih tehnologija. Definira se također pojam morfosintaktičkog opisa i morfosintaktičke oznake, morfološkog leksikona i morfosintaktičkog označivača. Pojašnjava se razredba morfosintaktičkih označivača na sustave temeljene na pravilima te stohastičke sustave temeljene na podatcima te se uvodi pojam morfosintaktički označenog korpusa. Predstavlja se jedan od pristupa rješavanju problema morfosintaktičkog označavanja korištenjem tako označenog korpusa - pristup temeljen na skrivenim Markovljevim modelima. Definira se skriveni Markovljev model sa stanjima i opažanjima te matricama vjerojatnosti prijelaza i emitiranja, uz ilustraciju osnovnih svojstava i temeljnih problema koji se rješavaju pomoću njih te pripadnih algoritama za rješavanje tih problema. Potom se dodatno pojašnjava primjenljivost skrivenih Markovljevih modela na problem morfosintaktičkog označavanja te pristupi rješavanju problema manjkavosti podataka iz korpusa u smislu zaglađivanja nepotpunih matrica s vjerojatnostima i rukovanja nepoznatim riječima. Na kraju se predstavljaju osnovni pristupi vrjednovanju morfosintaktičkih označivača, mogućnosti poboljšanja postojećih rješenja te planovi za budući rad.
Izvorni jezik
Engleski
Znanstvena područja
Računarstvo, Informacijske i komunikacijske znanosti