Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 540542

Morfološka normalizacija tekstova na hrvatskome za dubinsku analizu i pretraživanje informacija


Šnajder, Jan
Morfološka normalizacija tekstova na hrvatskome za dubinsku analizu i pretraživanje informacija, 2011. (ostalo).


CROSBI ID: 540542 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Morfološka normalizacija tekstova na hrvatskome za dubinsku analizu i pretraživanje informacija
(Morphological Normalization of Texts in Croatian Language for Text Mining and Information Retrieval)

Autori
Šnajder, Jan

Izvornik
Research Class Odjela za informatiku Sveučilišta u Rijeci

Vrsta, podvrsta
Ostale vrste radova, ostalo

Godina
2011

Ključne riječi
Morfološka normalizacija; računalna obrada morfologije; obrada prirodnog jezika; hrvatski jezik; pretraživanje informacija; dubinska analiza teksta
(Morphological normalization; computational morphology; natural language processing; Croatian language; information retrieval; text mining)

Sažetak
Riječi u tekstu pojavljuju se u različitim morfološkim varijantama, odnosno flektivnim i derivacijskim oblicima. Morfološka varijacija ima negativan utjecaj na djelotvornost sustava za pretraživanje informacija i dubinsku analizu teksta, naročito kod morfološki složenih jezika kao što je hrvatski. Negativne utjecaje morfološke varijacije moguće je ukloniti primjenom postupaka morfološke normalizacije, odnosno sažimanjem različitih morfoloških varijanti jedne ili više riječi na jedan reprezentativni oblik. U okviru ovog izlaganja bit će opisan postupak za flektivnu i flektivno-derivacijsku normalizaciju tekstova na hrvatskome jeziku temeljen na morfološkom leksikonu. Kako bi se zaobišao problem ograničenosti opsega leksikona te visoke cijene njegove izgradnje, razvijen je postupak za automatsku akviziciju flektivnoga leksikona iz neoznačenog korpusa. Akvizicija i normalizacija temelje se na računalnom generativno-redukcijskome modelu morfologije hrvatskoga jezika kojim je obuhvaćena fleksija i sufiksalna tvorba imenica, glagola i pridjeva. Provedeno je iscrpno eksperimentalno vrednovanje kojim je utvrđeno da postupak doseže visoku intrinzičnu kakvoću normalizacije, na flektivnoj razini usporedivu s onom ručno sastavljenog leksikona. Opisani pristup usredotočen je na hrvatski jezik, ali je primjenjiv i na druge, morfološki slične jezike.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo

Napomena
Predavanje je održano 24.03.2011.



POVEZANOST RADA


Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)

Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Jan Šnajder (autor)


Citiraj ovu publikaciju:

Šnajder, Jan
Morfološka normalizacija tekstova na hrvatskome za dubinsku analizu i pretraživanje informacija, 2011. (ostalo).
Šnajder, J. (2011) Morfološka normalizacija tekstova na hrvatskome za dubinsku analizu i pretraživanje informacija. Research Class Odjela za informatiku Sveučilišta u Rijeci. Ostalo.
@unknown{unknown, author = {\v{S}najder, Jan}, year = {2011}, keywords = {Morfolo\v{s}ka normalizacija, ra\v{c}unalna obrada morfologije, obrada prirodnog jezika, hrvatski jezik, pretra\v{z}ivanje informacija, dubinska analiza teksta}, title = {Morfolo\v{s}ka normalizacija tekstova na hrvatskome za dubinsku analizu i pretra\v{z}ivanje informacija}, keyword = {Morfolo\v{s}ka normalizacija, ra\v{c}unalna obrada morfologije, obrada prirodnog jezika, hrvatski jezik, pretra\v{z}ivanje informacija, dubinska analiza teksta} }
@unknown{unknown, author = {\v{S}najder, Jan}, year = {2011}, keywords = {Morphological normalization, computational morphology, natural language processing, Croatian language, information retrieval, text mining}, title = {Morphological Normalization of Texts in Croatian Language for Text Mining and Information Retrieval}, keyword = {Morphological normalization, computational morphology, natural language processing, Croatian language, information retrieval, text mining} }




Contrast
Increase Font
Decrease Font
Dyslexic Font