Pregled bibliografske jedinice broj: 132124
Robusno prepoznavanje i izvođenje oblika riječi u hrvatskome jeziku
Robusno prepoznavanje i izvođenje oblika riječi u hrvatskome jeziku // Modeli znanja i obrada prirodnoga jezika / Tuđman, Miroslav (ur.).
Zagreb: Zavod za informacijske studije Odsjeka za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu, 2003. str. 197-217
CROSBI ID: 132124 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Robusno prepoznavanje i izvođenje oblika riječi u hrvatskome jeziku
(Robust Morphological Analysis and Generation of Wordforms in Croatian Language)
Autori
Lauc, Tomislava ; Lopina, Vjera
Vrsta, podvrsta i kategorija rada
Poglavlja u knjigama, znanstveni
Knjiga
Modeli znanja i obrada prirodnoga jezika
Urednik/ci
Tuđman, Miroslav
Izdavač
Zavod za informacijske studije Odsjeka za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu
Grad
Zagreb
Godina
2003
Raspon stranica
197-217
ISBN
953-175-181-1
Ključne riječi
robusna morfološka obrada, hrvatski jezik, pretraživanje informacija
(robust-morphological parsing, Croatian language, information retrieval)
Sažetak
Članak opisuje izradu sustava za robusno prepoznavanje i izvođenje oblika riječi u hrvatskome jeziku kako bi u sustavu za pretraživanje tekstova bilo moguće pronalaženje svih pripadnih oblika za dani oblik riječi iz upita. Sustav omogućuje izvođenje svih oblika bez uporabe rječnika. To je razlog da se na jednu ili više osnova dobivenih uklanjanjem nastavaka iz skupa obličnih nastavaka koji se upotrebljavaju u sklonidbi imenica i pridjeva dodaju potom svi nastavci iz istog skupa jer nema obavijesti o tome koji se sklonidbeni obrazac pridružuje pojedinoj imeničnoj, odnosno pridjevskoj osnovi. Slično tome, i morfonološke se smjene provode bez obzira na stvarnu jezičnu potrebu. Budući da navedeni postupci rezultiraju izvođenjem velikog broja oblika od kojih samo dio doista postoji u jeziku, u završnom je koraku potrebno provesti filtriranje kroz popis riječi iz korpusa tekstova koji se pretražuje.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti