Pregled bibliografske jedinice broj: 500762
Postupak ekstrakcije složenih kratica hrvatskoga jezika
Postupak ekstrakcije složenih kratica hrvatskoga jezika, 2011., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 500762 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Postupak ekstrakcije složenih kratica hrvatskoga jezika
(Acronym extraction in Croatian language)
Autori
Dragomanović, Fran
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
01.02
Godina
2011
Stranica
33
Mentor
Dalbelo Bašić, Bojana
Neposredni voditelj
Šnajder, Jan
Ključne riječi
obrada prirodnog jezika; ekstrakcija složenih kratica; stroj s potpornim vektorima; metoda temeljena na uzorcima
(natural language processing; acronym extraction; support vector machine; rule-based method)
Sažetak
Cilj ekstrakcije složenih kratica hrvatskoga jezika je razvitak tehnika koje automatski ekstrahiraju kratice i njihove pripadajuće ekspanzije iz teksta. Razvijena su tri različita pristupa: referentna metoda, metoda potpornih vektora te njihova kombinacija. Više je pristupa korišteno kako bi se mogli usporediti te iz njih izvuči zaključci. Korištenje metode potpornih vektora zahtjevalo je najviše optimiranja parametara. Tako su njene značajke učene i testirane na tri različita načina: nestandardizirane, standardizirane sve, te standardizirane cjelobrojne značajke. Tekst nad kojim se vršio postupak ekstrakcije je 10 godina Vjesnika (1999-2009.). Uspješnost ostvarenja je evaluirana i uspoređena s ručno označenim parovima kratice i ekspanzije.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb