Pregled bibliografske jedinice broj: 471394
Genetičko programiranje susreće lingvistiku: računalni postupci ekstrakcije kolokacija iz korpusa
Genetičko programiranje susreće lingvistiku: računalni postupci ekstrakcije kolokacija iz korpusa, 2010. (ostalo).
CROSBI ID: 471394 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Genetičko programiranje susreće lingvistiku: računalni postupci ekstrakcije kolokacija iz korpusa
(Genetic programming meets linguistics: computational methods for extracting collocations from corpora)
Autori
Šnajder, Jan
Izvornik
Zagrebački lingvistički krug Hrvatskoga filološkog društva
Vrsta, podvrsta
Ostale vrste radova, ostalo
Godina
2010
Ključne riječi
kolokacije; višerječni izrazi; obrada prirodnog jezika; korpusna lingvistika; leksikografija
(collocations; multiword expressions; natural language processing; corpus linguistics; lexicography)
Sažetak
Kolokacije, uključivo frazemi, ustaljene fraze, imenovani entiteti i terminološki izrazi imaju važnu primjenu u leksikografiji i prevođenju, ali i u računalnoj obradi prirodnog jezika, pretraživanju informacija i dubinskoj analizi teksta. Automatska ekstrakcija kolokacija iz korpusa predmetom je intenzivnog istraživanja u području obrade prirodnog jezika. U predavanju je izložen pristup ekstrakciji kolokacija hrvatskog jezika temeljen na mjerama leksičke povezanosti riječi. Detaljnije je opisan pristup temeljen na genetičkom programiranju, optimizacijskom postupku inspiriranom biološkom evolucijom, kojim je moguće izvesti nove i vrlo djelotvorne mjere leksičke povezanosti. Dan je osvrt na problem vrednovanja uspješnosti ekstrakcije kolokacija i demonstriran je alat za ekstrakciju kolokacija TermeX.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb
Profili:
Jan Šnajder
(autor)