Pregled bibliografske jedinice broj: 428133
Postupci ekstrakcije kolokacija iz zbirki tekstova
Postupci ekstrakcije kolokacija iz zbirki tekstova, 2009., diplomski rad, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 428133 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Postupci ekstrakcije kolokacija iz zbirki tekstova
(Collocation extraction from corpus)
Autori
Delač, Davor
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
23.09
Godina
2009
Stranica
54
Mentor
Dalbelo Bašić, Bojana
Neposredni voditelj
Šnajder, Jan
Ključne riječi
ekstrakcija kolokacija; mjere leksičke asocijacije; genetičko programiranje; lematizacija; POS-filtar
(collocation extraction; lexical association measures; genetic programming; lemmatization; POS filtering)
Sažetak
Kolokacije, kombinacije riječi koje se skupa pojavljuju češće nego slučajno, imaju velik broj primjena u obradi prirodnog jezika. U literaturi se pojavljuje mnogo pristupa automatskoj ekstrakciji kolokacija zasnovanih na mjerama asocijacija. U ovom radu vrednuje se postupak ekstrakcije kolokacija korištenjem različitih mjera asocijacije. Uspoređeno je mnogo mjera te su genetičkim programiranjem izvedene nove mjere za ekstrakciju kolokacija. U ovom radu su opisani postupci lematizacije i POS filtriranja te dana usporedba procesa ekstrakcije kolokacija s ta dva koraka i bez njih.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb