Pregled bibliografske jedinice broj: 697158
Crpljenje i pretraživanje tekstnih informacija na temelju grafova događaja
Crpljenje i pretraživanje tekstnih informacija na temelju grafova događaja, 2014., doktorska disertacija, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 697158 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Crpljenje i pretraživanje tekstnih informacija na temelju grafova događaja
(Text Information Extraction and Retrieval Based on Event Graphs)
Autori
Glavaš, Goran
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
25.04
Godina
2014
Stranica
240
Mentor
Šnajder, Jan
Ključne riječi
crpljenje tekstnih informacija; graf događaja; jezgrene funkcije nad grafovima; pretraživanje tekstnih informacija; obrada prirodnog jezika
(information extraction; event graph; graph kernels; information retrieval; natural language processing)
Sažetak
Tekstni izvori koji opisuju događaje iz stvarnoga svijeta (npr. novinski članci) sve su brojniji, a informacijske potrebe korisnika koje se tiču događaja sve su izraženije. Stoga su postupci za automatizirano crpljenje i pretraživanje informacija o događajima sve potrebniji. U okviru disertacije predstavljen je model grafa događaja kao strukture koja sadrži sve bitne informacijske aspekte događaja iz stvarnog svijeta. Vrhovi grafa događaja predstavljaju pojedinačna spominjanja događaja u tekstu, a bridovi vremenske odnose među njima. Ostvaren je potpuno automatizirani postupak izgradnje grafova događaja iz teksta koji kombinira modele za crpljenje informacija temeljene na nadziranom strojnom učenju s modelima temeljenim na pravilima. Provedeno je iscrpno intrinzično eksperimentalno vrednovanje svih modela koji sudjeluju u izgradnji grafova događaja, a predstavljene su i dvije nove mjere za vrednovanje ukupne kakvoće automatski izgrađenih grafova događaja. Predstavljen je model za usporedbu dokumenata usporedbom grafova događaja pomoću jezgrenih funkcija nad grafovima. Učinkovitost predstavljanja dokumenata grafovima događaja i njihove usporedbe jezgrenim funkcijama nad grafovima utvrđena je ekstrinzičnim vrednovanjem na različitim zadatcima pretraživanja informacija. Korisnost crpljenja i strukturiranja informacija o događajima iz teksta dodatno je potvrđena vrednovanjem na zadatcima sažimanja grupa dokumenata te pojednostavljivanja novinskih članaka. Pristupi crpljenju i pretraživanju informacija opisani u ovoj disertaciji usredotočeni su na engleski jezik, ali ih je, uz pretpostavku postojanja određenih jezičnih resursa i alata, moguće prilagoditi na način da budu primjenjivi i za druge jezike.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb