Crpljenje i pretraživanje tekstnih informacija na temelju grafova događaja (CROSBI ID 385934)
Ocjenski rad | doktorska disertacija
Podaci o odgovornosti
Glavaš, Goran
Šnajder, Jan
hrvatski
Crpljenje i pretraživanje tekstnih informacija na temelju grafova događaja
Tekstni izvori koji opisuju događaje iz stvarnoga svijeta (npr. novinski članci) sve su brojniji, a informacijske potrebe korisnika koje se tiču događaja sve su izraženije. Stoga su postupci za automatizirano crpljenje i pretraživanje informacija o događajima sve potrebniji. U okviru disertacije predstavljen je model grafa događaja kao strukture koja sadrži sve bitne informacijske aspekte događaja iz stvarnog svijeta. Vrhovi grafa događaja predstavljaju pojedinačna spominjanja događaja u tekstu, a bridovi vremenske odnose među njima. Ostvaren je potpuno automatizirani postupak izgradnje grafova događaja iz teksta koji kombinira modele za crpljenje informacija temeljene na nadziranom strojnom učenju s modelima temeljenim na pravilima. Provedeno je iscrpno intrinzično eksperimentalno vrednovanje svih modela koji sudjeluju u izgradnji grafova događaja, a predstavljene su i dvije nove mjere za vrednovanje ukupne kakvoće automatski izgrađenih grafova događaja. Predstavljen je model za usporedbu dokumenata usporedbom grafova događaja pomoću jezgrenih funkcija nad grafovima. Učinkovitost predstavljanja dokumenata grafovima događaja i njihove usporedbe jezgrenim funkcijama nad grafovima utvrđena je ekstrinzičnim vrednovanjem na različitim zadatcima pretraživanja informacija. Korisnost crpljenja i strukturiranja informacija o događajima iz teksta dodatno je potvrđena vrednovanjem na zadatcima sažimanja grupa dokumenata te pojednostavljivanja novinskih članaka. Pristupi crpljenju i pretraživanju informacija opisani u ovoj disertaciji usredotočeni su na engleski jezik, ali ih je, uz pretpostavku postojanja određenih jezičnih resursa i alata, moguće prilagoditi na način da budu primjenjivi i za druge jezike.
crpljenje tekstnih informacija; graf događaja; jezgrene funkcije nad grafovima; pretraživanje tekstnih informacija; obrada prirodnog jezika
nije evidentirano
engleski
Text Information Extraction and Retrieval Based on Event Graphs
nije evidentirano
information extraction; event graph; graph kernels; information retrieval; natural language processing
nije evidentirano
Podaci o izdanju
240
25.04.2014.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb