Vremenska vizualizacija velikih zbirki tekstova zasnovana na analizi korespondencije (CROSBI ID 385901)
Ocjenski rad | doktorska disertacija
Podaci o odgovornosti
Šilić, Artur
Dalbelo Bašić, Bojana
hrvatski
Vremenska vizualizacija velikih zbirki tekstova zasnovana na analizi korespondencije
Vizualizacija tekstova jedan je od pristupa strojne obrade koji pomaže ljudima analizirati velike zbirke. Istraživanje vizualizacije tekstova, načinjeno u ovoj disertaciji, motivirano je činjenicama da tekstne zbirke često imaju vremensku dimenziju te da se protežu kroz dulja vremenska razdoblja. U ovoj disertaciji osmišljena je i istražena nova metoda vizualizacije CatViz koja je temeljena na analizi korespondencije i koja je usmjerena prema prikazu vremenskih promjena u sadržaju zbirke tekstova. Metoda CatViz predstavlja fuziju pristupa semantičkog prostora i vremenske osi jer iskazuje svojstva obaju pristupa. Kako bi se metoda CatViz upotrijebila na zbirkama tekstova, konstruirane su značajke za predstavljanje tekstova temeljene na prepoznavanju imenovanih entiteta, modeliranju tema i grupiranju. Razvijen je iznimno efikasan vizualizacijski sustav CatViz kako bi se istražile mogućnosti metode CatViz, ali i kako bi se provelo empirijsko vrednovanje. Oblikovana je korisnički usmjerena metodologija vrednovanja vizualizacije pomoću koje je uspješno provedeno vrednovanje vizualizacijske metode CatViz. Pokazana je korisnost te metode pri analizi velikih zbirki novinskih tekstova. Za ilustraciju mogućnosti vizualizacije CatViz, u ovoj su disertaciji predstavljene tri studije slučaja. Ova disertacija sadrži detaljan ilustrirani pregled radova na temu vizualizacije tekstova s naglaskom na pristupima i metodama crtanja. Ovim istraživanjem napravljen je pomak u području vizualizacije tekstova koji će omogućiti pojedincima da efikasno i objektivno otkrivaju znanje u velikim zbirkama. Vjeruje se kako će metoda CatViz obogatiti povijesna istraživanja tekstnih arhiva, medijska istraživanja suvremenih izvora, ali i otkrivanje znanja u svim drugim zbirkama tekstova.
otkrivanje znanja; vizualizacija tekstova; analiza korespondencije; značajke za vizualizaciju; redukcija dimenzionalnosti; vrednovanje vizualizacije; vizualizacijski sustav
nije evidentirano
engleski
Temporal visualization of large text collections based on correspondence analysis
nije evidentirano
knowledge discovery; text visualization; correspondence analysis; visualization features; dimensionality reduction; visualization evaluation; visualization system
nije evidentirano
Podaci o izdanju
153
24.04.2014.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb