Semantičko obogaćivanje teksta prostornim informacijama metodama procesiranja prirodnog jezika (CROSBI ID 391544)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Vidonis, Nikolina
Medak, Damir
Miler, Mario
hrvatski
Semantičko obogaćivanje teksta prostornim informacijama metodama procesiranja prirodnog jezika
Semantičko obogaćivanje je dodavanje dodatnih informacija već postojećem skupu podataka. Prirodni jezici su jezici koje koriste ljudi (npr. hrvatski, engleski, španjolski, itd.) te se prirodno razvijaju. S druge strane, formalni jezici, poput programskih jezika, su jezici koji su dizajnirani za specifične svrhe. Cilj ovog rada je odrediti prostornu dimenziju internetskih članaka korištenjem metoda procesiranja prirodnog jezika. Kao izvori podataka korištena su četiri web portala, dok je za referentnu bazu prostornih podataka korištena baza geografskih imena GeoNames. Algoritam je razvijen korištenjem programskog jezika Python te brojnih dodatnih modula. Nakon testiranja, odabran je Jaro Distance algoritam u svrhu obrade prirodnog teksta. Na kraju su prikupljeni podaci vizualizirani pomoću karata žarišta na tjednoj osnovi te je pripremljen videozapis.
semantičko obogaćivanje; prirodni jezici; prepoznavanje naziva; Python; Jaro Distance algoritam
nije evidentirano
engleski
Semantic text enrichment with spatial information using natural language processing methods
nije evidentirano
semantic enrichment; natural languages; named-entity recognition; Python; Jaro Distance algorithm
nije evidentirano
Podaci o izdanju
62
29.09.2014.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Geodetski fakultet
Zagreb