Pregled bibliografske jedinice broj: 722966
Semantičko obogaćivanje teksta prostornim informacijama metodama procesiranja prirodnog jezika
Semantičko obogaćivanje teksta prostornim informacijama metodama procesiranja prirodnog jezika, 2014., diplomski rad, diplomski, Geodetski fakultet, Zagreb
CROSBI ID: 722966 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Semantičko obogaćivanje teksta prostornim informacijama metodama procesiranja prirodnog jezika
(Semantic text enrichment with spatial information using natural language processing methods)
Autori
Vidonis, Nikolina
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Geodetski fakultet
Mjesto
Zagreb
Datum
29.09
Godina
2014
Stranica
62
Mentor
Medak, Damir
Neposredni voditelj
Miler, Mario
Ključne riječi
semantičko obogaćivanje; prirodni jezici; prepoznavanje naziva; Python; Jaro Distance algoritam
(semantic enrichment; natural languages; named-entity recognition; Python; Jaro Distance algorithm)
Sažetak
Semantičko obogaćivanje je dodavanje dodatnih informacija već postojećem skupu podataka. Prirodni jezici su jezici koje koriste ljudi (npr. hrvatski, engleski, španjolski, itd.) te se prirodno razvijaju. S druge strane, formalni jezici, poput programskih jezika, su jezici koji su dizajnirani za specifične svrhe. Cilj ovog rada je odrediti prostornu dimenziju internetskih članaka korištenjem metoda procesiranja prirodnog jezika. Kao izvori podataka korištena su četiri web portala, dok je za referentnu bazu prostornih podataka korištena baza geografskih imena GeoNames. Algoritam je razvijen korištenjem programskog jezika Python te brojnih dodatnih modula. Nakon testiranja, odabran je Jaro Distance algoritam u svrhu obrade prirodnog teksta. Na kraju su prikupljeni podaci vizualizirani pomoću karata žarišta na tjednoj osnovi te je pripremljen videozapis.
Izvorni jezik
Hrvatski
Znanstvena područja
Geodezija
POVEZANOST RADA
Ustanove:
Geodetski fakultet, Zagreb