Pregled bibliografske jedinice broj: 932501
Izdvajanje i geokodiranje adresa sa sjedišta weba
Izdvajanje i geokodiranje adresa sa sjedišta weba, 2012., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 932501 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Izdvajanje i geokodiranje adresa sa sjedišta weba
(Extracting and Geocoding Local Addresses from Websites)
Autori
Šemanjski, Ivan
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
05.07
Godina
2012
Stranica
59
Mentor
Car, Željka
Neposredni voditelj
Vuković, Marin
Ključne riječi
izdvajanje adresa, sustavi zasnovani na pravilima, regularni izrazi, geokodiranje
(address extraction, rule-based systems, regular expressions, geocoding)
Sažetak
Analiziranje teksta te pretraživanje i izdvajanje odreĊenih informacija iz nestrukturiranih dokumenata vrlo je aktivno podruĉje istraživanja. Fokus ovog rada je izdvajanje adresa sa sjedišta weba korištenjem metoda zasnovanih na pravilima. U radu su predstavljeni odreĊeni problemi koji se javljaju pri izdvajanju adresa sa stranica hrvatskih sjedišta weba te rješenja koja rješavaju te probleme. Izdvojene se adrese geokodiraju korištenjem javno dostupnih servisa. Uz to je izraĊeno i opisano programsko rješenje koje implementira predstavljene ideje i rješenja problema izdvajanja adresa. Predložene metode su evaluirane na razliĉitim skupovima stvarnih podataka iz kataloga www.hr, uz maksimalnu uspješnost izdvajanja i geokodiranja adresa i preciznost od 0, 99.
Izvorni jezik
Hrvatski
Znanstvena područja
Elektrotehnika
POVEZANOST RADA
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb
Profili:
Marin Vuković
(mentor)