Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 1015078

Filtriranje geoprostornog toka podataka korištenjem platforme Apache Spark


Britvec, Darko
Filtriranje geoprostornog toka podataka korištenjem platforme Apache Spark, 2019., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb


CROSBI ID: 1015078 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Filtriranje geoprostornog toka podataka korištenjem platforme Apache Spark
(Filtering of Geospatial Data Streams using Apache Spark Platform)

Autori
Britvec, Darko

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
08.07

Godina
2019

Stranica
45

Mentor
Pripužić, Krešimir

Neposredni voditelj
Katušić, Damjan

Ključne riječi
raspodijeljeni sustav ; Apache Spark ; objavi-pretplati ; geoprostorni tok ; GeoJSON ; Apache Kafka ; Spark Streaming ; GeoSpark ; Java Topology Suite ; Geotools ; particioniranje ; Hilbertova krivulja ; Voronoijev dijagram ; R-stablo ; Q-stablo ; KDB-stablo ; prostorni indeks
(distributed system ; Apache Spark ; publish-subscribe ; geospatial data stream ; GeoJSON ; Apache Kafka ; Spark Streaming ; GeoSpark ; Java Topology Suite ; Geotools ; partitioning ; Hilbert curve ; Voronoi diagram ; R-tree, Q-tree ; KDB-tree ; geospatial index)

Sažetak
Cilj ovog rada je stvaranje učinkovitog raspodijeljenog sustava za filtriranje geoprostornog toka podataka korištenjem platforme Apache Spark. Arhitektura korištena u implementaciji programskog rješenja naziva se „objavi-pretplati“. Objave u sustavu predstavljaju poruke formata GeoJSON koje sadrže geoprostornu značajku (točku, liniju, poligon) te dodatne informacije. Pretplate u sustavu predstavljaju poligoni u prostoru uz koje vežemo dodatne značajke. Tok podataka implementiran je pomoću alata Apache Kafka. Za konzumaciju toka podataka koristi se Spark Streaming koji tok obrađuje u dijelovima koji se mogu primiti u određenom vremenskom intervalu (engl. micro-batch). Za filtriranje geoprostornih podataka korištena je programska knjižnica GeoSpark koja dodatno koristi knjižnice Java Topology Suite i Geotools. Učinkovito filtriranje prostornih podataka ostvareno je pomoću particioniranja skupa pretplata pomoću različitih strategija particioniranja. Izlaz sustava je poruka u formatu JSON koja sadrži identifikator objave i pripadne pretplate. U evaluaciji rješenja isprobane su strategije particioniranja pomoću Hilbertove krivulje, KDB-stabla, Q-stabla i R-stabla. Dodatno, za poboljšanje rezultata ispitano je i korištenje geoprostornih indeksa ostvarenih pomoću R-stabla i Q-stabla. U evaluaciji je također ispitan utjecaj korištenja pričuvne memorije za spremanje skupa pretplata.

Izvorni jezik
Hrvatski

Znanstvena područja
Elektrotehnika, Računarstvo



POVEZANOST RADA


Projekti:
HRZZ-UIP-2017-05-9066 - Učinkovita stvarnovremenska obrada brzih geoprostornih podataka (RETROFIT) (Pripužić, Krešimir, HRZZ ) ( CroRIS)

Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Damjan Katušić (mentor)

Avatar Url Krešimir Pripužić (mentor)

Poveznice na cjeloviti tekst rada:

Pristup cjelovitom tekstu rada

Citiraj ovu publikaciju:

Britvec, Darko
Filtriranje geoprostornog toka podataka korištenjem platforme Apache Spark, 2019., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
Britvec, D. (2019) 'Filtriranje geoprostornog toka podataka korištenjem platforme Apache Spark', diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb.
@phdthesis{phdthesis, author = {Britvec, Darko}, year = {2019}, pages = {45}, keywords = {raspodijeljeni sustav, Apache Spark, objavi-pretplati, geoprostorni tok, GeoJSON, Apache Kafka, Spark Streaming, GeoSpark, Java Topology Suite, Geotools, particioniranje, Hilbertova krivulja, Voronoijev dijagram, R-stablo, Q-stablo, KDB-stablo, prostorni indeks}, title = {Filtriranje geoprostornog toka podataka kori\v{s}tenjem platforme Apache Spark}, keyword = {raspodijeljeni sustav, Apache Spark, objavi-pretplati, geoprostorni tok, GeoJSON, Apache Kafka, Spark Streaming, GeoSpark, Java Topology Suite, Geotools, particioniranje, Hilbertova krivulja, Voronoijev dijagram, R-stablo, Q-stablo, KDB-stablo, prostorni indeks}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Britvec, Darko}, year = {2019}, pages = {45}, keywords = {distributed system, Apache Spark, publish-subscribe, geospatial data stream, GeoJSON, Apache Kafka, Spark Streaming, GeoSpark, Java Topology Suite, Geotools, partitioning, Hilbert curve, Voronoi diagram, R-tree, Q-tree, KDB-tree, geospatial index}, title = {Filtering of Geospatial Data Streams using Apache Spark Platform}, keyword = {distributed system, Apache Spark, publish-subscribe, geospatial data stream, GeoJSON, Apache Kafka, Spark Streaming, GeoSpark, Java Topology Suite, Geotools, partitioning, Hilbert curve, Voronoi diagram, R-tree, Q-tree, KDB-tree, geospatial index}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font