Pregled bibliografske jedinice broj: 1183372
Raspodijeljeni modeli prostorno-vremenski ponderirane i grupirane regresije korištenjem platforme Apache Spark
Raspodijeljeni modeli prostorno-vremenski ponderirane i grupirane regresije korištenjem platforme Apache Spark, 2021., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 1183372 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Raspodijeljeni modeli prostorno-vremenski
ponderirane i grupirane regresije korištenjem
platforme Apache Spark
(Distributed Models of Geo-Temporal Weighted and
Clustered Regression using Apache Spark)
Autori
Britvec, Darko
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
09.07
Godina
2021
Stranica
70
Mentor
Pripužić, Krešimir
Neposredni voditelj
Katušić, Damjan
Ključne riječi
prostorno-vremenska analiza ; prostorno-vremenski ponderirana regresija ; prostorno-vremenski grupirana regresija ; raspodijeljena obrada velikih skupova podataka ; Apache Spark
(spatio-temporal analysis ; Geo-Temporally Weighted Regression ; Geo-Temporally Clustered Regression ; distributed big data computing ; Apache Spark)
Sažetak
Analiza i ekstrakcija znanja iz velikih prostorno- vremenskih skupova podataka sve su više zastupljeni kako u istraživačkim radovima tako i u stvarnim programskim rješenjima. U ovom radu analizirani su modeli strojnog učenja koji iskorištavaju postojanje prostorne i vremenske heterogenosti u podacima. U radu je implementiran raspodijeljeni model prostorno-vremenski ponderirane regresije (GTWR) korištenjem platforme Apache Spark. Arhitektura tog modela ne omogućava efektivnu stvarnovremensku obradu velikih skupova podataka u računalnom grozdu. Stoga je u radu predložen te implementiran raspodijeljeni model prostorno-vremenski grupirane regresije (GTCR) koji umjesto postupka ponderiranja koristi algoritam grupiranja kako bi opisao prostornu i vremensku nestacionarnost podataka. Naposljetku, modeli su isprobani i uspoređeni na stvarnom skupu podataka koji opisuje koncentracije najučestalijih onečišćivača zraka sa 12 mjernih postaja u Pekingu kroz period od 2013. do 2017. godine.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
HRZZ-UIP-2017-05-9066 - Učinkovita stvarnovremenska obrada brzih geoprostornih podataka (RETROFIT) (Pripužić, Krešimir, HRZZ ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb