Raspodijeljeni modeli prostorno-vremenski ponderirane i grupirane regresije korištenjem platforme Apache Spark (CROSBI ID 448274)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Britvec, Darko
Pripužić, Krešimir
Katušić, Damjan
hrvatski
Raspodijeljeni modeli prostorno-vremenski ponderirane i grupirane regresije korištenjem platforme Apache Spark
Analiza i ekstrakcija znanja iz velikih prostorno- vremenskih skupova podataka sve su više zastupljeni kako u istraživačkim radovima tako i u stvarnim programskim rješenjima. U ovom radu analizirani su modeli strojnog učenja koji iskorištavaju postojanje prostorne i vremenske heterogenosti u podacima. U radu je implementiran raspodijeljeni model prostorno-vremenski ponderirane regresije (GTWR) korištenjem platforme Apache Spark. Arhitektura tog modela ne omogućava efektivnu stvarnovremensku obradu velikih skupova podataka u računalnom grozdu. Stoga je u radu predložen te implementiran raspodijeljeni model prostorno-vremenski grupirane regresije (GTCR) koji umjesto postupka ponderiranja koristi algoritam grupiranja kako bi opisao prostornu i vremensku nestacionarnost podataka. Naposljetku, modeli su isprobani i uspoređeni na stvarnom skupu podataka koji opisuje koncentracije najučestalijih onečišćivača zraka sa 12 mjernih postaja u Pekingu kroz period od 2013. do 2017. godine.
prostorno-vremenska analiza ; prostorno-vremenski ponderirana regresija ; prostorno-vremenski grupirana regresija ; raspodijeljena obrada velikih skupova podataka ; Apache Spark
nije evidentirano
engleski
Distributed Models of Geo-Temporal Weighted and Clustered Regression using Apache Spark
nije evidentirano
spatio-temporal analysis ; Geo-Temporally Weighted Regression ; Geo-Temporally Clustered Regression ; distributed big data computing ; Apache Spark
nije evidentirano
Podaci o izdanju
70
09.07.2021.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb