Upotreba tehnologija za raspodijeljenu obradu velikih količina podataka u knjigovodstvu (CROSBI ID 450553)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Pažanin, Filip
Jović, Alan
hrvatski
Upotreba tehnologija za raspodijeljenu obradu velikih količina podataka u knjigovodstvu
U tvrtki APIS IT zadatak je bilo smanjiti vrijeme potrebno za knjigovodstvenu obradu podataka. Podatci su bili veličine nekoliko gigabajta te se obrada trebala prevesti na paralelnu paradigmu i zatim pokrenuti na računalnom grozdu. Grozd je imao resurse nekolicine osrednjih stolnih računala. Proučavanjem tehnologija velikih količina podataka kao što su HDFS, YARN, Spark i Parquet zadatak je uspješno izvršen te se upotrebom niti polovice resursa dostupnog računalnog grozda smanjilo vrijeme obrade za 5 puta. U radu su opisane sve gore navedene tehnologije te su detaljno prikazani rezultati ispitivanja raznih konfiguracija obrade podataka na računalnom grozdu. Neke od konfiguracija odabrane su kao optimalne, a taj je izbor obrazložen u radu.
veliki podaci ; knjigovodstvo ; računalni grozd ; Hadoop ; YARN ; Spark ; Parquet ; testiranje performansi ; paralelizacija
nije evidentirano
engleski
Big data technologies in bookkeeping
nije evidentirano
big data ; bookkeeping ; computer cluster ; Hadoop ; YARN ; Spark ; Parquet ; performance testing ; parallelization
nije evidentirano
Podaci o izdanju
34
06.07.2022.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb