Pregled bibliografske jedinice broj: 1204578
Upotreba tehnologija za raspodijeljenu obradu velikih količina podataka u knjigovodstvu
Upotreba tehnologija za raspodijeljenu obradu velikih količina podataka u knjigovodstvu, 2022., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 1204578 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Upotreba tehnologija za raspodijeljenu obradu
velikih količina podataka u knjigovodstvu
(Big data technologies in bookkeeping)
Autori
Pažanin, Filip
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
06.07
Godina
2022
Stranica
34
Mentor
Jović, Alan
Ključne riječi
veliki podaci ; knjigovodstvo ; računalni grozd ; Hadoop ; YARN ; Spark ; Parquet ; testiranje performansi ; paralelizacija
(big data ; bookkeeping ; computer cluster ; Hadoop ; YARN ; Spark ; Parquet ; performance testing ; parallelization)
Sažetak
U tvrtki APIS IT zadatak je bilo smanjiti vrijeme potrebno za knjigovodstvenu obradu podataka. Podatci su bili veličine nekoliko gigabajta te se obrada trebala prevesti na paralelnu paradigmu i zatim pokrenuti na računalnom grozdu. Grozd je imao resurse nekolicine osrednjih stolnih računala. Proučavanjem tehnologija velikih količina podataka kao što su HDFS, YARN, Spark i Parquet zadatak je uspješno izvršen te se upotrebom niti polovice resursa dostupnog računalnog grozda smanjilo vrijeme obrade za 5 puta. U radu su opisane sve gore navedene tehnologije te su detaljno prikazani rezultati ispitivanja raznih konfiguracija obrade podataka na računalnom grozdu. Neke od konfiguracija odabrane su kao optimalne, a taj je izbor obrazložen u radu.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb
Profili:
Alan Jović
(mentor)