Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 1204578

Upotreba tehnologija za raspodijeljenu obradu velikih količina podataka u knjigovodstvu


Pažanin, Filip
Upotreba tehnologija za raspodijeljenu obradu velikih količina podataka u knjigovodstvu, 2022., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb


CROSBI ID: 1204578 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Upotreba tehnologija za raspodijeljenu obradu velikih količina podataka u knjigovodstvu
(Big data technologies in bookkeeping)

Autori
Pažanin, Filip

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
06.07

Godina
2022

Stranica
34

Mentor
Jović, Alan

Ključne riječi
veliki podaci ; knjigovodstvo ; računalni grozd ; Hadoop ; YARN ; Spark ; Parquet ; testiranje performansi ; paralelizacija
(big data ; bookkeeping ; computer cluster ; Hadoop ; YARN ; Spark ; Parquet ; performance testing ; parallelization)

Sažetak
U tvrtki APIS IT zadatak je bilo smanjiti vrijeme potrebno za knjigovodstvenu obradu podataka. Podatci su bili veličine nekoliko gigabajta te se obrada trebala prevesti na paralelnu paradigmu i zatim pokrenuti na računalnom grozdu. Grozd je imao resurse nekolicine osrednjih stolnih računala. Proučavanjem tehnologija velikih količina podataka kao što su HDFS, YARN, Spark i Parquet zadatak je uspješno izvršen te se upotrebom niti polovice resursa dostupnog računalnog grozda smanjilo vrijeme obrade za 5 puta. U radu su opisane sve gore navedene tehnologije te su detaljno prikazani rezultati ispitivanja raznih konfiguracija obrade podataka na računalnom grozdu. Neke od konfiguracija odabrane su kao optimalne, a taj je izbor obrazložen u radu.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Alan Jović (mentor)

Poveznice na cjeloviti tekst rada:

Pristup cjelovitom tekstu rada www.zemris.fer.hr

Citiraj ovu publikaciju:

Pažanin, Filip
Upotreba tehnologija za raspodijeljenu obradu velikih količina podataka u knjigovodstvu, 2022., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
Pažanin, F. (2022) 'Upotreba tehnologija za raspodijeljenu obradu velikih količina podataka u knjigovodstvu', diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb.
@phdthesis{phdthesis, author = {Pa\v{z}anin, Filip}, year = {2022}, pages = {34}, keywords = {veliki podaci, knjigovodstvo, ra\v{c}unalni grozd, Hadoop, YARN, Spark, Parquet, testiranje performansi, paralelizacija}, title = {Upotreba tehnologija za raspodijeljenu obradu velikih koli\v{c}ina podataka u knjigovodstvu}, keyword = {veliki podaci, knjigovodstvo, ra\v{c}unalni grozd, Hadoop, YARN, Spark, Parquet, testiranje performansi, paralelizacija}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Pa\v{z}anin, Filip}, year = {2022}, pages = {34}, keywords = {big data, bookkeeping, computer cluster, Hadoop, YARN, Spark, Parquet, performance testing, parallelization}, title = {Big data technologies in bookkeeping}, keyword = {big data, bookkeeping, computer cluster, Hadoop, YARN, Spark, Parquet, performance testing, parallelization}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font