Pregled bibliografske jedinice broj: 947639
Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib
Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib, 2018., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 947639 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib
(Data mining in Apache Spark framework using MLlib library)
Autori
Penić, Lucia
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
06.07
Godina
2018
Stranica
27
Mentor
Jović, Alan
Ključne riječi
znanost o podacima, Spark ML, strojno uˇcenje, analiza podataka, obrada podataka, sluˇcajna šuma, DataFrame, RDD, veliki podaci, cjevovod, vrednovanje modela
(Data Science, Spark ML, machine learning, data analysis, data processing, Random Forest algorithm, DataFrame, RDD, Big Data, pipeline, model evaluation)
Sažetak
Količina informacija kojima smo okruženi eksponencijalno raste i s njom javlja se potreba za novim rješenjima na području znanosti o podacima. Kao jedno od rješenja, pojavio se Apache Spark, sa svojom izuzetno brzom jezgrom namijenjenoj za obradu velikih skupova podataka. Spark ujedinjuje nekoliko ugrađenih biblioteka koje je moguće međusobno kombinirati unutar jedne aplikacije. Ovaj rad fokusira se na korištenje MLliba, knjižice za strojno učenje, u procesu izvlačenja korisnih informacija iz velike količine podataka. Taj proces objašnjen je detaljno, počevši s uputama za instalaciju Apache Sparka, kratkim osvrtom na osnovne koncepte i naposljetku praktičnim primjerom izgradnje cjevovoda za strojno učenje te vrednovanjem rezultata koristeći MLlib.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb
Profili:
Alan Jović
(mentor)