Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib

Penić, Lucia

Pregled bibliografske jedinice broj: 947639

Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib

Penić, Lucia

Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib, 2018., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb

CROSBI ID: 947639 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib
(Data mining in Apache Spark framework using MLlib library)

Autori
Penić, Lucia

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
06.07

Godina
2018

Stranica
27

Mentor
Jović, Alan

Ključne riječi
znanost o podacima, Spark ML, strojno uˇcenje, analiza podataka, obrada podataka, sluˇcajna šuma, DataFrame, RDD, veliki podaci, cjevovod, vrednovanje modela
(Data Science, Spark ML, machine learning, data analysis, data processing, Random Forest algorithm, DataFrame, RDD, Big Data, pipeline, model evaluation)

Sažetak
Količina informacija kojima smo okruženi eksponencijalno raste i s njom javlja se potreba za novim rješenjima na području znanosti o podacima. Kao jedno od rješenja, pojavio se Apache Spark, sa svojom izuzetno brzom jezgrom namijenjenoj za obradu velikih skupova podataka. Spark ujedinjuje nekoliko ugrađenih biblioteka koje je moguće međusobno kombinirati unutar jedne aplikacije. Ovaj rad fokusira se na korištenje MLliba, knjižice za strojno učenje, u procesu izvlačenja korisnih informacija iz velike količine podataka. Taj proces objašnjen je detaljno, počevši s uputama za instalaciju Apache Sparka, kratkim osvrtom na osnovne koncepte i naposljetku praktičnim primjerom izgradnje cjevovoda za strojno učenje te vrednovanjem rezultata koristeći MLlib.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo

POVEZANOST RADA

Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Alan Jović (mentor)

Poveznice na cjeloviti tekst rada:

Pristup cjelovitom tekstu rada www.zemris.fer.hr

CROSBI Hrvatska znanstvena bibliografija

Pregled bibliografske jedinice broj: 947639

Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib

Poveznice na cjeloviti tekst rada:

Citiraj ovu publikaciju:

Pregled bibliografske jedinice broj: 947639

Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib

Poveznice na cjeloviti tekst rada:

Citiraj ovu publikaciju:

Podijeli: