Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 947639

Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib


Penić, Lucia
Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib, 2018., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb


CROSBI ID: 947639 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib
(Data mining in Apache Spark framework using MLlib library)

Autori
Penić, Lucia

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
06.07

Godina
2018

Stranica
27

Mentor
Jović, Alan

Ključne riječi
znanost o podacima, Spark ML, strojno uˇcenje, analiza podataka, obrada podataka, sluˇcajna šuma, DataFrame, RDD, veliki podaci, cjevovod, vrednovanje modela
(Data Science, Spark ML, machine learning, data analysis, data processing, Random Forest algorithm, DataFrame, RDD, Big Data, pipeline, model evaluation)

Sažetak
Količina informacija kojima smo okruženi eksponencijalno raste i s njom javlja se potreba za novim rješenjima na području znanosti o podacima. Kao jedno od rješenja, pojavio se Apache Spark, sa svojom izuzetno brzom jezgrom namijenjenoj za obradu velikih skupova podataka. Spark ujedinjuje nekoliko ugrađenih biblioteka koje je moguće međusobno kombinirati unutar jedne aplikacije. Ovaj rad fokusira se na korištenje MLliba, knjižice za strojno učenje, u procesu izvlačenja korisnih informacija iz velike količine podataka. Taj proces objašnjen je detaljno, počevši s uputama za instalaciju Apache Sparka, kratkim osvrtom na osnovne koncepte i naposljetku praktičnim primjerom izgradnje cjevovoda za strojno učenje te vrednovanjem rezultata koristeći MLlib.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Alan Jović (mentor)

Poveznice na cjeloviti tekst rada:

Pristup cjelovitom tekstu rada www.zemris.fer.hr

Citiraj ovu publikaciju:

Penić, Lucia
Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib, 2018., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
Penić, L. (2018) 'Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib', diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb.
@phdthesis{phdthesis, author = {Peni\'{c}, Lucia}, year = {2018}, pages = {27}, keywords = {znanost o podacima, Spark ML, strojno uˇcenje, analiza podataka, obrada podataka, sluˇcajna \v{s}uma, DataFrame, RDD, veliki podaci, cjevovod, vrednovanje modela}, title = {Dubinska analiza podataka u radnom okviru Apache Spark pomo\'{c}u knji\v{z}nice MLlib}, keyword = {znanost o podacima, Spark ML, strojno uˇcenje, analiza podataka, obrada podataka, sluˇcajna \v{s}uma, DataFrame, RDD, veliki podaci, cjevovod, vrednovanje modela}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Peni\'{c}, Lucia}, year = {2018}, pages = {27}, keywords = {Data Science, Spark ML, machine learning, data analysis, data processing, Random Forest algorithm, DataFrame, RDD, Big Data, pipeline, model evaluation}, title = {Data mining in Apache Spark framework using MLlib library}, keyword = {Data Science, Spark ML, machine learning, data analysis, data processing, Random Forest algorithm, DataFrame, RDD, Big Data, pipeline, model evaluation}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font