Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 736918

Izrada sustava za nadzor i praćenje ”Pig” upita korištenjem ”Big Data” tehnologija


Jukić, Ivan
Izrada sustava za nadzor i praćenje ”Pig” upita korištenjem ”Big Data” tehnologija, 2014., diplomski rad, diplomski, Fakultet elektrotehnike, strojarsva i brodogradnje, Split


CROSBI ID: 736918 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Izrada sustava za nadzor i praćenje ”Pig” upita korištenjem ”Big Data” tehnologija
(Design of system for control and monitoring ”Pig” queries using ”Big Data” technologies)

Autori
Jukić, Ivan

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski

Fakultet
Fakultet elektrotehnike, strojarsva i brodogradnje

Mjesto
Split

Datum
26.09

Godina
2014

Stranica
49

Mentor
Papić, Vladan

Ključne riječi
Big data; Hadoop; mapreduce; Apache Pig

Sažetak
Tema diplomskog rada je izrada sustava za nadzor i praćenje ”Pig” upita korištenjem ”Big Data” tehnologije. U prvom dijelu upoznajemo se se s povijesti Big Data tehnologije kao i mogućnosti koje nam donosi njena uporaba. Jedan od programa koji se koristi u Big data tehnologiji je Hadoop. Hadoop je open source rješenje koje je omogućilo pohranu i analizu onoga što se nekad zvalo ”smećem” podacima odnosno podacima nestrukturiranog ili polustrukturiranog oblika, dok su za Google ti „smeće“ podaci bili i još jesu osnova njihovog pametnog poslovnog modela. Hadoop se temelji se na paralelnoj obradi podataka (MapReduce) i distribuiranoj pohrani podataka (HDFS). Dijelovi HDFS- a su Name i Secondary Name čvor, a dio MapReduce-a je JobTracker i zajedno predstavljaju master dio. Osim mastera, arhitekturu Hadoop-a čini i slave dio, a njegove komponente su Data čvor i TaskTracker. Za izgradnju Hadoop klastera potrebna je ogromna količina računalnih resursa, pa je za potrebu diplomskog rada instaliran pseudo-distribuirani klaster sa jednim master i tri slave čvora koji simuliraju rad klastera nad ”Big Data” podacima. Sljedeći korak bio je instalacija Apache Pig-a. Pig je nastao kao istraživački projekt u Yahoo. Cilj razvoja Pig Latin-a je bio da se zauzme mjesto između dekleratinog stila SQL-a i i proceduralnog MapReduce-a kako bi u popunosti iskoristio sve mogućnosti koje mu Hadoop pruža. Prvo Pig izdanje dolazi u rujnu 2008 godine, a krajem godine diplomirao iz inkubatora i postao podprojekt Apache Hadoop-a. U Eclipse Juno programskoj razvojnoj okolini kreiran je plugin za učitavanje podataka u klaster, nakon čega se oni distribuiraju po čvorovima. Prednost instaliranog plugin-a je u tome da se podaci vrlo jednostavno mogu učitati na Hadoop, uz par klikova mišem, dok se bez plugin-a podaci unose naredbom preko konzole, a to zahtjeva puno više vremena. Također, kreiran je Pig projekt i u njemu klasa za kreiranje Pig Latin upita. Programska realizacija izvedena je u Java SE programskom jeziku. Pokretanjem Pig Latin upita dobiju se odgovarajući rezultati koji se također repliciraju u klasteru. Nakon uspješno dobivenih rezultata, tok obrade podataka po čvorovima se sprema u folder unutar klastera. Rezultat toka podataka je u obliku tekstualne datoteke. Kreirana je Java Swing aplikacija koja čita informacije iz tekstualne datoteke i prikazuje tok obrade po čvorovima, tj. na kojim čvorovima je izvršena MapReduce faza.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Ustanove:
Fakultet elektrotehnike, strojarstva i brodogradnje, Split

Profili:

Avatar Url Vladan Papić (mentor)


Citiraj ovu publikaciju:

Jukić, Ivan
Izrada sustava za nadzor i praćenje ”Pig” upita korištenjem ”Big Data” tehnologija, 2014., diplomski rad, diplomski, Fakultet elektrotehnike, strojarsva i brodogradnje, Split
Jukić, I. (2014) 'Izrada sustava za nadzor i praćenje ”Pig” upita korištenjem ”Big Data” tehnologija', diplomski rad, diplomski, Fakultet elektrotehnike, strojarsva i brodogradnje, Split.
@phdthesis{phdthesis, author = {Juki\'{c}, Ivan}, year = {2014}, pages = {49}, keywords = {Big data, Hadoop, mapreduce, Apache Pig}, title = {Izrada sustava za nadzor i pra\'{c}enje ”Pig” upita kori\v{s}tenjem ”Big Data” tehnologija}, keyword = {Big data, Hadoop, mapreduce, Apache Pig}, publisherplace = {Split} }
@phdthesis{phdthesis, author = {Juki\'{c}, Ivan}, year = {2014}, pages = {49}, keywords = {Big data, Hadoop, mapreduce, Apache Pig}, title = {Design of system for control and monitoring ”Pig” queries using ”Big Data” technologies}, keyword = {Big data, Hadoop, mapreduce, Apache Pig}, publisherplace = {Split} }




Contrast
Increase Font
Decrease Font
Dyslexic Font