Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 579417

Indeksiranje velikih kolekcija dokumenata u grozdu računala


Antonić, Aleksandar
Indeksiranje velikih kolekcija dokumenata u grozdu računala, 2009., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb


CROSBI ID: 579417 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Indeksiranje velikih kolekcija dokumenata u grozdu računala
(Indexing large document collections in computer cluster)

Autori
Antonić, Aleksandar

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
17.07

Godina
2009

Stranica
42

Mentor
Podnar Žarko, Ivana

Ključne riječi
pretraživanje sadržaja; MapReduce; Nutch; Hadoop
(information retrieval; MapReduce; Nutch; Hadoop)

Sažetak
Pretraživanje je proces pronalaska traženih dokumenata iz ulazne kolekcije. Postoje dva modela pretraživanja, Booleov model i prostorno vektorski model, u praksi se koristi samo prostorno vektorski model. Tražilice izrañuju indeks kolekcije dokumenata te pomoću njega pretražuju. MapReduce je tehnologija koja olakšava procesiranje i kreiranje velikih kolekcija dokumenata. Tehnologija se zasniva na dva procesa, map i reduce, gdje je izlaz map procesa ulaz u reduce proces. MapReduce tehnologija se koristi paralelizmom u svom radu, te postiže vrlo dobre rezultate u distribuiranim sustavima. Hadoop je programski okvir nastao na temeljima MapReduce tehnologije, koji korisnicima omogućava jednostavno pisanje distribuiranih aplikacija. Korisnici Hadoopa ne moraju brinuti oko koordinacije poslova i distribucije podataka. Tražilica Nutch se koristi Hadoopom prilikom rada u distribuiranom načinu. Testovima je pokazano da se porastom broja čvorova znatno smanjuje vrijeme obrade podataka, tj. vrijeme indeksiranja.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Projekti:
036-0362027-1639 - Isporuka sadržaja i pokretljivost korisnika i usluga u mrežama nove generacije (Matijašević, Maja, MZO ) ( CroRIS)

Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Ivana Podnar Žarko (mentor)


Citiraj ovu publikaciju:

Antonić, Aleksandar
Indeksiranje velikih kolekcija dokumenata u grozdu računala, 2009., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
Antonić, A. (2009) 'Indeksiranje velikih kolekcija dokumenata u grozdu računala', diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb.
@phdthesis{phdthesis, author = {Antoni\'{c}, Aleksandar}, year = {2009}, pages = {42}, keywords = {pretra\v{z}ivanje sadr\v{z}aja, MapReduce, Nutch, Hadoop}, title = {Indeksiranje velikih kolekcija dokumenata u grozdu ra\v{c}unala}, keyword = {pretra\v{z}ivanje sadr\v{z}aja, MapReduce, Nutch, Hadoop}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Antoni\'{c}, Aleksandar}, year = {2009}, pages = {42}, keywords = {information retrieval, MapReduce, Nutch, Hadoop}, title = {Indexing large document collections in computer cluster}, keyword = {information retrieval, MapReduce, Nutch, Hadoop}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font