Indeksiranje velikih kolekcija dokumenata u grozdu računala

Antonić, Aleksandar

izvor podataka: crosbi !

Indeksiranje velikih kolekcija dokumenata u grozdu računala (CROSBI ID 372224)

Ocjenski rad | sveučilišni preddiplomski završni rad

Antonić, Aleksandar Indeksiranje velikih kolekcija dokumenata u grozdu računala / Podnar Žarko, Ivana (mentor); Zagreb, Fakultet elektrotehnike i računarstva, . 2009

Podaci o odgovornosti

Autori

Antonić, Aleksandar

Mentori

Podnar Žarko, Ivana

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

hrvatski

Naslov

Indeksiranje velikih kolekcija dokumenata u grozdu računala

Sažetak

Pretraživanje je proces pronalaska traženih dokumenata iz ulazne kolekcije. Postoje dva modela pretraživanja, Booleov model i prostorno vektorski model, u praksi se koristi samo prostorno vektorski model. Tražilice izrañuju indeks kolekcije dokumenata te pomoću njega pretražuju. MapReduce je tehnologija koja olakšava procesiranje i kreiranje velikih kolekcija dokumenata. Tehnologija se zasniva na dva procesa, map i reduce, gdje je izlaz map procesa ulaz u reduce proces. MapReduce tehnologija se koristi paralelizmom u svom radu, te postiže vrlo dobre rezultate u distribuiranim sustavima. Hadoop je programski okvir nastao na temeljima MapReduce tehnologije, koji korisnicima omogućava jednostavno pisanje distribuiranih aplikacija. Korisnici Hadoopa ne moraju brinuti oko koordinacije poslova i distribucije podataka. Tražilica Nutch se koristi Hadoopom prilikom rada u distribuiranom načinu. Testovima je pokazano da se porastom broja čvorova znatno smanjuje vrijeme obrade podataka, tj. vrijeme indeksiranja.

Ključne riječi

pretraživanje sadržaja; MapReduce; Nutch; Hadoop

Napomena

nije evidentirano

Jezik

engleski

Naslov

Indexing large document collections in computer cluster

Sažetak

nije evidentirano

Ključne riječi

information retrieval; MapReduce; Nutch; Hadoop

Napomena

nije evidentirano

Podaci o izdanju

Broj stranica

Datum obrane

17.07.2009.

Status objave rada

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Ustanova / Organizacija

Fakultet elektrotehnike i računarstva

Mjesto

Zagreb

Povezanost rada

Povezane osobe

Ivana Podnar Žarko (mentor/i)

Povezane ustanove

Fakultet elektrotehnike i računarstva (036) (autorova ustanova)

Povezani projekti

Isporuka sadržaja i pokretljivost korisnika i usluga u mrežama nove generacije (rezultat rada na projektu)

Područje

Računarstvo