Pretraživanje tekstualnih kolekcija dokumenata u stvarnom vremenu (CROSBI ID 364976)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Dragoljević, Renata
Podnar Žarko, Ivana
hrvatski
Pretraživanje tekstualnih kolekcija dokumenata u stvarnom vremenu
Pretraživanje u stvarnom vremenu važno je podruĉje u pretraživanju informacija i ubrzano se razvija. U ovom radu opisana su obilježja pretraživanja u stvarnom vremenu i izvršena je usporedba s obilježjima klasiĉnih tražilica. Na temelju opisanih karakteristika izraĊena je aplikacija za pretraživanje u stvarnom vremenu koja pretražuje kolekciju dokumenata s web stranice Wikipedia. Rezultati korištenja implementirane tražilice pokazali su da se rangovi dokumenata u odgovoru mijenjaju kako se u indeks kolekcije dodaje sve više dokumenata, a prve promjene zamjetne su nakon 10% novih dokumenata u kolekciji. Kada se istovremeno dokumenti dodaju u indeks i brišu iz indeksa rangovi dokumenata isporuĉenih korisniku mijenjaju se sa svakim novim dokumentom dodanim u indeks koji sadrži rijeĉi iz upita budući da novi dokumenti imaju prednost nad starima. Reindeksiranje kolekcije potrebno je provesti nakon 50% dokumenata dodanih, odnosno obrisanih iz indeksa.
pretraživanje u stvarnom vremenu; pretraživanje informacija; indeksiranje
nije evidentirano
engleski
Real-time search over textual data collections
nije evidentirano
real time search; information retrieval; indexing
nije evidentirano
Podaci o izdanju
41
13.06.2011.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb