Personalizirano filtriranje toka s društvene mreže Twitter (CROSBI ID 405398)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Lovro Vidović
Pripužić, Krešimir
hrvatski
Personalizirano filtriranje toka s društvene mreže Twitter
Lucene je jedan od najpoznatijih alata za pretraživanje teksta. Tijekom svog rada koristi dva teorijska modela pretraživanja: čisti Boolean model (engl. Pure Boolean model) i model vektorskog prostora (engl. Vector space model). Rad Lucenea se može podijeliti u dva osnovna dijela: indeksiranje teksta i pretraživanje koristeći stvorene indekse. Indeks je posebna struktura podataka koja omogućuje brzo pretraživanje tekstualnog sadržaja dokumenata. Prije samog procesa indeksiranja potrebno je obaviti analizu tekstualnog sadržaja dokumenta. Proces analize je postupak razdvajanja teksta na posebne jedinice, tokene. Svaki token predstavlja pojedinačnu riječ teksta. Uz tekst riječi koju predstavlja, token još sadrži i početak i kraj pozicije riječi u dokumentu (engl. offsets) te poziciju riječi u dokumentu. Prilikom pretraživanja računa se koeficijent sličnosti između upita kojeg čine unesene ključne riječi i tekstualnog sadržaja dokumenata. Kao rezultat procesa pretraživanja dobivaju se oni dokumenti koji su najsličniji ključnim riječima upita. Razvijena aplikacija omogućava personalizirano filtriranje toka s društvene mreže Twitter, određivanje onih javnih poruka koje su najsličnije korisnikovom unosu koristeći Javinu programsku knjižnicu Apache Lucene te isporuku filtriranih javnih poruka u korisnikov sandučić elektroničke pošte. Program se poziva periodički.
Lucene; Twitter; tweet; token; indeksiranje; pretraživanje teksta; Luke; aplikacija za pretraživanje; koeficijent sličnosti; Java
nije evidentirano
engleski
Personalized Filtering of the Twitter Stream
nije evidentirano
Lucene; Twitter; tweet; token; indexing; text searching; Luke; search application; similarity coefficient; Java
nije evidentirano
Podaci o izdanju
46
05.07.2016.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb