Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 830896

Personalizirano filtriranje toka s društvene mreže Twitter


Lovro Vidović
Personalizirano filtriranje toka s društvene mreže Twitter, 2016., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb


CROSBI ID: 830896 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Personalizirano filtriranje toka s društvene mreže Twitter
(Personalized Filtering of the Twitter Stream)

Autori
Lovro Vidović

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
05.07

Godina
2016

Stranica
46

Mentor
Pripužić, Krešimir

Ključne riječi
Lucene; Twitter; tweet; token; indeksiranje; pretraživanje teksta; Luke; aplikacija za pretraživanje; koeficijent sličnosti; Java
(Lucene; Twitter; tweet; token; indexing; text searching; Luke; search application; similarity coefficient; Java)

Sažetak
Lucene je jedan od najpoznatijih alata za pretraživanje teksta. Tijekom svog rada koristi dva teorijska modela pretraživanja: čisti Boolean model (engl. Pure Boolean model) i model vektorskog prostora (engl. Vector space model). Rad Lucenea se može podijeliti u dva osnovna dijela: indeksiranje teksta i pretraživanje koristeći stvorene indekse. Indeks je posebna struktura podataka koja omogućuje brzo pretraživanje tekstualnog sadržaja dokumenata. Prije samog procesa indeksiranja potrebno je obaviti analizu tekstualnog sadržaja dokumenta. Proces analize je postupak razdvajanja teksta na posebne jedinice, tokene. Svaki token predstavlja pojedinačnu riječ teksta. Uz tekst riječi koju predstavlja, token još sadrži i početak i kraj pozicije riječi u dokumentu (engl. offsets) te poziciju riječi u dokumentu. Prilikom pretraživanja računa se koeficijent sličnosti između upita kojeg čine unesene ključne riječi i tekstualnog sadržaja dokumenata. Kao rezultat procesa pretraživanja dobivaju se oni dokumenti koji su najsličniji ključnim riječima upita. Razvijena aplikacija omogućava personalizirano filtriranje toka s društvene mreže Twitter, određivanje onih javnih poruka koje su najsličnije korisnikovom unosu koristeći Javinu programsku knjižnicu Apache Lucene te isporuku filtriranih javnih poruka u korisnikov sandučić elektroničke pošte. Program se poziva periodički.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Krešimir Pripužić (mentor)

Poveznice na cjeloviti tekst rada:

Pristup cjelovitom tekstu rada

Citiraj ovu publikaciju:

Lovro Vidović
Personalizirano filtriranje toka s društvene mreže Twitter, 2016., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
Lovro Vidović (2016) 'Personalizirano filtriranje toka s društvene mreže Twitter', diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb.
@phdthesis{phdthesis, year = {2016}, pages = {46}, keywords = {Lucene, Twitter, tweet, token, indeksiranje, pretra\v{z}ivanje teksta, Luke, aplikacija za pretra\v{z}ivanje, koeficijent sli\v{c}nosti, Java}, title = {Personalizirano filtriranje toka s dru\v{s}tvene mre\v{z}e Twitter}, keyword = {Lucene, Twitter, tweet, token, indeksiranje, pretra\v{z}ivanje teksta, Luke, aplikacija za pretra\v{z}ivanje, koeficijent sli\v{c}nosti, Java}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, year = {2016}, pages = {46}, keywords = {Lucene, Twitter, tweet, token, indexing, text searching, Luke, search application, similarity coefficient, Java}, title = {Personalized Filtering of the Twitter Stream}, keyword = {Lucene, Twitter, tweet, token, indexing, text searching, Luke, search application, similarity coefficient, Java}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font