Napredna pretraga

Pregled bibliografske jedinice broj: 805261

Otkrivanje sličnih poruka elektroničke pošte primjenom algoritama sažimanja neosjetljivog na lokalne promjene


Kolobara, Bernard
Otkrivanje sličnih poruka elektroničke pošte primjenom algoritama sažimanja neosjetljivog na lokalne promjene 2016., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb


Naslov
Otkrivanje sličnih poruka elektroničke pošte primjenom algoritama sažimanja neosjetljivog na lokalne promjene
(Finding similar mail conversations using locality sensitive hashing)

Autori
Kolobara, Bernard

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
16.02.

Godina
2016

Stranica
42

Mentor
Srbljić, Siniša

Neposredni voditelj
Šilić, Marin

Ključne riječi
Sličnost; elektronička pošta; algoritam; sažimanje neosjetljiv na lokalne promjene; kosinus sličnost; simHash; minHash; Nilsimsa
(Similarity; email; algorithm; locality sensitive hashing; cosine similarity; simHash; minHash; Nilsimsa)

Sažetak
Rad opisuje različite porodice algoritama sažimanja neosjetljivog na lokalne promjene. Opisane su implementacije MinHash, SimHash, Kosinus i Nilsimsa porodica. Poseban naglasak je stavljen na otkrivanje sličnih poruka elektroničke pošte korištenjem LSH algoritama. Ispitana je kvaliteta različitih porodica LSH algoritama sa obzirom na parametre algoritama. Zbog velike količine poruka potrebnih za analizu, u radu je opisan postupak dohvata i spremanja poruka sa javno dostupnih grupa i Stack Exchange stranica.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Projekt / tema
036-0362980-1921 - Računalne okoline za sveprisutne raspodijeljene sustave (Siniša Srbljić, )

Ustanove
Fakultet elektrotehnike i računarstva, Zagreb