Pregled bibliografske jedinice broj: 805261
Otkrivanje sličnih poruka elektroničke pošte primjenom algoritama sažimanja neosjetljivog na lokalne promjene
Otkrivanje sličnih poruka elektroničke pošte primjenom algoritama sažimanja neosjetljivog na lokalne promjene, 2016., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 805261 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Otkrivanje sličnih poruka elektroničke pošte primjenom algoritama sažimanja neosjetljivog na lokalne promjene
(Finding similar mail conversations using locality sensitive hashing)
Autori
Kolobara, Bernard
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
16.02
Godina
2016
Stranica
42
Mentor
Srbljić, Siniša
Neposredni voditelj
Šilić, Marin
Ključne riječi
sličnost; elektronička pošta; algoritam; sažimanje neosjetljiv na lokalne promjene; kosinus sličnost; simHash; minHash; Nilsimsa
(similarity; email; algorithm; locality sensitive hashing; cosine similarity; simHash; minHash; Nilsimsa)
Sažetak
Rad opisuje različite porodice algoritama sažimanja neosjetljivog na lokalne promjene. Opisane su implementacije MinHash, SimHash, Kosinus i Nilsimsa porodica. Poseban naglasak je stavljen na otkrivanje sličnih poruka elektroničke pošte korištenjem LSH algoritama. Ispitana je kvaliteta različitih porodica LSH algoritama sa obzirom na parametre algoritama. Zbog velike količine poruka potrebnih za analizu, u radu je opisan postupak dohvata i spremanja poruka sa javno dostupnih grupa i Stack Exchange stranica.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-0362980-1921 - Računalne okoline za sveprisutne raspodijeljene sustave (Srbljić, Siniša, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb