Otkrivanje sličnih poruka elektroničke pošte primjenom algoritama sažimanja neosjetljivog na lokalne promjene (CROSBI ID 402312)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Kolobara, Bernard
Srbljić, Siniša
Šilić, Marin
hrvatski
Otkrivanje sličnih poruka elektroničke pošte primjenom algoritama sažimanja neosjetljivog na lokalne promjene
Rad opisuje različite porodice algoritama sažimanja neosjetljivog na lokalne promjene. Opisane su implementacije MinHash, SimHash, Kosinus i Nilsimsa porodica. Poseban naglasak je stavljen na otkrivanje sličnih poruka elektroničke pošte korištenjem LSH algoritama. Ispitana je kvaliteta različitih porodica LSH algoritama sa obzirom na parametre algoritama. Zbog velike količine poruka potrebnih za analizu, u radu je opisan postupak dohvata i spremanja poruka sa javno dostupnih grupa i Stack Exchange stranica.
sličnost; elektronička pošta; algoritam; sažimanje neosjetljiv na lokalne promjene; kosinus sličnost; simHash; minHash; Nilsimsa
nije evidentirano
engleski
Finding similar mail conversations using locality sensitive hashing
nije evidentirano
similarity; email; algorithm; locality sensitive hashing; cosine similarity; simHash; minHash; Nilsimsa
nije evidentirano
Podaci o izdanju
42
16.02.2016.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb