Pregled bibliografske jedinice broj: 544347
Sustav za određivanje sličnosti PDF dokumenata
Sustav za određivanje sličnosti PDF dokumenata, 2011., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 544347 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Sustav za određivanje sličnosti PDF dokumenata
(A System for Determining Similarity Between PDF Documents)
Autori
Jurina, Dino
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
06.07
Godina
2011
Stranica
23
Mentor
Srbljić, Siniša
Neposredni voditelj
Budiselić, Ivan
Ključne riječi
PDF; sličnost; Jaro-Winkler; Levenstein
(PDF; similarity; Jaro-Winkler; Levenstein)
Sažetak
Napravljen je sustav koji se bavi usporedbom PDF dokumenata. Dokumenti se uspoređuju po principu svaki-sa-svakim, odnosno, svaki dokument iz skupa za provjeru će se usporediti sa svim ostalim dokumentima iz tog skupa. Mjera sličnosti dva dokumenta računa se na način da se svaku riječ iz prvog dokumenta usporedi sa njoj susjednim riječima iz drugog dokumenta, te se izračuna prosjek najveće mjere sličnosti između dviju riječi. Sličnost riječi računa se Levensteinovim i Jaro-Winklerovim algoritmom.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-0362980-1921 - Računalne okoline za sveprisutne raspodijeljene sustave (Srbljić, Siniša, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb