Sustav za određivanje sličnosti PDF dokumenata (CROSBI ID 368155)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Jurina, Dino
Srbljić, Siniša
Budiselić, Ivan
hrvatski
Sustav za određivanje sličnosti PDF dokumenata
Napravljen je sustav koji se bavi usporedbom PDF dokumenata. Dokumenti se uspoređuju po principu svaki-sa-svakim, odnosno, svaki dokument iz skupa za provjeru će se usporediti sa svim ostalim dokumentima iz tog skupa. Mjera sličnosti dva dokumenta računa se na način da se svaku riječ iz prvog dokumenta usporedi sa njoj susjednim riječima iz drugog dokumenta, te se izračuna prosjek najveće mjere sličnosti između dviju riječi. Sličnost riječi računa se Levensteinovim i Jaro-Winklerovim algoritmom.
PDF; sličnost; Jaro-Winkler; Levenstein
nije evidentirano
engleski
A System for Determining Similarity Between PDF Documents
nije evidentirano
PDF; similarity; Jaro-Winkler; Levenstein
nije evidentirano
Podaci o izdanju
23
06.07.2011.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb