Postupak usporedbe web stranica na temelju strukture (CROSBI ID 355209)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Hranj, Zoran
Dalbelo Bašić, Bojana
Šnajder, Jan
hrvatski
Postupak usporedbe web stranica na temelju strukture
Usporedba dokumenata na temelju strukture nalazi primjenu u mnogim zadacima dubinske analize teksta i pretraživanja informacija. Prilikom automatskog pobiranja dokumenata s web sjedišta, usporedbom strukture dokumenata moguće je identificirati tipski srodne no sadržajno različite dokumente. U okviru rada proučeni su različiti postupci za izračunavanje sličnosti HTML dokumenata na temelju strukture. Razvijena je programska implementacija takvog postupka pogodna za ugradnju u pobirač dokumenata s web sjedišta. Postupak se temelji na prikazu HTML dokumenata višedimenzionalnim vektorima te težinskom bodovanju pojedinih HTML oznaka.
sličnost dokumenata; struktura dokumenata; vektorski prostor; HTML oznake
nije evidentirano
engleski
Structure-Based Web Page Comparison Algorithm
nije evidentirano
document similarity; document structure; vector space; HTML oznake
nije evidentirano
Podaci o izdanju
30
15.07.2009.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb