Pregled bibliografske jedinice broj: 425106
Postupak usporedbe web stranica na temelju strukture
Postupak usporedbe web stranica na temelju strukture, 2009., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 425106 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Postupak usporedbe web stranica na temelju strukture
(Structure-Based Web Page Comparison Algorithm)
Autori
Hranj, Zoran
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
15.07
Godina
2009
Stranica
30
Mentor
Dalbelo Bašić, Bojana
Neposredni voditelj
Šnajder, Jan
Ključne riječi
sličnost dokumenata; struktura dokumenata; vektorski prostor; HTML oznake
(document similarity; document structure; vector space; HTML oznake)
Sažetak
Usporedba dokumenata na temelju strukture nalazi primjenu u mnogim zadacima dubinske analize teksta i pretraživanja informacija. Prilikom automatskog pobiranja dokumenata s web sjedišta, usporedbom strukture dokumenata moguće je identificirati tipski srodne no sadržajno različite dokumente. U okviru rada proučeni su različiti postupci za izračunavanje sličnosti HTML dokumenata na temelju strukture. Razvijena je programska implementacija takvog postupka pogodna za ugradnju u pobirač dokumenata s web sjedišta. Postupak se temelji na prikazu HTML dokumenata višedimenzionalnim vektorima te težinskom bodovanju pojedinih HTML oznaka.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb