Pregled bibliografske jedinice broj: 768728
Dinamičko prepoznavanje dijelova web stranica
Dinamičko prepoznavanje dijelova web stranica, 2015., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 768728 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Dinamičko prepoznavanje dijelova web stranica
(Dynamic identification of web page parts)
Autori
Tenodi, Tomislav
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
07.07
Godina
2015
Stranica
79
Mentor
Fertalj, Krešimir
Ključne riječi
Prepoznavanje semantičkih dijelova; Web; Strojno učenje; Semantički Web
(Recognition of semantic parts; Web; Machine learning; Semantic Web)
Sažetak
Web, s gotovo milijardu stranica, predstavlja današnji glavni izvor podataka. Semantički web ili standardi, kao Schema.org omogućuju programerima stranica da naprave svoje stranice dostupne bez ljudskog utjecaja. No, programeri često ne dijele interes za tim konceptima. Prednost i novitet koju dinamički model prepoznavanja semantičkih dijelova web stranica, napravljen ovim radom, donosi sastoji se u mogućnosti dohvaćanja stranica sa semantičkom organizacijom bez nužne ovisnosti o programerima. S druge strane, model je fleksibilan i može iskoristiti prednosti metapodataka semantičkog weba i metapodataka standarda Schema.org te tako predstavlja univerzalnu početnu točku za semantičkom segmentacijom web stranica. Osim dinamičkog modela, napravljena je označna ekstenzija i poslužitelj. Označna ekstenzija, napravljena kao Google Chrome ekstenzija, omogućava označivačima diljem svijeta da označuju stranice, a zatim ih pošalju na poslužitelj. Poslužitelj, osim pohranjivanja označenih stranica, služi za prezentaciju i dokumentaciju sveukupnog koncepta, perzistenciju modela i sadrži komponentu za provjeru kvalitete označenih stranica. Poslužitelj također pruža API putem kojeg se može pristupiti dinamičkom modelu i preko kojeg se dobiva semantički segmentirana web stranica. Sve tri opisane komponente s budućim Oculi agentima, koji će koristiti API na poslužitelju, čine sustav Oculi. Namjena sustava Oculi je približiti web svim korisnicima i dati svim statičkim komponentama stranica semantičku vrijednost.
Izvorni jezik
Hrvatski