Pregled bibliografske jedinice broj: 533291
Uuključivanje hrvatskog Web sadržaja u DBpediju
Uuključivanje hrvatskog Web sadržaja u DBpediju // 14. seminar Arhivi, knjižnice, muzeji : mogućnosti suradnje u okruženju globalne informacijske infrastructure : zbornik radova / Hasenay, Damir ; Faletar Tanacković, Sanjica (ur.).
Osijek, 2011. str. 1-17 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), znanstveni)
CROSBI ID: 533291 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Uuključivanje hrvatskog Web sadržaja u DBpediju
(Inclusion of the Croatian Web Content into DBpedia)
Autori
Sarić, Ivana ; Essert, Mario
Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni
Izvornik
14. seminar Arhivi, knjižnice, muzeji : mogućnosti suradnje u okruženju globalne informacijske infrastructure : zbornik radova
/ Hasenay, Damir ; Faletar Tanacković, Sanjica - Osijek, 2011, 1-17
Skup
Seminar Arhivi, knjižnice, muzeji : mogućnosti suradnje u okruženju globalne informacijske infrastructure (14 ; 2010)
Mjesto i datum
Poreč, Hrvatska, 17.11.2010. - 19.11.2010
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Međunarodna recenzija
Ključne riječi
DBpedia; Wikipedija; semantički web; web podataka; linked data; ontologija; mapiranje; infookviri
(DBpedia; Wikipedia; semantic WEB; web of data; linked data; ontology; mappings; info-frames)
Sažetak
DBpedia projekt načinjen je u svrhu ekstrakcije strukturiranih informacija iz Wikipedije s ciljem da ih se učini dostupnim na webu. Rezultat je DBpedia - baza znanja, koja opisuje veliki broj entiteta (osobe, mjesta, glazbene radove, filmove, organizacije). Za svaki entitet DBpedia definira jedinstveni identifikator. Sve veći broj ustanova, nakladnika i pojedinaca postavlja poveznice na nju, na razini podataka, te tako DBpedia postaje središte međusobnog povezivanja rastućeg weba podataka (engl. Web of data). Wikipedijini članci sastoje se od slobodnog teksta, ali također sadrže i strukturirane informacije u formi wiki oznaka (eng. wiki markup). Takve informacije uključuju npr. infookviri, kategorije, fotografije, geo-koordinate, poveznice na vanjske stranice, poveznice između različitih jezičnih izdanja Wikipedije. Rad će ukratko prikazati DBpedia ontologiju te će objasniti njezinu ulogu u ovom projektu. Cilj rada je prikazati uključivanje izdanja hrvatske Wikipedije u projekt DBpedia. Navedeno uključivanje izvršeno je putem ekstrakcije strukturiranih informacija iz infookvira hrvatske Wikipedije. U svrhu navedenog cilja prikazat će se primjeri izvršenog postupka pridruživanja pojedinog infookvira ontologijskoj klasi, kao i pridruživanja svojstava infookvira s ontologijskim svojstvima. Rezultat ovog postupka su strukturirane informacije u RDF obliku. Prikazat će se i ekstrakcija RDF trojaca iz nestrukturiranog teksta upotrebom alata za obradbu prirodnih jezika (NLTK) razvijenih upotrebom Python programa. Na koncu će se dati pregled dobivenih rezultata.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo, Informacijske i komunikacijske znanosti
POVEZANOST RADA
Ustanove:
Fakultet strojarstva i brodogradnje, Zagreb