Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi !

Automatizacija procesa konstruiranja domenske ontologije iz polustrukturiranih dokumenata (CROSBI ID 365791)

Ocjenski rad | doktorska disertacija

Jurić, Damir Automatizacija procesa konstruiranja domenske ontologije iz polustrukturiranih dokumenata / Banek, Marko (mentor); Zagreb, Fakultet elektrotehnike i računarstva, . 2011

Podaci o odgovornosti

Jurić, Damir

Banek, Marko

hrvatski

Automatizacija procesa konstruiranja domenske ontologije iz polustrukturiranih dokumenata

U disertaciji je razvijena metoda za konstruiranje domenske ontologije iz enciklopedijskog teksta. Metoda koristi enciklopediju Wikipediju jer ta enciklopedija predstavlja iscpan i djelomično strukturiran izvor koji je javno dostupan. Prema razvijenoj metodi najprije se izvodi algoritam za ekstrakciju pojmova koji će izgrađivati buduću domensku ontologiju iz članaka Wikipedije. Članci prolaze proces čišćenja i pripreme za obradu teksta te se konstruira njihov sažeti formalni zapis članka. Ekstrahiraju se rečenične strukture koje osim subjekta, predikata i objekta sadrže i objekte prijedložnih oznaka (struktura n‐arnog tipa). Relacije dobivene iz ovog postupka se generaliziraju algoritmom za ekstrakciju hijerarhijskih relacija iz članaka Wikipedije i WordNeta razvijenim za potrebe ove disertacije. U disertaciji je riješen i problem konzistentnog imenovanja relacija. Iskorišteni su semantički resursi poput baze glagola i baze značenja prijedloga da bi se za različite relacije koje postoje između događaja i aktera koji sudjeluju u događajima pronašli uniformni nazivi. Definiran je način zapisivanja ekstrahiranih n‐arnih relacija u standardni jezik za zapisivanje ontologija. Na kraju disertacije izvršena je evaluacija te je pokazano da je točnost ove metode usporediva s drugim metodama, koje su međutim po opsegu i specifičnosti ekstrahiranog znanja slabije.

konstruiranje ontologija; domenske ontologije; ekstrakcija relacija; ekstrakcija taksonomije; enciklopedija Wikipedija; jezik OWL

nije evidentirano

engleski

Automating process of domain ontology construction from semistructured documents

nije evidentirano

ontology construction; domain ontologies; relation extraction; taxonomy extraction; Wikipedia; OWL

nije evidentirano

Podaci o izdanju

158

28.02.2011.

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Fakultet elektrotehnike i računarstva

Zagreb

Povezanost rada

Elektrotehnika, Računarstvo