Pregled bibliografske jedinice broj: 807403
Ekstrakcija događaja i vremenskih relacija u tekstovima na hrvatskome jeziku
Ekstrakcija događaja i vremenskih relacija u tekstovima na hrvatskome jeziku, 2012., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 807403 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Ekstrakcija događaja i vremenskih relacija u tekstovima na hrvatskome jeziku
(Event and Temporal Relation Extraction in Croatian Language Texts)
Autori
Marović, Mladen
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
29.06
Godina
2012
Stranica
69
Mentor
Šnajder, Jan
Neposredni voditelj
Glavaš, Goran
Ključne riječi
ekstrakcija informacija; obrada prirodnog jezika; događaj; vremenska relacija; klasifikacija; strojno učenje; hrvatski jezik
(information extraction; natural language processing; event; temporal relation; classification; machine learning; Croatian language)
Sažetak
Danas su dostupne goleme količine pisanoga teksta koje predstavljaju velik izvor znanja. Automatska ekstrakcija informacija iz tekstnih podataka, poput ekstrakcije događaja i vremenskih relacija među događajima omogućava iskorištavanje tog znanja u različitim područjima ljudske djelatnosti. Ekstrakcija događaja i vremenskih relacija netrivijalni su zadatci obrade prirodnog jezika i predmetom su intenzivnog istraživanja. U okviru ovog istraživanja proučeni su postupci za ekstrakciju događaja vremenskih relacija temeljeni na metodama strojnog učenja. Razrađen je postupak za ekstrakciju događaja i vremenskih relacija u tekstovima na hrvatskom jeziku. Provedeno je označavanje odgovarajućeg tekstnog uzorka i odabrane su najprikladnije značajke uzevši u obzir ograničenost jezičnotehnoloških alata za hrvatski jezik. Provedeno je eksperimentalno vrednovanje točnosti ekstrakcije uporabom različitih metoda strojnog učenja, analiza značajki i analiza pogrešaka. Dobiveni rezultati su obećavajući, uz postignutu F1-mjeru od 93% pri označavanju događaja, 77% pri označavanju semantičkih razreda događaja te 64% pri označavanju vremenskih relacija.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb