Pregled bibliografske jedinice broj: 564125
Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja
Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja, 2011., magistarski rad, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 564125 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja
(Identification of persons and business subjects in text documents based on lexical analysis and scoring system)
Autori
Lončar, Goran
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, magistarski rad
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
07.12
Godina
2011
Stranica
87
Mentor
Bogunović, Nikola
Neposredni voditelj
Bogunović, Nikola
Ključne riječi
dubinska analiza teksta; leksička analiza; identifikacija osoba; identifikacija poslovnih subjekata
(text mining; lexical analysis; identification of persons; identification of business subjects)
Sažetak
Sve veći broj medija prisutan je na Internetu, a time se povećava i količina podataka koja nam je dostupna. Poslovnim korisnicima najzanimljiviji su mediji koji objavljuju informacije vezane uz njihovo poslovno okruženje te informacije koje bi im mogle pomoći u njihovom poslovanju. U ogromnoj količini vijesti i podataka koja se svaki dan objavljuje sve je teže i sporije pronaći informacije korisne poslovnim korisnicima. Sustav koji bi identificirao poslovne subjekte i osobe u vijestima omogućio bi izradu proizvoda koji bi poslovnim korisnicima olakšali pronalaženje točne informacije. U ovom magistarskom radu predstavljen je sustav koji na temelju leksičke analize tekstnog dokumenta i posebno osmišljenog sustava bodovanja omogućava označavanje i identifikaciju subjekata i osoba. U radu su analizirani problemi prepoznavanja naziva i identifikacije te unapređenjem postojećih istraživanja na tom području ponuđena su rješenja. Sustav je primijenjen na vijesti Internet izdanja poslovnih dnevnika i tjednika te je postignuta F-mjera identifikacije 86%.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-0362980-1921 - Računalne okoline za sveprisutne raspodijeljene sustave (Srbljić, Siniša, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb