Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 564125

Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja


Lončar, Goran
Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja, 2011., magistarski rad, Fakultet elektrotehnike i računarstva, Zagreb


CROSBI ID: 564125 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja
(Identification of persons and business subjects in text documents based on lexical analysis and scoring system)

Autori
Lončar, Goran

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, magistarski rad

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
07.12

Godina
2011

Stranica
87

Mentor
Bogunović, Nikola

Neposredni voditelj
Bogunović, Nikola

Ključne riječi
dubinska analiza teksta; leksička analiza; identifikacija osoba; identifikacija poslovnih subjekata
(text mining; lexical analysis; identification of persons; identification of business subjects)

Sažetak
Sve veći broj medija prisutan je na Internetu, a time se povećava i količina podataka koja nam je dostupna. Poslovnim korisnicima najzanimljiviji su mediji koji objavljuju informacije vezane uz njihovo poslovno okruženje te informacije koje bi im mogle pomoći u njihovom poslovanju. U ogromnoj količini vijesti i podataka koja se svaki dan objavljuje sve je teže i sporije pronaći informacije korisne poslovnim korisnicima. Sustav koji bi identificirao poslovne subjekte i osobe u vijestima omogućio bi izradu proizvoda koji bi poslovnim korisnicima olakšali pronalaženje točne informacije. U ovom magistarskom radu predstavljen je sustav koji na temelju leksičke analize tekstnog dokumenta i posebno osmišljenog sustava bodovanja omogućava označavanje i identifikaciju subjekata i osoba. U radu su analizirani problemi prepoznavanja naziva i identifikacije te unapređenjem postojećih istraživanja na tom području ponuđena su rješenja. Sustav je primijenjen na vijesti Internet izdanja poslovnih dnevnika i tjednika te je postignuta F-mjera identifikacije 86%.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Projekti:
036-0362980-1921 - Računalne okoline za sveprisutne raspodijeljene sustave (Srbljić, Siniša, MZO ) ( CroRIS)

Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Nikola Bogunović (mentor)

Avatar Url Goran Lončar (autor)


Citiraj ovu publikaciju:

Lončar, Goran
Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja, 2011., magistarski rad, Fakultet elektrotehnike i računarstva, Zagreb
Lončar, G. (2011) 'Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja', magistarski rad, Fakultet elektrotehnike i računarstva, Zagreb.
@phdthesis{phdthesis, author = {Lon\v{c}ar, Goran}, year = {2011}, pages = {87}, keywords = {dubinska analiza teksta, leksi\v{c}ka analiza, identifikacija osoba, identifikacija poslovnih subjekata}, title = {Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksi\v{c}ke analize i sustava bodovanja}, keyword = {dubinska analiza teksta, leksi\v{c}ka analiza, identifikacija osoba, identifikacija poslovnih subjekata}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Lon\v{c}ar, Goran}, year = {2011}, pages = {87}, keywords = {text mining, lexical analysis, identification of persons, identification of business subjects}, title = {Identification of persons and business subjects in text documents based on lexical analysis and scoring system}, keyword = {text mining, lexical analysis, identification of persons, identification of business subjects}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font