Pregled bibliografske jedinice broj: 807400
Model za analizu sentimenta u tvitovima na hrvatskome jeziku
Model za analizu sentimenta u tvitovima na hrvatskome jeziku, 2015., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 807400 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Model za analizu sentimenta u tvitovima na hrvatskome jeziku
(Sentiment Analysis in Tweets in Croatian Language)
Autori
Dolović, Dino
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
14.07
Godina
2015
Stranica
59
Mentor
Šnajder, Jan
Neposredni voditelj
Glavaš, Goran
Ključne riječi
obrada prirodnog jezika; analiza sentimenta; analiza mišljenja; mikro-blogovi; Twitter; tvit; nadzirano strojno učenje; hrvatski jezik
(natural language processing; sentiment analysis; opinion mining; micro-blogs; Twitter; tweet; supervised machine learning; Croatian)
Sažetak
Analiza sentimenta ili mišljenja je zadatak iz područja obrade prirodnog jezika. Cilj analize sentimenta jest analizirati iznesena mišljenja i stavove korisnika u pisanim tekstovima koji se odnose na neke entitete, događaje ili teme. U okviru ovog diplomskog rada proučeni su postupci za analizu sentimenta u mikroblogovima, s naglaskom na metode temeljene na nadziranom strojnom učenju. Provedeno je označavanje određenog skupa podataka, kojeg čine tvitovi na hrvatskome jeziku, a odnose se na domenu dvaju pjevačkih emisija: The Voice te XFactorAdria. Nadalje, razvijen je model za analizu sentimenta u tvitovima temeljen na postupcima nadziranog strojnog učenja. Provedeno je iscrpno vrednovanje na odgovarajućem skupu podataka, uključujući i analizu značajki. Dobiveni rezultati usporedivi su s rezultatima dobivenim na natjecanju SemEval-2013, uz postignutu F-micro od 87%, odnosno F-macro od 71%.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb