Pregled bibliografske jedinice broj: 1215718
Analiza sentimenta u hrvatskim tvitovima na temu potresa
Analiza sentimenta u hrvatskim tvitovima na temu potresa, 2022., diplomski rad, diplomski, Filozofski fakultet, Zagreb
CROSBI ID: 1215718 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Analiza sentimenta u hrvatskim tvitovima na temu
potresa
(Sentiment Analysis in Croatian Tweets About
Earthquakes)
Autori
Blazsetin, Danijel
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Filozofski fakultet
Mjesto
Zagreb
Datum
13.06
Godina
2022
Stranica
55
Mentor
Bago, Petra
Ključne riječi
analiza sentimenta ; neuronske mreže ; izrada korpusa ; tvit ; potres
(sentiment analysis ; neural networks ; corpus building ; tweet ; earthquake)
Sažetak
Analiza sentimenta područje je koje je sve popularnije među istraživačima koji se bave obradom prirodnoga jezika. Ovo područje objedinjuje psihologiju, sociologiju, antropologiju, lingvistiku i računalnu tehnologiju te zahtijeva interdisciplinarni pristup. Zainteresiranost umjetnom inteligencijom i dubokim učenjem koje se može uočiti u svim granama računarstva nije zaobišla ni područje analize sentimenta. Međutim, alati izrađeni za analizu sentimenta u hrvatskome jeziku većinom su izrađeni koristeći tradicionalne i danas već zastarjele metode. U ovome se radu prikazuje postupak izrade alata za analizu sentimenta koji se temelji na suvremenijim metodama, na neuronskim mrežama. U prvome dijelu rada opisana su teorijska polazišta analize sentimenta i strojnoga učenja. Potom se opisuje izrada specijaliziranoga anotiranoga Twitter korpusa na temu potresa. Korpus je anotiralo dvoje autora te kao takav pruža dobar uvid u problematiku same jezične građe. Najčešće poteškoće koje se javljaju pri izradi ovakvoga jezičnoga resursa opisuju se u kratkoj diskusiji. U zadnjem se dijelu rada opisuje izrada alata za analizu sentimenta temeljen na rekurentnim neuronskim mrežama i treniran na već spomenutom korpusu. Rezultati se alata kontekstualiziraju s jedne strane u odnosu na slične radove, a s druge strane u odnosu na međuanotatorsku pouzdanost koja se računala za Twitter korpusa.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti