Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja (CROSBI ID 442663)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
David Dukić
Sović Kržić, Ana
hrvatski
Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja
Kako društvene mreže rastu, sve više i više njihovih korisnika širi govor mržnje kroz svoje objave. Uočeni fenomen često nastaje kao posljedica osjećaja lažne sigurnosti i anonimnosti u virtualnom okruženju. Da bi zaustavili širitelje govora mržnje, znanstvenici su počeli razvijati sustave strojnog učenja koji ih automatizirano detektiraju temeljem sadržaja njihovih objava. Ovaj diplomski rad opisuje nekoliko takvih novih sustava za profiliranje autora, učenih na korpusu engleskih Twitter objava, s krajnjim ciljem predviđanja širi li autor danih objava govor mržnje ili ne. Osim evaluacije isprobanih modela, detaljno je opisan i skup podataka te je nad njim provedena eksplorativna analiza. Značajke modela koji je najbolje radio nad neviđenim podacima kreirane su konkatenacijom dva tipa značajki. Prvi tip se sastojao od fino podešenih kontekstualiziranih gustih vektorskih reprezentacija izvučenih iz BERT modela koje su sumirane kroz njegovih zadnjih 12 skrivenih slojeva vezanih uz klasifikacijski token. Drugi tip su činile tri binarne varijable zvane indikatori. Binarne varijable su indicirale nalaze li se nizovi znakova rt, url ili hashtag u autorovim objavama. Klasifikator koji je postigao najveću točnost od 81% na skupu za testiranje koristeći opisane značajke bila je logistička regresija.
BERT ; društvene mreže ; fino podešavanje ; govor mržnje ; guste vektorske reprezentacije ; indikatori ; logistička regresija ; obrada prirodnog jezika ; profiliranje autora
nije evidentirano
engleski
Profiling Hate Speech Spreaders on Social Networks Using Machine Learning Methods
nije evidentirano
BERT ; social networks ; fine-tuning ; hate speech ; embeddings ; indicators ; logistic regression ; natural language processing ; author profiling
nije evidentirano
Podaci o izdanju
46
29.06.2021.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb, Hrvatska