Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi !

Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja (CROSBI ID 442663)

Ocjenski rad | diplomski rad

David Dukić Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja / Sović Kržić, Ana (mentor); Zagreb, Hrvatska, Fakultet elektrotehnike i računarstva, . 2021

Podaci o odgovornosti

David Dukić

Sović Kržić, Ana

hrvatski

Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja

Kako društvene mreže rastu, sve više i više njihovih korisnika širi govor mržnje kroz svoje objave. Uočeni fenomen često nastaje kao posljedica osjećaja lažne sigurnosti i anonimnosti u virtualnom okruženju. Da bi zaustavili širitelje govora mržnje, znanstvenici su počeli razvijati sustave strojnog učenja koji ih automatizirano detektiraju temeljem sadržaja njihovih objava. Ovaj diplomski rad opisuje nekoliko takvih novih sustava za profiliranje autora, učenih na korpusu engleskih Twitter objava, s krajnjim ciljem predviđanja širi li autor danih objava govor mržnje ili ne. Osim evaluacije isprobanih modela, detaljno je opisan i skup podataka te je nad njim provedena eksplorativna analiza. Značajke modela koji je najbolje radio nad neviđenim podacima kreirane su konkatenacijom dva tipa značajki. Prvi tip se sastojao od fino podešenih kontekstualiziranih gustih vektorskih reprezentacija izvučenih iz BERT modela koje su sumirane kroz njegovih zadnjih 12 skrivenih slojeva vezanih uz klasifikacijski token. Drugi tip su činile tri binarne varijable zvane indikatori. Binarne varijable su indicirale nalaze li se nizovi znakova rt, url ili hashtag u autorovim objavama. Klasifikator koji je postigao najveću točnost od 81% na skupu za testiranje koristeći opisane značajke bila je logistička regresija.

BERT ; društvene mreže ; fino podešavanje ; govor mržnje ; guste vektorske reprezentacije ; indikatori ; logistička regresija ; obrada prirodnog jezika ; profiliranje autora

nije evidentirano

engleski

Profiling Hate Speech Spreaders on Social Networks Using Machine Learning Methods

nije evidentirano

BERT ; social networks ; fine-tuning ; hate speech ; embeddings ; indicators ; logistic regression ; natural language processing ; author profiling

nije evidentirano

Podaci o izdanju

46

29.06.2021.

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Fakultet elektrotehnike i računarstva

Zagreb, Hrvatska

Povezanost rada

Računarstvo

Poveznice