Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja

David Dukić

izvor podataka: crosbi !

Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja (CROSBI ID 442663)

Ocjenski rad | diplomski rad

David Dukić Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja / Sović Kržić, Ana (mentor); Zagreb, Hrvatska, Fakultet elektrotehnike i računarstva, . 2021

Podaci o odgovornosti

Autori

David Dukić

Mentori

Sović Kržić, Ana

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

hrvatski

Naslov

Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja

Sažetak

Kako društvene mreže rastu, sve više i više njihovih korisnika širi govor mržnje kroz svoje objave. Uočeni fenomen često nastaje kao posljedica osjećaja lažne sigurnosti i anonimnosti u virtualnom okruženju. Da bi zaustavili širitelje govora mržnje, znanstvenici su počeli razvijati sustave strojnog učenja koji ih automatizirano detektiraju temeljem sadržaja njihovih objava. Ovaj diplomski rad opisuje nekoliko takvih novih sustava za profiliranje autora, učenih na korpusu engleskih Twitter objava, s krajnjim ciljem predviđanja širi li autor danih objava govor mržnje ili ne. Osim evaluacije isprobanih modela, detaljno je opisan i skup podataka te je nad njim provedena eksplorativna analiza. Značajke modela koji je najbolje radio nad neviđenim podacima kreirane su konkatenacijom dva tipa značajki. Prvi tip se sastojao od fino podešenih kontekstualiziranih gustih vektorskih reprezentacija izvučenih iz BERT modela koje su sumirane kroz njegovih zadnjih 12 skrivenih slojeva vezanih uz klasifikacijski token. Drugi tip su činile tri binarne varijable zvane indikatori. Binarne varijable su indicirale nalaze li se nizovi znakova rt, url ili hashtag u autorovim objavama. Klasifikator koji je postigao najveću točnost od 81% na skupu za testiranje koristeći opisane značajke bila je logistička regresija.

Ključne riječi

BERT ; društvene mreže ; fino podešavanje ; govor mržnje ; guste vektorske reprezentacije ; indikatori ; logistička regresija ; obrada prirodnog jezika ; profiliranje autora

Napomena

nije evidentirano

Jezik

engleski

Naslov

Profiling Hate Speech Spreaders on Social Networks Using Machine Learning Methods

Sažetak

nije evidentirano

Ključne riječi

BERT ; social networks ; fine-tuning ; hate speech ; embeddings ; indicators ; logistic regression ; natural language processing ; author profiling

Napomena

nije evidentirano

Podaci o izdanju

Broj stranica

Datum obrane

29.06.2021.

Status objave rada

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Ustanova / Organizacija

Fakultet elektrotehnike i računarstva

Mjesto

Zagreb, Hrvatska

Povezanost rada

Povezane osobe

David Dukić (autor/i)

Ana Sović Kržić (mentor/i)

Povezane ustanove

Fakultet elektrotehnike i računarstva (036) (autorova ustanova)

Povezani projekti

Transformacija robota u edukacijsko sredstvo (rezultat rada na projektu)

Područje

Računarstvo

Poveznice

fer.unizg.hr