Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 1140671

Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja


David Dukić
Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja, 2021., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb, Hrvatska


CROSBI ID: 1140671 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja
(Profiling Hate Speech Spreaders on Social Networks Using Machine Learning Methods)

Autori
David Dukić

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb, Hrvatska

Datum
29.06

Godina
2021

Stranica
46

Mentor
Sović Kržić, Ana

Ključne riječi
BERT ; društvene mreže ; fino podešavanje ; govor mržnje ; guste vektorske reprezentacije ; indikatori ; logistička regresija ; obrada prirodnog jezika ; profiliranje autora
(BERT ; social networks ; fine-tuning ; hate speech ; embeddings ; indicators ; logistic regression ; natural language processing ; author profiling)

Sažetak
Kako društvene mreže rastu, sve više i više njihovih korisnika širi govor mržnje kroz svoje objave. Uočeni fenomen često nastaje kao posljedica osjećaja lažne sigurnosti i anonimnosti u virtualnom okruženju. Da bi zaustavili širitelje govora mržnje, znanstvenici su počeli razvijati sustave strojnog učenja koji ih automatizirano detektiraju temeljem sadržaja njihovih objava. Ovaj diplomski rad opisuje nekoliko takvih novih sustava za profiliranje autora, učenih na korpusu engleskih Twitter objava, s krajnjim ciljem predviđanja širi li autor danih objava govor mržnje ili ne. Osim evaluacije isprobanih modela, detaljno je opisan i skup podataka te je nad njim provedena eksplorativna analiza. Značajke modela koji je najbolje radio nad neviđenim podacima kreirane su konkatenacijom dva tipa značajki. Prvi tip se sastojao od fino podešenih kontekstualiziranih gustih vektorskih reprezentacija izvučenih iz BERT modela koje su sumirane kroz njegovih zadnjih 12 skrivenih slojeva vezanih uz klasifikacijski token. Drugi tip su činile tri binarne varijable zvane indikatori. Binarne varijable su indicirale nalaze li se nizovi znakova rt, url ili hashtag u autorovim objavama. Klasifikator koji je postigao najveću točnost od 81% na skupu za testiranje koristeći opisane značajke bila je logistička regresija.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Projekti:
HRZZ-UIP-2017-05-5917 - Transformacija robota u edukacijsko sredstvo (TRES) (Sović Kržić, Ana, HRZZ - 2017-05) ( POIROT)

Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Ana Sović (mentor)

Avatar Url David Dukić (autor)

Poveznice na cjeloviti tekst rada:

www.fer.unizg.hr

Citiraj ovu publikaciju:

David Dukić
Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja, 2021., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb, Hrvatska
David Dukić (2021) 'Profiliranje širitelja govora mržnje na društvenim mrežama metodama strojnog učenja', diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb, Hrvatska.
@phdthesis{phdthesis, year = {2021}, pages = {46}, keywords = {BERT, dru\v{s}tvene mre\v{z}e, fino pode\v{s}avanje, govor mr\v{z}nje, guste vektorske reprezentacije, indikatori, logisti\v{c}ka regresija, obrada prirodnog jezika, profiliranje autora}, title = {Profiliranje \v{s}iritelja govora mr\v{z}nje na dru\v{s}tvenim mre\v{z}ama metodama strojnog u\v{c}enja}, keyword = {BERT, dru\v{s}tvene mre\v{z}e, fino pode\v{s}avanje, govor mr\v{z}nje, guste vektorske reprezentacije, indikatori, logisti\v{c}ka regresija, obrada prirodnog jezika, profiliranje autora}, publisherplace = {Zagreb, Hrvatska} }
@phdthesis{phdthesis, year = {2021}, pages = {46}, keywords = {BERT, social networks, fine-tuning, hate speech, embeddings, indicators, logistic regression, natural language processing, author profiling}, title = {Profiling Hate Speech Spreaders on Social Networks Using Machine Learning Methods}, keyword = {BERT, social networks, fine-tuning, hate speech, embeddings, indicators, logistic regression, natural language processing, author profiling}, publisherplace = {Zagreb, Hrvatska} }




Contrast
Increase Font
Decrease Font
Dyslexic Font