Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 1212024

Uporaba metoda klasifikacije rijetkih događaja kod analize mrežnih podataka


Luka Jurić
Uporaba metoda klasifikacije rijetkih događaja kod analize mrežnih podataka, 2020., diplomski rad, diplomski, Fakultet Elektrotehnike i Računarstva, Zagreb


CROSBI ID: 1212024 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Uporaba metoda klasifikacije rijetkih događaja kod analize mrežnih podataka
(Applying Rare Event Classification Methods in Network Traffic Analysis)

Autori
Luka Jurić

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski

Fakultet
Fakultet Elektrotehnike i Računarstva

Mjesto
Zagreb

Datum
07.07

Godina
2020

Stranica
45

Mentor
Pintar, Damir

Ključne riječi
Rijetki događaj ; Mrežni podaci ; Klasifikacija ; Uzorkovanje ; KDD Cup 99 ; Spark ; R
(Rare event ; Network traffic ; Classification ; Sampling ; KDD Cup 99 ; Spark ; R)

Sažetak
Mrežni podaci predstavljaju skup podataka koji se šalju mrežom, najčešće internetom. U tim mrežnim podacima koji se prenose postoje i zlonamjerni podaci zvani napadi kojima je cilj naštetiti sustavu ili korisniku. Neki od tih napada su jako rijetki u odnosu na sve poslane mrežne podatke. Kako bi se zaštitili od tih rijetkih napada potrebno je napraviti dobro otkrivanje takvih mrežnih napada. Tu dolazi do problema klasifikacije rijetkih događaja gdje su određeni napadi toliko rijetki da ih modeli strojnog učenja zanemaruju, a metrike evaluacije prikrivaju. Nakon upoznavanja s domenom podataka i odabranim skupom podataka \textit{;KDD Cup 99}; korišteno je 6 različitih metoda učenja u Spark okruženju. Korištene metode su obično učenje, PCA uz k vrijednosti 5 i 10, te metode naduzorkovanja, poduzorkovanja i hibridna metoda uzorkovanja. Iako je najbolji rezultat za obične metrike postiglo obično učenje za model slučajnih šuma, detaljnijim pregledom točnosti za pojedinu klasu vidi se kako takav model ima lošu točnost za rijetke klase. Kada se u obzir evaluacije uzela i točnost po klasama koja ne ovisi o kardinalitetu skupa, najbolji rezultati postignut je za hibridnu metodu uzorkovanja koristeći model slučajnih šuma. Taj rezultat je pokazao da je moguće poboljšati klasifikaciju rijetkih događaja zadržavajući dobre rezultate evaluacije i za česte klase.

Izvorni jezik
Hrvatski

Znanstvena područja
Elektrotehnika, Računarstvo



POVEZANOST RADA


Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Damir Pintar (mentor)


Citiraj ovu publikaciju:

Luka Jurić
Uporaba metoda klasifikacije rijetkih događaja kod analize mrežnih podataka, 2020., diplomski rad, diplomski, Fakultet Elektrotehnike i Računarstva, Zagreb
Luka Jurić (2020) 'Uporaba metoda klasifikacije rijetkih događaja kod analize mrežnih podataka', diplomski rad, diplomski, Fakultet Elektrotehnike i Računarstva, Zagreb.
@phdthesis{phdthesis, year = {2020}, pages = {45}, keywords = {Rijetki doga\djaj, Mre\v{z}ni podaci, Klasifikacija, Uzorkovanje, KDD Cup 99, Spark, R}, title = {Uporaba metoda klasifikacije rijetkih doga\djaja kod analize mre\v{z}nih podataka}, keyword = {Rijetki doga\djaj, Mre\v{z}ni podaci, Klasifikacija, Uzorkovanje, KDD Cup 99, Spark, R}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, year = {2020}, pages = {45}, keywords = {Rare event, Network traffic, Classification, Sampling, KDD Cup 99, Spark, R}, title = {Applying Rare Event Classification Methods in Network Traffic Analysis}, keyword = {Rare event, Network traffic, Classification, Sampling, KDD Cup 99, Spark, R}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font