Pregled bibliografske jedinice broj: 1212024
Uporaba metoda klasifikacije rijetkih događaja kod analize mrežnih podataka
Uporaba metoda klasifikacije rijetkih događaja kod analize mrežnih podataka, 2020., diplomski rad, diplomski, Fakultet Elektrotehnike i Računarstva, Zagreb
CROSBI ID: 1212024 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Uporaba metoda klasifikacije rijetkih događaja kod analize mrežnih podataka
(Applying Rare Event Classification Methods in Network Traffic Analysis)
Autori
Luka Jurić
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet Elektrotehnike i Računarstva
Mjesto
Zagreb
Datum
07.07
Godina
2020
Stranica
45
Mentor
Pintar, Damir
Ključne riječi
Rijetki događaj ; Mrežni podaci ; Klasifikacija ; Uzorkovanje ; KDD Cup 99 ; Spark ; R
(Rare event ; Network traffic ; Classification ; Sampling ; KDD Cup 99 ; Spark ; R)
Sažetak
Mrežni podaci predstavljaju skup podataka koji se šalju mrežom, najčešće internetom. U tim mrežnim podacima koji se prenose postoje i zlonamjerni podaci zvani napadi kojima je cilj naštetiti sustavu ili korisniku. Neki od tih napada su jako rijetki u odnosu na sve poslane mrežne podatke. Kako bi se zaštitili od tih rijetkih napada potrebno je napraviti dobro otkrivanje takvih mrežnih napada. Tu dolazi do problema klasifikacije rijetkih događaja gdje su određeni napadi toliko rijetki da ih modeli strojnog učenja zanemaruju, a metrike evaluacije prikrivaju. Nakon upoznavanja s domenom podataka i odabranim skupom podataka \textit{;KDD Cup 99}; korišteno je 6 različitih metoda učenja u Spark okruženju. Korištene metode su obično učenje, PCA uz k vrijednosti 5 i 10, te metode naduzorkovanja, poduzorkovanja i hibridna metoda uzorkovanja. Iako je najbolji rezultat za obične metrike postiglo obično učenje za model slučajnih šuma, detaljnijim pregledom točnosti za pojedinu klasu vidi se kako takav model ima lošu točnost za rijetke klase. Kada se u obzir evaluacije uzela i točnost po klasama koja ne ovisi o kardinalitetu skupa, najbolji rezultati postignut je za hibridnu metodu uzorkovanja koristeći model slučajnih šuma. Taj rezultat je pokazao da je moguće poboljšati klasifikaciju rijetkih događaja zadržavajući dobre rezultate evaluacije i za česte klase.
Izvorni jezik
Hrvatski
Znanstvena područja
Elektrotehnika, Računarstvo
POVEZANOST RADA
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb
Profili:
Damir Pintar
(mentor)