Pregled bibliografske jedinice broj: 589023
Usporedba postupaka za zaštitu privatnosti podataka i njihov utjecaj na rezultate dubinske analize
Usporedba postupaka za zaštitu privatnosti podataka i njihov utjecaj na rezultate dubinske analize, 2012., diplomski rad, diplomski, Odjel za elektrotehniku i računarstvo, Dubrovnik
CROSBI ID: 589023 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Usporedba postupaka za zaštitu privatnosti podataka i njihov utjecaj na rezultate dubinske analize
(Comparison of techniques for the protection of privacy and their impact on data mining results)
Autori
Buratović, Ines
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Odjel za elektrotehniku i računarstvo
Mjesto
Dubrovnik
Datum
16.07
Godina
2012
Stranica
78
Mentor
Miličević, Mario
Neposredni voditelj
Žubrinić, Krunoslav
Ključne riječi
anonimizacija; zaštita privatnosti; k-anonimnost; l-raznolikost; dubinska analiza; strojno učenje
(anonymization; privacy preservation; k-anonymity; l-diversity; data mining; machine learning)
Sažetak
Dubinska analiza podataka je proces identificiranja korisnih, zanimljivih i prethodno nepoznatih informacija iz velikih zbirki podataka. Uspjeh dubinske analize ovisi o dostupnosti kvalitetnih podataka i učinkovitih postupaka za objavljivanje informacija. Ovaj rad istražuje mogućnost objavljivanja skupa podataka o studentima Sveučilišta u Dubrovniku, kako bi se mogle raditi analize zavisnosti ishoda studiranja o čimbenicima kao što je životna sredina i uspjeh u prethodnom školovanju. Za potrebe dubinske analize, zapisi o studentima se trebaju objaviti u obliku originalnih zapisa, što narušava privatnost studenata. Zbog pravnog okvira koji uređuje javnost podataka i dostupnost informacija, potrebno je zaštititi privatnost studenata čiji se podaci nalaze u zadanom skupu. Zapisi o studentima su anonimizirani tehnikama k-anonimnosti i l- raznolikosti, gdje prva predstavlja nižu, a druga višu razinu zaštite privatnosti. Utjecaj tih tehnika na rezultate dubinske analize izmjeren je usporedbom rezultata analiza originalnih podataka s rezultatima analiza anonimiziranih podataka. Za analize korišteno je više metoda strojnog učenja dostupnih u programskom paketu Weka. U polju upotrebljivosti podataka nakon anonimizacije, mnogo bolje rezultate polučila je tehnika k- anonimnosti. Analize skupa podataka dobivenog primjenom te tehnike daju rezultate približne onima koji se dobiju analizom originalnog skupa podataka.
Izvorni jezik
Hrvatski
Znanstvena područja
Elektrotehnika, Računarstvo
POVEZANOST RADA
Projekti:
275-0000000-3260 - Integralna kvaliteta usluge komunikacijskih i informacijskih sustava (Lipovac, Vladimir, MZO ) ( CroRIS)
Ustanove:
Sveučilište u Dubrovniku