Usporedba postupaka za zaštitu privatnosti podataka i njihov utjecaj na rezultate dubinske analize (CROSBI ID 373311)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Buratović, Ines
Miličević, Mario
Žubrinić, Krunoslav
hrvatski
Usporedba postupaka za zaštitu privatnosti podataka i njihov utjecaj na rezultate dubinske analize
Dubinska analiza podataka je proces identificiranja korisnih, zanimljivih i prethodno nepoznatih informacija iz velikih zbirki podataka. Uspjeh dubinske analize ovisi o dostupnosti kvalitetnih podataka i učinkovitih postupaka za objavljivanje informacija. Ovaj rad istražuje mogućnost objavljivanja skupa podataka o studentima Sveučilišta u Dubrovniku, kako bi se mogle raditi analize zavisnosti ishoda studiranja o čimbenicima kao što je životna sredina i uspjeh u prethodnom školovanju. Za potrebe dubinske analize, zapisi o studentima se trebaju objaviti u obliku originalnih zapisa, što narušava privatnost studenata. Zbog pravnog okvira koji uređuje javnost podataka i dostupnost informacija, potrebno je zaštititi privatnost studenata čiji se podaci nalaze u zadanom skupu. Zapisi o studentima su anonimizirani tehnikama k-anonimnosti i l- raznolikosti, gdje prva predstavlja nižu, a druga višu razinu zaštite privatnosti. Utjecaj tih tehnika na rezultate dubinske analize izmjeren je usporedbom rezultata analiza originalnih podataka s rezultatima analiza anonimiziranih podataka. Za analize korišteno je više metoda strojnog učenja dostupnih u programskom paketu Weka. U polju upotrebljivosti podataka nakon anonimizacije, mnogo bolje rezultate polučila je tehnika k- anonimnosti. Analize skupa podataka dobivenog primjenom te tehnike daju rezultate približne onima koji se dobiju analizom originalnog skupa podataka.
anonimizacija; zaštita privatnosti; k-anonimnost; l-raznolikost; dubinska analiza; strojno učenje
nije evidentirano
engleski
Comparison of techniques for the protection of privacy and their impact on data mining results
nije evidentirano
anonymization; privacy preservation; k-anonymity; l-diversity; data mining; machine learning
nije evidentirano
Podaci o izdanju
78
16.07.2012.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Sveučilište u Dubrovniku
Dubrovnik