Nenadzirano učenje značajki govora korištenjem neuronskih mreža baziranih na autoenkoderskim arhitekturama (CROSBI ID 422511)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Murn, Luka
Petrinović, Davor
Mijić, Igor
hrvatski
Nenadzirano učenje značajki govora korištenjem neuronskih mreža baziranih na autoenkoderskim arhitekturama
Nenadzirano učenje značajki i nižedimenzionalnih reprezentacija podataka nalazi primjene u strojnom učenju, kompresiji s gubitkom i sl. Postojeće metode poput analize osnovnih komponenata (PCA) se često baziraju na linearnim transformacijama podataka, dok su modernije metode bazirane na neuronskim mrežama bolje opremljene za prepoznavanje nelinearnih odnosa u podacima. U okviru diplomskog rada implementiran je sustav za nenadzirano učenje značajki govora korištenjem rijetke autoenkoderske arhitekture neuronskih mreža. Dodatno, evaluirana je implementacija nad klasičnim problemom afektivnog računarstva (prepoznavanje emocija), uz korištenje učenja s prijenosom značajki (engl. feature transfer learning). Diskutirana je optimalna arhitektura mreže s obzirom na aktivacijsku funkciju i broj trening epoha i uspoređeni su rezultati s GeMAPS značajkama iz openSMILE alata.
govor, glas, učenje značajki, nenadzirano učenje, neuronske mreže, autoenkoderi
nije evidentirano
engleski
Unsupervised Speech Feature Learning Using Autoencoder- Based Neural Network Architectures
nije evidentirano
speech, voice, feature learning, unsupervised learning, neural networks, autoencoders
nije evidentirano
Podaci o izdanju
44
12.07.2018.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb